Google использует передовые технологии OCR для точного извлечения текста из изображений, включая низкокачественные фото с мобильных устройств. Система применяет масштабирование (Super-resolution), многоуровневый анализ (Multi-scale OCR) и контекстно-зависимые языковые модели (например, …
Разборы патентов
Google использует систему для сбора отзывов из интернета, их автоматической кластеризации по продуктам и предоставления пользователям агрегированной информации. Ключевая особенность — интерфейс, позволяющий искать по тексту отзывов только для выбранного …
Патент описывает механизм бесшовного визуального поиска прямо в браузере. Пользователь может выделить любую область на веб-странице (изображение, часть видео), которая автоматически фиксируется как изображение и отправляется в качестве поискового запроса. …
Google использует технологию "отпечатков контента" для идентификации того, что пользователь смотрит или слушает на первом устройстве. Система автоматически генерирует связанный поисковый запрос и отправляет на второе устройство "динамические текущие результаты". …
Google использует адаптивную систему управления сканированием. Если краулер не успевает обработать все запланированные URL (отстает от графика), система динамически меняет приоритеты. Вместо хронологического порядка приоритет отдается наиболее важным страницам (на …
Google использует анализ временных меток документов для определения "запросов, ищущих свежесть" (QDF). Система строит временную шкалу публикаций по теме и ищет резкие всплески (события). Если обнаружен значительный недавний всплеск, система …
Google использует технологию для анализа видеоконтента, автоматического обнаружения и распознавания лиц. Система создает "закладки" (временные метки), указывающие, когда конкретный человек появляется и исчезает из кадра. Для идентификации используются данные социального …
Google использует двухфазную систему для построения Knowledge Graph. На первом этапе данные из разных источников (например, Wikipedia, базы данных фильмов, музыкальные каталоги) нормализуются, а сущностям присваиваются глобальные идентификаторы. На втором …
Яндекс патентует инфраструктурный метод оптимизации хранения и поиска документов. Система обучает нейросеть генерировать семантические векторы (эмбеддинги) так, чтобы их близость отражала релевантность. Документы с похожими векторами группируются в кластеры (шарды). …
Google анализирует текст запроса, введенного в интерфейсе Карт, на наличие синтаксических индикаторов (запятые, заглавные буквы, названия улиц), чтобы определить, ищет ли пользователь конкретное место или общую категорию. Если запрос классифицируется …
Google использует систему для анализа паттернов активности (например, в социальных сетях), связанных с веб-страницей, чтобы классифицировать ее как «Динамическую» или «Статическую». Эта классификация определяет приоритеты ранжирования: для динамических страниц важна …
Патент Google описывает систему для автоматической идентификации и группировки видео, загруженных разными пользователями, которые фиксируют одно и то же реальное событие. Система анализирует метаданные (время, местоположение, направление съемки) и содержимое …
Google проверяет автоматически сгенерированные теги изображений, основанные на местоположении (GPS). Система использует распознавание изображений (Computer Vision), чтобы определить, что на самом деле изображено на фотографии, и сравнивает это с тегами, …
Яндекс патентует метод предобработки текста BPE-Dropout для обучения NLP-моделей. Вместо стандартной детерминированной токенизации (BPE), система случайным образом пропускает некоторые шаги объединения символов в токены во время обучения. Это создает разные …
Google использует адаптивную систему планирования повторного сканирования. Система оценивает, как часто меняется документ (Change Period) и насколько он важен (Importance Rank, например, PageRank). На основе этих данных рассчитывается оптимальная частота …
Яндекс патентует клиентский метод управления отображением точек интереса (POI) на картах. Система определяет правила отрисовки: топовые результаты получают визуально значимые, детализированные метки, а остальные — упрощенные. При перемещении карты система …
Google повышает точность поиска по картинкам для запросов, указывающих ракурс (например, «вид сбоку»). Система генерирует более широкий запрос (например, «автомобиль вид сбоку») и использует эти результаты как эталонный набор. Это …
Google ускоряет локальный поиск по радиусу, индексируя документы (например, бизнес-листинги) не только по их точному местоположению, но и по всем окружающим географическим областям в пределах заданного диапазона. Это позволяет системе …
Google персонализирует локальные результаты поиска, используя социальный граф пользователя. Если контакты пользователя оставляли отзывы, оценки или загружали фото о бизнесе (сущности), эти сущности повышаются в персональной выдаче. Система также ранжирует …
Google может оптимизировать размер и скорость своего индекса, анализируя, какие части документа использовались для ответа на запросы пользователей. Части, которые редко используются, удаляются из индекса, а сохраняются только наиболее востребованные …

