Яндекс патентует метод разрешения лексической многозначности (Word Sense Disambiguation), не требующий размеченных вручную корпусов. Система находит многозначное слово (омоним) и анализирует его грамматический контекст. Затем она ищет однозначное слово в …
Разборы патентов
Google использует данные окружающей среды (фоновый звук, изображения), полученные с мобильного устройства одновременно с голосовым запросом, чтобы понять контекст. Если пользователь спрашивает "Кто режиссер этого шоу?", система идентифицирует шоу по …
Патент Google описывает инфраструктурный механизм для масштабирования понимания запросов на разные языки. Система берет существующий паттерн запроса на одном языке (например, английское «{что} near {где}»), находит реальные запросы, соответствующие этому …
Система Google для автоматической контекстуализации запросов во время просмотра мультимедиа. Google индексирует сущности (людей, объекты) и точное время их появления в контенте. Когда пользователь задает расплывчатый вопрос (например, «Кто это?»), …
Google разработал систему для индексации и поиска 3D-моделей. Система может автоматически аннотировать части объектов (например, определять «объектив» на камере), изучая их форму и расположение. Это позволяет искать 3D-объекты, используя изображения …
Google может заменять стандартные поисковые подсказки интерактивными шаблонами, когда распознает намерение пользователя выполнить конкретную задачу (например, конвертацию величин, перевод, поиск авиабилетов). Эти шаблоны содержат редактируемые поля (выпадающие списки, поля ввода), …
Google анализирует текст (например, электронные письма) для идентификации медиа-сущностей (фильмов, книг, музыки). Система автоматически отображает связанный контент, ссылки для покупки и персонализированную информацию, включая активность социальных связей пользователя. Это демонстрирует …
Google использует автоматический анализ изображений (например, Street View и фото пользователей) для создания Геосемантического индекса. Этот индекс каталогизирует физические особенности мест (скамейки, деревья, игровые площадки) и связывает их с активностями …
Google использует механизм машинного обучения для решения проблемы несогласованности данных в фидах мерчантов. Система анализирует пары товарных предложений с одинаковыми идентификаторами (GTIN, MPN), но разными названиями брендов. Путем расчета метрик …
Этот патент Google описывает инфраструктурную технологию для экстремально быстрого поиска по векторному сходству (Maximum Inner Product Search). Используя иерархическое квантование (комбинацию VQ и PQ) и оптимизацию на уровне CPU, Google …
Google использует систему для анализа и разделения составных слов (компаундов), часто встречающихся в таких языках, как немецкий. Система генерирует различные варианты разделения слова, применяет морфологические изменения и оценивает их, используя …
Google использует систему автоматического мониторинга для оценки качества результатов поиска и рекламы. Система строит статистические модели (Time Series Models) на основе исторических данных о поведении пользователей (например, CTR на позиции …
Google использует систему обработки структурированных фидов данных (например, от ритейлеров или стриминговых сервисов) для точного сопоставления их инвентаря с конкретными сущностями в Knowledge Graph. Это позволяет генерировать пары «сущность-действие» (например, …
Яндекс патентует математический метод для оценки результатов A/B тестов. Метод "линеаризации" преобразует сложные поведенческие метрики-отношения (например, клики на запрос) в более простую линейную форму. Это позволяет быстрее, точнее и с …
Google использует мультимодальную систему для идентификации продуктов в контенте (например, видео). Система анализирует метаданные (заголовок, описание, субтитры) и визуальные данные (кадры видео) с помощью отдельных моделей. Затем Fusion Model объединяет …
Google использует систему для преобразования неструктурированного контента веб-страниц в структурированные данные. Система обучается на примерах, размеченных вручную, для создания обобщенных структурных шаблонов (Template Trees), учитывающих повторяющиеся или опциональные элементы. Затем …
Патент Google описывает, как голосовые ассистенты на устройствах с экраном (смартфоны, смарт-дисплеи) определяют, предназначена ли им последующая фраза, даже если пользователь не произнес активационное слово ("Ok Google"). Система анализирует, связана …
Google использует систему для отображения прямых трансляций (Live Events) в результатах поиска. Система предварительно фильтрует трансляции, рассчитывая Quality Score на основе авторитетности организатора (Organizer Score), популярности связанных сущностей (Entity Score) …
Патент описывает инфраструктурный механизм оптимизации нагрузки на серверы баз данных (Datastore Servers). Если запрос требует операций, для которых нет подходящих индексов, сервер выполняет только эффективную (поддерживаемую) часть запроса. Он возвращает …
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые …

