Автор: Виктор Репин

Яндекс патентует вероятностную модель для определения времени создания веб-страниц путем анализа структуры ссылок. Система максимизирует вероятность наблюдаемой сети ссылок, исходя из предположения, что вероятность ссылки экспоненциально зависит от разницы в возрасте между страницами и качества целевой страницы. Это позволяет Яндексу определять даты, даже если временные метки отсутствуют или сфальсифицированы, используя иерархию доверия к источникам (URL, Заголовки).

Google может идентифицировать акцент пользователя при голосовом запросе и использовать эту информацию для влияния на выбор и ранжирование результатов. Система адаптирует выдачу, основываясь на предпочтениях, которые демонстрируют пользователи с аналогичным акцентом, и обновляет «Оценки акцента» (Accent Scores) для ресурсов на основе кликов.

Google патентует технологию отображения интерактивных мини-приложений (Subsidiary Applications) от сторонних поставщиков прямо в результатах поиска или интерфейсе Ассистента. Система позволяет пользователям выполнять действия (например, бронировать, заказывать) без установки полных приложений. Ключевая особенность — превентивная адаптация интерфейса этих мини-приложений на основе контекста пользователя, предыдущих запросов или данных аккаунта для ускорения выполнения задач.

Google анализирует логи поиска, чтобы определить географический масштаб (Catchment Area) запроса. Система сравнивает местоположение пользователя (Origin Location) с местоположением контента, на который он кликает или который упоминает в запросе (Content Location). Это позволяет понять, относится ли интент запроса к уровню города, региона или страны, и использовать эти данные для автоматической локализации поисковой выдачи.

Google использует механизм для динамической настройки Панели Знаний. Система анализирует не только главную сущность в запросе, но и дополнительные контекстные термины. На основе этого контекста система переранжировывает факты и контент внутри панели, выделяет наиболее релевантную информацию и меняет порядок блоков, чтобы точнее ответить на интент пользователя.

Google использует систему для автоматического создания коллекций (групп) сущностей в Knowledge Graph. Система анализирует популярные поисковые запросы и категории из краудсорсинговых источников (например, Wikipedia), чтобы найти связанные сущности. Затем она определяет общие атрибуты этих сущностей в графе и использует метрику Information Gain для создания точных правил членства. Это позволяет масштабировать категоризацию сущностей и улучшать понимание контента.

Google анализирует сущности (entities), распознанные в поисковом запросе, и определяет, к каким «коллекциям» (группам связанных сущностей) они принадлежат. Оценивая характеристики этих коллекций, система вычисляет вероятность коммерческого намерения пользователя. Этот механизм используется для разрешения неоднозначностей и принятия решения о показе релевантного коммерческого контента.

Google использует систему для понимания того, что именно изображено на картинке, связывая ее с конкретной семантической сущностью (например, статьей в Wikipedia или Freebase). Это позволяет устранить неоднозначность (понимать разницу между «Ягуаром» машиной и животным) и предоставлять более точные результаты при поиске по изображению (например, в Google Lens).

Google использует механизм для интерпретации неявных запросов (например, «часы работы» или «меню»), основанный на точном местоположении пользователя. Система определяет ближайшие организации, понимает, к какому типу бизнеса относится запрос, и переписывает его, добавляя название наиболее подходящей организации (например, «меню [Название ресторана]»), используя популярность и рейтинги для выбора лучшего варианта среди конкурентов.

Google использует систему автоматизированного понимания текста для решения двух задач. Во-первых, она определяет сходства и различия между сущностями (например, продуктами) на основе их атрибутов и сравнительных сигналов в тексте. Во-вторых, система оценивает вероятность того, что субъект может выполнить описанное действие, сравнивая его со статистической моделью «реальности», построенной на корпусе эталонных текстов, что позволяет выявлять неправдоподобные утверждения.

Google генерирует поисковые подсказки, используя шаблоны, полученные из общих паттернов запросов (например, «рестораны в [городе]»). Этот патент подробно описывает, как Google выбирает, какую сущность (например, конкретный город или бренд) вставить в шаблон, отдавая приоритет персонализации на основе текущего местоположения пользователя, истории поиска и личных документов, а также общей популярности сущности.

Google использует библиографические данные (название, актеры, длина) для поиска и идентификации конкретных видео на веб-страницах. Система анализирует текст, расположенный рядом с видеоплеером («associated text»), и вычисляет «оценку совпадения» (Occurrence Score), чтобы точно понять, какой именно фильм, клип или эпизод представлен на странице.

Google использует систему для автоматического поиска и извлечения определений из веб-страниц (глоссариев). Система анализирует HTML-структуру, в частности списки определений (теги

,

,
), для разделения термина и его значения. Извлеченные определения ранжируются на основе авторитетности (PageRank) исходного документа и могут быть показаны в результатах поиска (например, в Featured Snippets).

Google использует сложные модели машинного обучения для анализа видеоконтента кадр за кадром. Система определяет, какие сущности (объекты, концепции) присутствуют в кадре, и вычисляет вероятность того, насколько они являются центральной темой этого момента видео. Эти аннотации используются для ранжирования видео и выбора ключевых моментов для показа в поиске.

Система для Smart TV, которая анализирует текущую телепрограмму (используя EPG, субтитры или распознавание контента) для генерации релевантных поисковых подсказок. Система одновременно показывает подсказки и предварительные результаты поиска (включая веб-страницы, приложения и видео) в виде оверлея поверх воспроизводимого контента.

Google использует систему для оценки того, насколько категория (например, «рестораны») релевантна для конкретного местоположения, основываясь на плотности и близости соответствующих бизнесов. Чтобы ускорить этот процесс, система заранее рассчитывает точные оценки и математические коэффициенты (Taylor coefficients) для ключевых локаций, а затем использует Ряд Тейлора для мгновенной аппроксимации оценок в любых других точках на карте. Это ускоряет ранжирование локальной выдачи, рекламы и поисковых подсказок.

Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику «Fake Skip» (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.

Google использует механизм для идентификации пользователей, владеющих несколькими языками, анализируя язык текущего запроса, местоположение пользователя и историю его активности. Если пользователь находится в регионе с доминирующим языком (L2), но ищет на другом языке (L1), и система подтверждает владение обоими, Google переводит запрос на L2 и ищет контент на обоих языках. Это позволяет показывать наиболее релевантные результаты, даже если их язык отличается от языка запроса.

Google анализирует поведение пользователя во время поисковой сессии (клики, время на сайте, последующие запросы), чтобы определить уровень удовлетворенности. Если система фиксирует признаки неудовлетворенности (например, много коротких кликов или серия уточняющих запросов), она автоматически запускает «корректирующие операции»: предлагает альтернативные запросы, ключевые слова из просмотренных страниц или запрашивает обратную связь.

Патент Google, описывающий интерфейс для Поиска по картинкам, где связанные запросы сопровождаются превью-изображениями. Система позволяет пользователям отклонять нерелевантные предложения (Dismissal Element) и предварительно просматривать результаты (Hovercard). Google фиксирует эти отказы как явную отрицательную обратную связь, используя ее для улучшения качества рекомендаций и потенциально для корректировки основных результатов поиска.