Автор: Виктор Репин

Патент описывает систему Google Ads для автоматического создания («синтеза») компонентов объявлений, в частности Sitelinks. Система анализирует исторические логи поисковой выдачи, чтобы определить, какие органические результаты ранее показывались вместе с рекламой и вели на тот же домен. Эти результаты трансформируются в Sitelinks и автоматически тестируются для повышения эффективности рекламы.

Google использует систему для обнаружения спама в локальной выдаче (например, в Google Maps). Система сравнивает характеристики бизнес-листингов (названия, адреса, телефоны) из надежных источников (например, официальные справочники) и ненадежных источников (например, открытые веб-формы). Анализ проводится в контексте конкретной категории бизнеса, чтобы выявить подозрительные аномалии (например, ключевые слова в названии), которые статистически чаще встречаются в спамных листингах.

Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.

Google использует механизм для персонализации поисковых подсказок в реальном времени. Система анализирует историю взаимодействий пользователя (просмотренные документы, посещенные места), чтобы определить его атрибуты (интересы). Подсказки ранжируются путем сопоставления атрибутов пользователя с атрибутами потенциальных подсказок. Система также учитывает контекст текущей сессии, используя данные о предыдущем запросе для уточнения подсказок к следующему.

Google использует механизм для быстрого выявления новых трендов в поиске. Система анализирует «свежие запросы», приводит их к канонической форме и группирует варианты с одинаковым смыслом. Если группа набирает достаточную совокупную популярность, эти запросы добавляются в Автозаполнение (Query Suggestions), позволяя предлагать актуальные подсказки, даже если каждый отдельный вариант еще не популярен.

Google использует данные о месте проживания пользователя (например, отеле) для персонализации локального поиска. При поиске ресторанов или достопримечательностей система повышает в ранжировании те места, которые высоко оценили другие гости этого же отеля. Отзывы от постояльцев также показываются в приоритетном порядке, так как они считаются более релевантными для пользователя.

Google использует гетерогенный граф для анализа взаимосвязей между пользователями, видео, группами и рекламой в социальных сетях (например, YouTube). Система итеративно распространяет «метки интереса» (labels) через эти связи, используя алгоритмы типа Adsorption. Это позволяет генерировать релевантные рекомендации видео или рекламы для пользователя, даже если у него мало собственной истории просмотров, основываясь на интересах его социального окружения.

Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.

Google измеряет, как долго пользователи остаются на сайте в течение сессии, и сравнивает эту продолжительность с эталонными показателями, специфичными для категорий сайта. Эта нормализованная оценка (Duration Performance Score) позволяет объективно оценить вовлеченность. Система также явно повышает ценность сессий, возникающих в результате прямых переходов, и фильтрует шум от последнего клика.

Google адаптирует поведенческие факторы ранжирования (например, клики) при обновлении контента документа. Исторические данные взвешиваются в зависимости от того, насколько старая версия контента похожа на текущую. Для измерения схожести используется анализ временного распределения шинглов. Если контент сильно изменился, ценность старых поведенческих сигналов снижается.

Google оптимизирует процесс распознавания фраз (N-грамм) в запросе, анализируя предыдущий запрос пользователя в той же сессии. Если пользователь уточняет запрос, добавляя новые слова, система исключает эти новые слова из анализа N-грамм в сочетании со старыми терминами. Это повышает эффективность и позволяет точнее понять, какие слова являются единым понятием, а какие — дополнительными уточнениями.

Патент Google, описывающий систему аналитики для выявления причин, по которым пользователи покидают сайт без конверсии. Система сравнивает показатели отказов для разных характеристик трафика (например, ключевых слов или каналов). Это позволяет определить, что является проблемой: источник трафика или сама целевая страница. Также система выявляет проблемные последовательности взаимодействий и учитывает кросс-девайсное поведение.

Google использует алгоритм для определения схожести документов, который превосходит традиционный TF-IDF. Система вычисляет Оценку Значимости (Prominence Score) и Оценку Описательности (Descriptiveness Score) для отдельных слов и фраз. Учитывается, где именно на странице расположены термины и насколько информативными они являются в целом. Это позволяет точнее определять релевантность и тематическую близость контента.

Google использует систему для анализа контента, который пользователь просматривает в данный момент (веб-страница, приложение). Система генерирует потенциальные поисковые запросы на основе этого контента, оценивает их качество (популярность, качество результатов, визуальное выделение терминов) и предлагает пользователю лучшие запросы для быстрого контекстного поиска без необходимости вручную вводить текст.

Google анализирует авторитетные сайты и логи запросов для выявления общих «Шаблонов Намерений» (Intent Templates). Система заранее извлекает контент в формате «Заголовок-Текст» (Heading-Text Pairs) с этих сайтов и сохраняет его в базе данных Q&A. При получении соответствующего запроса Google извлекает этот готовый ответ и показывает его в выдаче на естественном языке (Featured Snippet).

Google использует комплексный подход к визуальному поиску. Система строит персональный Граф Визуальных Интересов пользователя для персонализации выдачи и проактивных рекомендаций. Она анализирует композицию кадра и контекст (например, окружающий текст), чтобы определить, ищет ли пользователь конкретный объект или категорию, а также объединяет несколько сущностей в сложный составной запрос, обеспечивая более точный ответ.

Патент Google, описывающий фундаментальную архитектуру персонализированного поиска. Система собирает и синхронизирует между устройствами персональные данные пользователя: закладки, историю посещений, оценки и поведенческие сигналы. При поиске результаты из этих персональных источников объединяются с глобальным индексом, что позволяет изменять ранжирование, выделять знакомые сайты и подбирать рекламу на основе интересов пользователя.

Google анализирует историю поиска, чтобы классифицировать пользователей по категориям интересов (например, «автолюбитель» или «меломан»). Система хранит данные о популярности запросов внутри каждой категории. При вводе первых букв подсказки (Autocomplete) ранжируются не по глобальной популярности, а по популярности именно в той категории интересов, к которой принадлежит пользователь.

Google анализирует, как долго пользователи остаются на странице после клика (Dwell Time). Сравнивая «длинные просмотры» (признак удовлетворенности) с «короткими просмотрами» (признак неудовлетворенности), Google рассчитывает оценку релевантности (LCIC fraction). Эта оценка корректирует ранжирование, продвигая результаты, которые лучше удерживают пользователей, учитывая при этом контекст запроса и поведение пользователя, включая аудиовзаимодействия.

Патент Google описывает систему для автоматического определения связи между статичными изображениями и видеороликами. Система анализирует визуальные признаки изображения и сравнивает их с признаками, извлеченными из репрезентативных кадров видео. Установленные связи используются для переноса метаданных (например, геолокации или ключевых слов) между ресурсами и для смешивания разных типов медиаконтента в результатах поиска.