Как Google автоматически создает и ранжирует шаблоны запросов с сущностями для улучшения поисковых подсказок (Autocomplete)

QUERY SUGGESTION TEMPLATES (Шаблоны поисковых подсказок)

US9529856B2
Google LLC
2013-06-03
2016-12-27

Google использует систему для автоматического обнаружения паттернов в поисковых запросах, которые включают фиксированные термины и сущности из определенной категории (например, «рестораны в [городе]»). Система генерирует шаблоны запросов, оценивает их качество на основе частоты использования, разнообразия сущностей и их распределения, а затем использует эти шаблоны для формирования более точных и структурированных поисковых подсказок в реальном времени.

Какую проблему решает

Патент решает задачу улучшения качества и охвата поисковых подсказок (Query Suggestions), предоставляемых пользователю во время ввода запроса (Autocomplete). Система стремится автоматически идентифицировать структурированные паттерны запросов, включающие сущности, чтобы предлагать более релевантные и полные варианты завершения запроса, основанные на коллективном поведении пользователей и данных из базы знаний (например, Knowledge Graph).

Что запатентовано

Запатентована система для автоматической генерации и ранжирования Query Templates (шаблонов запросов). Шаблон представляет собой обобщенную структуру запроса, состоящую из фиксированных терминов и идентификатора категории сущностей (например, «bike shops in [city]»). Система анализирует логи прошлых запросов, выявляет повторяющиеся паттерны, включающие разные сущности одной категории, и рассчитывает рейтинг (ranking) для каждого шаблона, чтобы определить его полезность для генерации подсказок.

Как это работает

Система работает в два этапа: генерация шаблонов (офлайн) и использование шаблонов (онлайн).

Генерация и Ранжирование (Офлайн): Компонент Template Generator анализирует прошлые запросы, чтобы найти группы запросов с общими терминами и разными сущностями из одной категории. Формируется Query Template. Затем этот шаблон ранжируется на основе нескольких факторов: общего количества соответствующих запросов, количества уникальных сущностей, используемых в этом шаблоне (разнообразие), и схожести распределения популярности этих сущностей внутри шаблона с их глобальной популярностью (Distributional Similarity).
Использование (Онлайн): Когда пользователь вводит частичный запрос (Partial Query), компонент Query Suggestion Engine сопоставляет его с существующими шаблонами. Если шаблон найден, система подставляет релевантные сущности (учитывая уже введенные символы, популярность сущности, локацию пользователя) для формирования поисковых подсказок.

Актуальность для SEO

Высокая. Автоматическое понимание запросов, использование сущностей и структурированных данных (Knowledge Graph) являются фундаментом современного поиска. Механизмы, описанные в патенте, напрямую связаны с тем, как Google интерпретирует намерения пользователей и направляет их поисковое поведение через подсказки (Autocomplete). Это ключевой компонент интерфейса поиска.

Важность для SEO

Патент имеет высокое значение для SEO (75/100). Он напрямую влияет на формирование пользовательских запросов. Понимание того, как Google структурирует запросы в шаблоны, позволяет оптимизировать контент под эти устоявшиеся паттерны. Это подчеркивает важность оптимизации под сущности (Entity SEO) и обеспечения того, чтобы сайт четко ассоциировался с релевантными сущностями и категориями, которые Google использует в своих шаблонах.

Термины и определения

Entity (Сущность): Тема дискурса; человек, место, концепция или объект, который можно идентифицировать по текстовому фрагменту и отличить от других. Имеет уникальный идентификатор (unique entity identifier) и свойства.
Entity Category (Категория сущностей): Группа сущностей, имеющих общие аспекты или свойства (например, [city], [film], [U.S. presidents]).
Entity Alias (Псевдоним сущности): Текстовое представление (термин или фраза), используемое для ссылки на сущность (например, «LA» и «Los Angeles» — псевдонимы для сущности города Лос-Анджелес).
Query Template (Шаблон запроса): Структура, включающая один или несколько фиксированных терминов (template terms) и идентификатор категории сущностей (например, «restaurants in [city]»).
Partial Query (Частичный запрос): Запрос, сформулированный пользователем до того, как он указал на его завершение (например, текст в строке поиска до нажатия Enter).
Query Suggestion (Поисковая подсказка): Предлагаемый вариант завершения запроса, часто предоставляемый в реальном времени (Autocomplete).
Ranking (Рейтинг шаблона): Оценка, указывающая на вероятность того, что шаблон запроса будет эффективен для определения поисковых подсказок. Рассчитывается на основе частоты, разнообразия и распределения сущностей.
Cohesiveness (Связность/Когезивность): Метрика, описывающая степень схожести между сущностями внутри одной категории. Высокая связность положительно влияет на рейтинг шаблона.
Conforming Entity Category Members: Уникальные сущности из категории, которые были найдены в прошлых запросах, соответствующих данному шаблону. Количество этих членов определяет разнообразие (Diversity) шаблона.
Distributional Similarity (Распределительное сходство): Сравнение частотного распределения сущностей в запросах, соответствующих шаблону, с частотным распределением этих же сущностей в более широком наборе запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный цикл от генерации шаблона до его использования для подсказок.

Идентификация Entity Category и соответствующих Entity Aliases.
Идентификация Query Template (термины + идентификатор категории).
Определение группы прошлых запросов (group of queries), которые соответствуют этому шаблону (содержат термины шаблона и один из псевдонимов).
Определение Ranking для шаблона. Рейтинг основан как минимум на подсчете вхождений (count of occurrences) одной или нескольких сущностей этой категории в найденной группе запросов.
Получение Partial Query от пользователя (после того, как рейтинг рассчитан).
Идентификация Query Template на основе сходства с частичным запросом.
Предоставление Query Suggestion на основе шаблона, причем решение о предоставлении основано на рейтинге шаблона.

Claim 3 и 4 (Зависимые): Детализируют расчет рейтинга на основе разнообразия сущностей (Diversity).

Рейтинг основан на количестве Conforming Entity Category Members (уникальных сущностей, найденных в шаблоне). Процесс включает сравнение этого количества с общим количеством сущностей в категории. Шаблон считается более качественным, если в нем используется много разных сущностей из категории.

Claim 5 и 6 (Зависимые): Детализируют расчет рейтинга на основе распределения сущностей (Distribution).

Рейтинг основан на частоте вхождения (conforming frequency of occurrence) различных сущностей в запросах, соответствующих шаблону. Процесс включает сравнение этого распределения частот с распределением частот тех же сущностей в дополнительной группе запросов (которая включает запросы, НЕ соответствующие шаблону). Цель — определить меру распределительного сходства (measure of distributional similarity). Шаблон считается качественным, если относительная популярность сущностей внутри шаблона схожа с их глобальной популярностью.

Claim 8 (Зависимый): Детализирует расчет рейтинга на основе связности категории (Cohesiveness).

Рейтинг также определяется на основе схожести (similarity) между членами категории сущностей. Это предотвращает создание шаблонов для слишком разнородных категорий.

Где и как применяется

Изобретение применяется в основном на этапе понимания запросов и взаимодействия с пользователем.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна иметь доступ к базе данных сущностей (entity database / Knowledge Graph), содержащей информацию о сущностях, их категориях, псевдонимах и показателях популярности (popularity measure). Эти данные необходимы для генерации шаблонов.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента, который разделен на две части:

Офлайн-обработка (Template Generation): Компонент Template Generator анализирует логи прошлых запросов (past queries). Он идентифицирует паттерны, связывает их с категориями сущностей, генерирует Query Templates и рассчитывает их Ranking. Эти шаблоны сохраняются для последующего использования.
Онлайн-обработка (Query Suggestion Serving): Компонент Query Suggestion Engine в реальном времени получает Partial Query от пользователя. Он сопоставляет его с сохраненными шаблонами, выбирает подходящие сущности и формирует Query Suggestions.

Входные данные (Офлайн):

Логи прошлых поисковых запросов.
База данных сущностей (Категории, Сущности, Псевдонимы).

Входные данные (Онлайн):

Частичный запрос пользователя.
База данных ранжированных шаблонов запросов.
Данные о пользователе (например, location of the user, история поиска).

Выходные данные:

Ранжированный список поисковых подсказок, предоставленный пользователю.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, имеющие четкую структуру, включающую сущности — локальные запросы («кафе в [городе]»), запросы о продуктах («[модель телефона] характеристики»), запросы о медиа («[фильм] актеры») и фактологические запросы.
Конкретные типы контента: Влияет на видимость контента, который хорошо оптимизирован под эти структурированные запросы, особенно локальный бизнес, каталоги, энциклопедические ресурсы.

Когда применяется

Триггеры активации (Офлайн): Активируется при анализе логов запросов, когда обнаруживается достаточное количество запросов, имеющих общие термины и сущности из одной категории.
Триггеры активации (Онлайн): Активируется каждый раз, когда пользователь вводит частичный запрос в поисковую строку. Система ищет совпадения между частичным запросом и фиксированными терминами шаблона ИЛИ когда частичный запрос сам является сущностью, для которой существуют шаблоны.
Пороговые значения (Офлайн): Шаблон считается действительным (valid query template), если его Ranking удовлетворяет определенному порогу. Это может включать пороги по количеству соответствующих запросов, количеству уникальных сущностей (diversity threshold) и мере распределительного сходства (distributional similarity threshold).

Пошаговый алгоритм

Процесс А: Генерация и ранжирование шаблонов (Офлайн)

Идентификация Категорий и Псевдонимов: Система определяет категории сущностей (например, [city]) и собирает псевдонимы для сущностей в этих категориях (например, «San Francisco», «SF»).
Группировка Запросов: Анализируются логи прошлых запросов. Идентифицируется группа запросов, которые имеют общие совпадающие термины (matching terms) и содержат один из идентифицированных псевдонимов сущностей.
Определение Шаблона: На основе сгруппированных запросов определяется Query Template, который включает совпадающие термины и идентификатор категории сущностей.
Расчет Рейтинга Шаблона (Ranking): Вычисляется оценка качества шаблона. Этот шаг включает несколько подэтапов:
- Оценка Частоты: Подсчет общего количества прошлых запросов, соответствующих шаблону.
- Оценка Разнообразия (Diversity): Определение количества уникальных сущностей (conforming entity category members), которые встречаются в этом шаблоне. Сравнение этого числа с общим размером категории.
- Оценка Распределения (Distribution): Сравнение частотного распределения сущностей внутри шаблона с их распределением в более широком наборе запросов (расчет Distributional Similarity).
- Оценка Связности (Cohesiveness): Оценка степени схожести сущностей внутри категории.
Валидация и Сохранение: Если совокупный рейтинг удовлетворяет пороговым значениям, шаблон помечается как действительный и сохраняется в базе данных шаблонов.

Процесс Б: Предоставление подсказок (Онлайн)

Получение Частичного Запроса: Система получает Partial Query от пользователя в реальном времени.
Идентификация Шаблона: Система ищет Query Template в базе данных, который соответствует частичному запросу (например, через префиксное совпадение терминов).
Идентификация Сущностей: Определяются релевантные сущности из категории, указанной в шаблоне. Выбор может основываться на:
- Символах, уже введенных пользователем (например, города на букву «S»).
- Популярности сущности (popularity measure).
- Контексте пользователя (например, location of the user, история поиска).
Формирование Подсказки: Генерируется Query Suggestion путем объединения терминов шаблона и псевдонима выбранной сущности.
Ранжирование Подсказки: Определяется рейтинг конкретной подсказки. Он может базироваться на рейтинге самого шаблона и рейтинге (популярности) подставленной сущности.
Предоставление Подсказки: Подсказка отправляется пользователю для отображения в интерфейсе.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о сущностях и поведении пользователей для генерации подсказок.

Данные о Сущностях (Entity Data): Критически важные данные из базы знаний (например, Knowledge Graph). Включают unique entity identifiers, Entity Categories, Entity Aliases, свойства сущностей и связи между ними. Также используются данные о популярности сущностей и их псевдонимов.
Поведенческие факторы: Логи прошлых запросов (past queries) массово используются для выявления паттернов, подсчета частот и анализа распределения запросов. История поиска конкретного пользователя может использоваться для персонализации подсказок.
Географические факторы: Местоположение пользователя (location of the user) используется для приоритизации сущностей при формировании подсказок (например, предлагать ближайшие города).

Какие метрики используются и как они считаются

Основная метрика — Ranking (Рейтинг шаблона), который агрегирует несколько показателей:

Count of Occurrences (Частота): Общее количество прошлых запросов, соответствующих шаблону, или количество уникальных запросов.
Diversity Score (Оценка Разнообразия): Рассчитывается как количество уникальных сущностей, используемых в шаблоне (number of conforming entity category members), часто нормализованное на общее количество сущностей в категории.
Distributional Similarity (Распределительное сходство): Мера схожести между двумя распределениями частот сущностей (внутри шаблона vs глобально). В патенте упоминается возможность использования статистических методов, таких как критерий согласия (goodness-of-fit test), хи-квадрат (chi-squared analysis) или методы на основе энтропии (entropy-based methods).
Cohesiveness Score (Оценка Связности): Оценка семантической близости сущностей внутри категории. Способ расчета не детализирован, но указано, что он основан на схожести (similarity) между сущностями.
Popularity Measure (Мера популярности): Оценка популярности конкретной сущности или её псевдонима, используемая при ранжировании финальной подсказки.

Автоматизация и масштабирование подсказок: Google автоматизирует процесс выявления популярных и полезных паттернов запросов. Система не полагается только на частоту конкретных запросов, но ищет обобщенные шаблоны, включающие сущности.
Качество шаблона зависит от разнообразия и распределения: Ключевым аспектом патента является механизм ранжирования шаблонов. Шаблон считается качественным не только если он часто используется (Frequency), но и если в нем используется много разных сущностей (Diversity), и если популярность этих сущностей внутри шаблона соответствует их общей популярности (Distributional Similarity).
Важность семантической структуры категорий: Система учитывает Cohesiveness категории. Шаблоны для четко определенных и однородных категорий (например, [города США]) будут ранжироваться выше, чем для размытых категорий. Это подтверждает важность хорошо структурированного графа знаний.
Сущности как основа для понимания запросов: Патент демонстрирует, как сущности используются для структурирования и понимания пользовательского интента еще до отправки запроса. Query Template — это способ интерпретации интента через структуру «Тема + Сущность».
Персонализация подсказок: Система явно учитывает контекст пользователя, такой как местоположение и история поиска, для выбора сущностей при формировании подсказок на основе шаблонов.

Best practices (это мы делаем)

Фокус на Entity SEO и структурирование данных: Необходимо обеспечить, чтобы ключевые сущности вашего бизнеса (продукты, локации, бренд, персоны) были четко определены, размечены (Schema.org) и присутствовали в графах знаний. Это повышает вероятность того, что Google распознает эти сущности и включит их в соответствующие Query Templates.
Оптимизация под устоявшиеся шаблоны запросов: Анализируйте поисковые подсказки (Autocomplete) в вашей нише, чтобы выявить шаблоны, которые использует Google (например, «[бренд] отзывы», «[продукт] купить в [городе]»). Создавайте контент и структуру сайта, которые напрямую отвечают на эти шаблонные запросы.
Работа над популярностью и узнаваемостью сущностей: Поскольку популярность сущности (Popularity Measure) используется при выборе того, какую сущность подставить в шаблон, работа над общим брендовым трафиком и узнаваемостью ваших сущностей (например, конкретных моделей продуктов) напрямую влияет на видимость в подсказках.
Локальное SEO: Для локального бизнеса критически важно обеспечить корректность и полноту данных о локациях (сущностях типа [city] или [neighborhood]). Поскольку местоположение пользователя используется для приоритизации, точное гео-таргетирование помогает попасть в подсказки по шаблонам типа «услуга рядом» или «услуга в [городе]».

Worst practices (это делать не надо)

Игнорирование структурированных данных: Отсутствие микроразметки и четкой связи контента с сущностями снижает способность Google идентифицировать ваш контент как релевантный для подстановки в Query Templates.
Фокус только на высокочастотных ключевых словах без учета сущностей: Оптимизация под общие термины без привязки к конкретным сущностям и их категориям не соответствует логике работы системы генерации шаблонных подсказок.
Манипуляции с подсказками (Накрутка): Попытки искусственно накрутить частотность запросов для влияния на Autocomplete могут быть отфильтрованы механизмом Distributional Similarity, который выявляет неестественное распределение популярности сущностей.

Стратегическое значение

Этот патент подтверждает стратегический приоритет Google на переход от ключевых слов к сущностям и структурированному пониманию интента. Для SEO это означает, что долгосрочная стратегия должна быть сосредоточена на построении семантической структуры сайта и укреплении связей с релевантными сущностями в Knowledge Graph. Понимание Query Templates позволяет прогнозировать спрос и адаптировать контент под то, как пользователи ищут информацию, направляемые самой поисковой системой.

Практические примеры

Сценарий: Оптимизация для интернет-магазина электроники

Анализ: SEO-специалист замечает, что Google активно предлагает подсказки по шаблонам: «[модель смартфона] характеристики», «[модель смартфона] обзор», «[модель смартфона] купить в [городе]».
Действие (Структура): Убедиться, что на сайте есть отдельные целевые страницы для каждого из этих интентов для всех ключевых моделей.
Действие (Сущности): Внедрить детальную микроразметку Product на карточках товаров, четко указывая бренд, модель и характеристики. Это помогает Google идентифицировать конкретную модель как сущность категории [смартфон].
Действие (Локализация): Создать страницы для физических магазинов в разных городах с разметкой LocalBusiness, чтобы улучшить видимость по шаблону, включающему [город].
Ожидаемый результат: При вводе пользователем названия модели смартфона, Google с большей вероятностью использует выявленные шаблоны и подставит в них данные, ведущие на оптимизированный сайт, увеличивая видимость в подсказках и потенциальный трафик по этим структурированным запросам.

Что является главным критерием качества для шаблона запроса (Query Template)?

Патент описывает несколько критериев, которые агрегируются в общий рейтинг. Ключевыми являются не только частота использования шаблона, но и разнообразие (Diversity) — сколько уникальных сущностей используется в этом паттерне, и распределительное сходство (Distributional Similarity) — насколько популярность сущностей внутри шаблона коррелирует с их глобальной популярностью. Также учитывается связность (Cohesiveness) самой категории сущностей.

Как система определяет, что шаблон полезен? (Пример с «NBA team in [city]»)

В патенте приводится пример (FIG. 7A/7B), где шаблон «NBA team in [city]» может получить низкий рейтинг по критерию распределительного сходства. Причина в том, что в этом шаблоне часто ищут города с командами NBA (Лос-Анджелес, Чикаго), но почти не ищут города без команд (Луисвилл). Однако в общем потоке запросов Луисвилл может быть достаточно популярным. Такое сильное расхождение в распределении популярности снижает рейтинг шаблона.

Как этот патент влияет на локальное SEO?

Он имеет прямое влияние, так как локальные запросы часто следуют четким шаблонам, таким как «[услуга] в [городе]» или «[тип бизнеса] рядом». Система автоматически генерирует эти шаблоны. Для SEO это означает, что обеспечение точной и полной информации о локации бизнеса критически важно для попадания в эти шаблонные подсказки, особенно учитывая, что система использует местоположение пользователя для приоритизации сущностей.

Что такое «Cohesiveness» (Связность) категории и почему это важно?

Связность описывает, насколько семантически близки сущности внутри одной категории. Например, категория [Президенты США] очень связная, а категория [Темы для фильмов] (включающая «пришельцы», «искусство», «войны») — менее связная. Google предпочитает шаблоны с высоко связными категориями, так как они дают более предсказуемые и полезные подсказки.

Может ли система генерировать подсказки на основе шаблонов, даже если конкретный запрос никогда не вводился?

Да. Суть шаблонов в том, что система может сгенерировать подсказку, комбинируя шаблон и сущность, даже если эта конкретная комбинация ранее не встречалась в логах. Например, если есть шаблон «население [города]» и в базу знаний добавляется новый город, система сможет сгенерировать подсказку «население [новый город]».

Как SEO-специалисту использовать знание об этих шаблонах на практике?

Необходимо идентифицировать ключевые шаблоны в своей нише путем анализа автодополнения (Autocomplete). Затем следует убедиться, что сайт имеет качественный контент, отвечающий на эти шаблонные запросы, и что сущности (продукты, локации, бренды) хорошо структурированы и размечены. Это максимизирует шансы на получение трафика из запросов, сформированных через эти шаблоны.

Влияет ли популярность моего бренда (сущности) на видимость в этих подсказках?

Да, напрямую. Когда система выбирает, какую сущность подставить в шаблон (например, какой бренд в шаблон «[бренд] отзывы»), она учитывает меру популярности (Popularity Measure) сущности. Более популярные и узнаваемые бренды будут предлагаться чаще.

Использует ли система персонализацию при работе с шаблонами?

Да. Патент явно упоминает использование информации о пользователе, такой как его местоположение (location of the user) и история поиска (previous search requests), для выбора и ранжирования сущностей, подставляемых в шаблон. Это делает подсказки более релевантными для конкретного пользователя.

Что происходит, если частичный запрос соответствует нескольким шаблонам?

Система, вероятно, будет использовать рейтинг шаблонов (Ranking), рассчитанный офлайн, чтобы определить, какой шаблон является более качественным или более вероятным интентом. Также могут учитываться рейтинги конкретных подсказок, сгенерированных из этих шаблонов, для формирования финального списка автодополнения.

Как обеспечить попадание моих сущностей (например, товаров) в эти шаблоны?

Необходимо работать над тем, чтобы Google четко распознавал ваши товары как сущности определенной категории. Это достигается через качественную микроразметку (Schema.org/Product), присутствие в Google Merchant Center и общую авторитетность сайта в данной тематике. Чем лучше Google знает вашу сущность, тем выше вероятность её использования в Query Templates.

Как Google использует частичные запросы, логи и профили пользователей для формирования подсказок (Autocomplete) и предварительной загрузки результатов

Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом профиля пользователя. Система также может заранее кэшировать результаты для наиболее вероятных подсказок, чтобы ускорить выдачу.

US7836044B2
2010-11-16

Персонализация
Семантика и интент

Как Google создает новые поисковые подсказки (Autocomplete), комбинируя структуры и термины из прошлых запросов

Google расширяет покрытие поисковых подсказок (Autocomplete), создавая новые, ранее не использованные запросы. Система анализирует логи, находит запросы с похожей структурой (шаблоны), определяет семантически близкие термины (используя distributional similarity) и комбинирует их. Это позволяет предлагать пользователям релевантные подсказки, даже если такой запрос никогда ранее не вводился.

US8521739B1
2013-08-27

Семантика и интент

Как Google формирует и ранжирует подсказки в Autocomplete на основе исторических данных о запросах пользователей

Google использует систему, которая анализирует логи исторических запросов пользователей для предсказания полного запроса при вводе частичного. Система генерирует упорядоченный набор вероятных завершений, ранжируя их по популярности (частоте использования) или другим критериям. Это позволяет пользователям быстрее находить информацию и показывает, какие формулировки запросов наиболее распространены в сообществе.

US7487145B1
2009-02-03

Как Google сегментирует сложные запросы на смысловые компоненты для генерации поисковых подсказок и связанных запросов

Google использует механизм для генерации уточнений запроса (поисковых подсказок или связанных запросов) путем разделения исходного запроса на семантические компоненты (устойчивые фразы) с помощью вероятностного анализа. Система находит уточнения для каждого компонента по отдельности, а затем рекомбинирует их, сохраняя исходный порядок. Финальные кандидаты строго фильтруются на основе пользовательских данных (CTR) и синтаксической схожести.

US9703871B1
2017-07-11

Семантика и интент
SERP
Поведенческие сигналы

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

US8392443B1
2013-03-05

Семантика и интент
Поведенческие сигналы

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")

Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.

US10346417B2
2019-07-09

Мультимедиа
Поведенческие сигналы
SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов

Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.

US9009146B1
2015-04-14

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами

Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.

US8819004B1
2014-08-26

Поведенческие сигналы
Мультимедиа
SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций

Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.

US10180965B2
2019-01-15

Персонализация
Семантика и интент
Local SEO

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования

Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.

US7454417B2
2008-11-18

Персонализация
Поведенческие сигналы
SERP

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска

Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.

US10909124B2
2021-02-02

Семантика и интент
Персонализация
SERP

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий

Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.

US9881077B1
2018-01-30

Семантика и интент
Поведенческие сигналы

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)

Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.

US9317605B1
2016-04-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования

Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.

US8195654B1
2012-06-05

Поведенческие сигналы
SERP