Как Google использует атрибуты сущностей для генерации «Дополненных запросов» и уточнения поиска

PROVIDING SEARCH RESULTS USING AUGMENTED SEARCH QUERIES (Предоставление результатов поиска с использованием дополненных поисковых запросов)

US10055462B2
Google LLC
2013-03-15
2018-08-21

Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и автоматически генерирует список предлагаемых «дополненных запросов» (Сущность + Атрибут). Это позволяет пользователю одним кликом запустить новый, более сфокусированный поиск по теме.

Какую проблему решает

Патент решает проблему неэффективности и неоднозначности поиска информации о сущностях (Entities). Часто запросы, содержащие ссылку на сущность (Entity Reference, например, имя человека или название продукта), являются слишком общими или могут относиться к разным объектам. Пользователям сложно вручную формулировать точные запросы для изучения конкретных аспектов (Attributes) этой сущности. Изобретение призвано облегчить навигацию и исследование темы.

Что запатентовано

Запатентована система для автоматической генерации и предоставления «Дополненных поисковых запросов» (Augmented/Additional Search Queries). Когда пользователь ищет сущность, система идентифицирует её ключевые атрибуты, анализируя первоначальный набор результатов или структурированные данные. Затем она формирует список уточняющих запросов в формате [Сущность + Атрибут] и предлагает их пользователю в интерфейсе (например, в виде кликабельных "пилюль" или фильтров) для быстрого перехода к более сфокусированной выдаче.

Как это работает

Механизм работает следующим образом:

Распознавание и Дизамбигуация: Система получает запрос с Entity Reference. Если он неоднозначен, система различает отдельные сущности (Distinct Entities) и может предложить пользователю выбрать нужную.
Идентификация Атрибутов: Для выбранной сущности определяются ключевые атрибуты. Источники: анализ контента из первоначальных результатов поиска (с помощью NLP) или данные из Knowledge Graph.
Ранжирование Атрибутов: Идентифицированные атрибуты ранжируются по важности (например, по частоте или расположению в результатах).
Генерация Дополненных Запросов: Автоматически создаются запросы путем комбинирования сущности и топовых атрибутов.
Отображение и Выбор: Эти запросы отображаются пользователю в виде выбираемого списка (selectable list).
Обновление Выдачи: При выборе дополненного запроса система предоставляет новый набор результатов, который содержит информацию, отсутствовавшую в первоначальной выдаче.

Актуальность для SEO

Высокая. Описанный механизм напрямую соответствует функциям исследования тем в SERP, таким как "Search Pills" (кнопки уточнения/фильтры), блоки "People Also Ask" и элементы навигации в Knowledge Panel. Учитывая фокус Google на сущностях и участие Emily Moxley (ключевого менеджера по продуктам, связанным с поисковыми функциями и Knowledge Panel), патент крайне актуален для понимания современных поисковых интерфейсов.

Важность для SEO

Патент имеет высокое значение (8.5/10) для SEO-стратегии, особенно в контексте Entity SEO. Он описывает механизм, который активно направляет трафик от общих запросов о сущности к более специфическим запросам, основанным на её атрибутах. Понимание того, как Google идентифицирует и ранжирует эти атрибуты, критически важно для оптимизации контента и обеспечения видимости на всех этапах исследования темы пользователем.

Термины и определения

Entity (Сущность): Объект или концепция, которая является единичной, уникальной и различимой (человек, место, продукт, идея).
Entity Reference (Ссылка на сущность): Идентификатор (например, текстовая строка в запросе), который может соответствовать одной или нескольким Distinct Entities. Может быть неоднозначным.
Distinct Entities (Различные сущности): Конкретные сущности, на которые может указывать неоднозначная Entity Reference (например, разные люди с одинаковым именем).
Attribute (Атрибут): Характеристика, особенность или связанная тема сущности, идентифицированная системой. Примеры для сущности "Кейт Миддлтон": [свадьба], [сестра].
Additional/Augmented Search Queries (Дополнительные/Дополненные поисковые запросы): Автоматически сгенерированные запросы в формате [Сущность + Атрибут]. Предлагаются пользователю для уточнения поиска.
Knowledge Graph (Граф знаний): Структурированная база данных (граф с узлами и ребрами), описывающая сущности и отношения между ними. Упоминается как источник структурированных данных.
Natural Language Processing (NLP): Технологии обработки естественного языка, используемые для парсинга запросов и анализа контента с целью извлечения сущностей и атрибутов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обновления результатов поиска.

Система получает первый запрос с Entity Reference (который может соответствовать нескольким Distinct Entities).
Предоставляется набор результатов, который разграничивает эти сущности.
Идентифицируются атрибуты (Attributes) как минимум одной сущности, основываясь (хотя бы частично) на этом наборе результатов.
В ответ на первый запрос автоматически генерируется выбираемый список (selectable list) дополнительных запросов. Они основаны на первом запросе, но отделены от него, и включают комбинации [Сущность + Атрибут].
Список предоставляется для отображения в UI.
Система получает ввод, выбирающий один из этих запросов.
Предоставляется обновленный набор результатов. Критическое условие: этот набор содержит хотя бы один результат, которого не было в первоначальном наборе.

Ядро изобретения — автоматизация исследования темы путем предложения уточнений, которые гарантированно расширяют информационное поле, а не просто фильтруют текущую выдачу.

Claim 4 (Зависимый от 1): Детализирует генерацию запросов.

Идентифицированные атрибуты ранжируются (ranking). Генерация дополнительных запросов основывается на этом ранжировании. Это подтверждает, что система определяет наиболее важные атрибуты.

Claim 5 (Зависимый от 1): Описывает процесс дисамбигуации.

Если сущностей несколько, система предоставляет их список в UI и получает выбор пользователя. Атрибуты и дополнительные запросы генерируются только для выбранной сущности.

Claims 6 и 7 (Зависимые от 1): Указывают источники атрибутов.

Атрибуты могут быть идентифицированы из структурированных источников данных (Claim 6) или из неструктурированных данных (Claim 7).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, обеспечивая интерфейс для исследования сущностей.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит извлечение сущностей и атрибутов из контента с использованием NLP и наполнение Knowledge Graph. Это база для последующей идентификации атрибутов.

QUNDERSTANDING – Понимание Запросов
Система распознает Entity Reference в запросе и определяет потенциальную неоднозначность.

RANKING – Ранжирование
Генерируется первоначальный набор результатов.

METASEARCH – Метапоиск и Смешивание (Формирование SERP Features)
Основное применение патента. На этом этапе система формирует финальный вид SERP:

Анализ результатов и KG: Система анализирует результаты этапа RANKING и/или обращается к Knowledge Graph для идентификации и ранжирования атрибутов сущности.
Генерация UI элементов: Система генерирует Augmented Search Queries и внедряет их в интерфейс SERP (например, в виде "пилюль", PAA или элементов Knowledge Panel). При необходимости отображается интерфейс для дисамбигуации.
Обработка взаимодействия: При выборе дополненного запроса процесс возвращается на этап RANKING с новым, уточненным запросом.

Входные данные:

Исходный поисковый запрос.
Первоначальный набор результатов поиска.
Структурированные данные (Knowledge Graph).
Неструктурированные данные (контент веб-страниц).

Выходные данные:

Интерфейс SERP с интегрированным списком Augmented Search Queries.
Обновленный набор результатов для выбранного дополненного запроса.

На что влияет

Специфические запросы: Наибольшее влияние на информационные и исследовательские запросы, связанные с сущностями (люди, бренды, продукты, места).
Конкретные типы контента: Влияет на видимость контента, который фокусируется на специфических атрибутах сущности (детальные обзоры, биографии, страницы характеристик).

Когда применяется

Триггеры активации: В запросе идентифицировано Entity Reference.
Условия применения: Система способна идентифицировать и ранжировать значимые атрибуты для этой сущности на основе анализа выдачи или структурированных данных.

Пошаговый алгоритм

Процесс обработки запроса и генерации дополнений

Получение запроса: Система получает запрос, содержащий Entity Reference.
Генерация первичных результатов: Формируется первый набор результатов.
Дисамбигуация (При необходимости): Определяется, соответствует ли Entity Reference нескольким Distinct Entities.
Если ДА: Отображается интерфейс для выбора сущности. Система получает выбор пользователя.
Если НЕТ: Выбирается доминирующая сущность.
Идентификация Атрибутов: Для выбранной сущности идентифицируются атрибуты. Источники: парсинг первичных результатов (NLP) и/или запрос к Knowledge Graph.
Ранжирование Атрибутов: Идентифицированные атрибуты ранжируются. Критерии могут включать:
- Частоту упоминания (Frequency of occurrence).
- Расположение и близость к сущности в тексте (Location/Proximity).
- Качество/популярность/свежесть документа-источника.
Генерация Дополненных Запросов: Формируются Augmented Search Queries путем комбинирования сущности и высокоранжированных атрибутов.
Отображение Списка в UI: Список дополненных запросов отображается в SERP.
Обработка Выбора Пользователя: Пользователь выбирает один из запросов.
Обновление Результатов: Выполняется поиск по выбранному дополненному запросу. Отображается обновленный набор результатов, включающий новые документы.

Какие данные и как использует

Данные на входе

Контентные факторы (Неструктурированные данные): Текст, заголовки, подписи на веб-страницах из результатов поиска. Анализируются с помощью NLP для извлечения атрибутов и оценки их частоты/расположения.
Структурные факторы (Структурированные данные): Данные из Knowledge Graph (узлы сущностей, ребра отношений, типы). Используются для идентификации атрибутов и дисамбигуации.
Факторы качества/авторитетности (Косвенно): Патент упоминает, что ранжирование атрибутов может учитывать метрики документа, из которого они извлечены (например, популярность, свежесть, качество страницы).

Какие метрики используются и как они считаются

Система вычисляет ранжирование атрибутов (Ranking of Attributes) для выбора топовых дополненных запросов. Ключевые метрики:

Frequency of Occurrence (Частота встречаемости): Количество упоминаний атрибута в документе или во всем наборе результатов (абсолютное или нормализованное).
Location/Proximity (Расположение/Близость): Местоположение атрибута в документе (заголовок, начало страницы) и его близость к упоминанию целевой сущности.
Document Metrics (Метрики документа): Показатели качества, свежести или популярности страниц-источников. Могут использоваться как весовые коэффициенты при агрегации рангов атрибутов.

Переход от Поиска к Исследованию (Search to Exploration): Патент демонстрирует стратегию Google по превращению SERP в интерактивную среду для изучения сущностей. Система активно предсказывает и направляет следующий шаг пользователя, предлагая релевантные атрибуты для исследования.
Автоматическое определение и Ранжирование Атрибутов: Google динамически определяет, какие аспекты (атрибуты) сущности наиболее важны. Это ранжирование основано не только на Knowledge Graph, но и на анализе контента, который уже ранжируется в ТОПе (частота, расположение, авторитетность источника).
Критичность связки «Сущность + Атрибут»: Комбинации [Сущность + Атрибут] рассматриваются как ключевые информационные потребности. Augmented Queries напрямую нацелены на удовлетворение этих потребностей.
Расширение, а не фильтрация: Ключевым требованием патента (Claim 1) является то, что дополненный запрос должен привести к появлению новых результатов. Это не просто фильтр текущей выдачи, а полноценный новый поиск для углубления в тему.
Важность Структуры Контента для NLP: То, как информация структурирована на странице (близость атрибутов к сущности, использование заголовков), напрямую влияет на способность системы извлекать и высоко ранжировать эти атрибуты.

Best practices (это мы делаем)

Построение Тематического Авторитета (Topic/Entity Authority): Стратегия должна фокусироваться на полном охвате сущности и всех её ключевых атрибутов (модель Topic Clusters). Это гарантирует релевантность вашего контента для автоматически сгенерированных Augmented Queries.
Четкая ассоциация Сущность-Атрибут в контенте: Убедитесь, что ключевые атрибуты упоминаются в непосредственной близости (Proximity) от основной сущности и на заметных позициях (Prominence) – в заголовках, подзаголовках, списках. Это повышает их ранг в системе ранжирования атрибутов.
Мониторинг и Оптимизация под Дополненные Запросы: Регулярно анализируйте, какие Augmented Queries (пилюли, фильтры, PAA) Google генерирует для ваших ключевых сущностей. Рассматривайте их как целевые запросы и убедитесь, что у вас есть качественный контент, оптимизированный под них.
Использование Структурированных Данных (Schema.org): Активно используйте микроразметку для явного определения сущностей и их атрибутов. Это предоставляет Google надежный источник данных (Structured Data Source), который может использоваться для генерации дополненных запросов.

Worst practices (это делать не надо)

Фокус только на основном запросе сущности: Игнорирование атрибутов и оптимизация только под общий запрос (например, имя бренда) приведет к потере трафика от пользователей, использующих механизмы уточнения.
Поверхностный контент без глубины: Создание контента, который упоминает сущность, но не раскрывает её атрибуты. Система не сможет извлечь полезные данные для генерации дополненных запросов из такого контента.
Неструктурированный текст и слабые семантические связи: Текст, в котором связь между сущностью и атрибутами неявная или размытая, затрудняет работу NLP-алгоритмов по извлечению и ранжированию атрибутов.

Стратегическое значение

Патент подтверждает стратегический сдвиг к семантическому поиску, основанному на сущностях. Успех в SEO зависит от способности сайта предоставить лучшую информацию не только о самой сущности, но и о всем спектре её значимых атрибутов. Долгосрочная стратегия должна быть направлена на построение контент-хабов вокруг сущностей, которые покрывают все автоматически генерируемые Augmented Queries, которые Google использует для ведения пользователя по теме.

Практические примеры

Сценарий: Оптимизация страницы продукта (E-commerce)

Сущность: Смартфон "Pixel 9 Pro".
Анализ SERP: SEO-специалист вводит запрос и видит, что Google генерирует Augmented Queries (пилюли): [цена], [дата выхода], [характеристики камеры], [обзоры], [сравнение с iPhone].
Стратегия Контента: На странице продукта создаются четко выделенные разделы для каждого атрибута.
Техническая реализация:
- Используются заголовки H2/H3 для разделов "Характеристики камеры Pixel 9 Pro" и "Цена и доступность".
- Информация о камере представлена в виде структурированной таблицы или списка (легко для NLP-извлечения).
- Внедряется разметка Schema.org (Product), указывающая атрибуты (price, releaseDate).
Результат: Google легче идентифицирует и высоко ранжирует эти атрибуты. Сайт получает высокую видимость, когда пользователи кликают на сгенерированные пилюли (например, [Pixel 9 Pro характеристики камеры]), так как контент оптимизирован под эти дополненные запросы.

Как Google определяет, какие атрибуты являются ключевыми для сущности?

Система использует механизм ранжирования атрибутов. Согласно патенту, учитывается частота упоминания атрибута (Frequency of Occurrence) в результатах поиска, его расположение на странице (Location) и близость к упоминанию сущности (Proximity). Атрибуты, которые часто обсуждаются на авторитетных и свежих ресурсах в контексте сущности, получают более высокий ранг.

Откуда Google берет эти атрибуты: из Knowledge Graph или из веб-страниц?

Патент явно указывает на использование обоих источников (Claims 6 и 7). Атрибуты могут быть взяты из структурированных данных (таких как Knowledge Graph) или извлечены из неструктурированного контента (веб-страниц в результатах поиска) с помощью NLP. Это позволяет системе находить как устоявшиеся, так и актуальные атрибуты.

Является ли этот механизм просто фильтрацией исходных результатов?

Нет, это ключевое отличие. Патент (Claim 1) требует, чтобы обновленный набор результатов содержал хотя бы один результат, которого не было в первоначальной выдаче. Это означает, что система выполняет новый поиск по дополненному запросу с целью расширить знания пользователя, а не просто сузить текущий список.

Как я могу оптимизировать свой контент, чтобы повлиять на генерацию этих дополненных запросов?

Сфокусируйтесь на четкой структуре и семантике. Размещайте ключевые атрибуты рядом с упоминанием основной сущности и используйте их в заголовках и списках. Это облегчает NLP-системам извлечение и повышает ранг атрибутов. Также используйте разметку Schema.org для явного указания атрибутов.

Что происходит, если исходный запрос неоднозначен (например, имя, которое носят разные люди)?

Патент описывает процесс дисамбигуации (Claim 5). Система сначала распознает наличие нескольких Distinct Entities. Пользователю может быть предложен интерфейс для выбора конкретной сущности. Дополненные запросы будут сгенерированы только после того, как пользователь уточнит, какая именно сущность его интересует.

Как этот патент связан с блоками «People Also Ask» (PAA) или «Search Pills»?

Этот патент описывает базовую технологию, лежащую в основе таких функций. «Search Pills» (кнопки уточнения/фильтры) и, вероятно, многие вопросы в PAA являются реализацией Augmented Search Queries: автоматически сгенерированными уточнениями, основанными на ключевых атрибутах сущности.

Влияет ли авторитетность моего сайта на этот механизм?

Да, косвенно. Патент упоминает, что при ранжировании атрибутов могут учитываться характеристики документа-источника (например, популярность, качество страницы). Атрибуты, извлеченные из более авторитетных и качественных источников, с большей вероятностью получат высокий ранг и будут использованы для генерации дополненных запросов.

Нужно ли создавать отдельные страницы для каждой комбинации Сущность + Атрибут?

Это зависит от важности атрибута. Для ключевых атрибутов, требующих детального раскрытия, отдельная страница (часть Topic Cluster) позволит лучше ответить на интент дополненного запроса. Для более простых фактов достаточно четкого и структурированного упоминания на основной странице сущности.

Применяется ли этот механизм к коммерческим запросам (E-commerce)?

Да. В E-commerce сущностью является продукт (например, «iPhone 15»), а атрибутами могут быть «цена», «обзоры», «характеристики камеры», «аксессуары». Система будет генерировать дополненные запросы на основе этих атрибутов, поэтому оптимизация под них критически важна для видимости интернет-магазинов.

Как этот патент влияет на стратегию построения Topical Authority?

Патент полностью подтверждает необходимость построения Topical Authority вокруг сущностей. Чтобы доминировать в теме, необходимо покрыть не только саму сущность, но и все ее ключевые атрибуты, которые Google идентифицирует и предлагает пользователям для исследования. Это основа для видимости по всему спектру связанных запросов.

Как Google использует базу данных сущностей (Knowledge Graph) для формирования прямых ответов на вопросы о фактах

Google использует систему для идентификации запросов, направленных на получение фактов о конкретной сущности (Entity-Triggering Questions). Система анализирует топовые результаты поиска, определяет, какие сущности чаще всего ассоциируются с этими документами, и выбирает наиболее релевантную сущность. Затем система извлекает запрошенный атрибут (например, адрес, дату рождения) из своей базы данных сущностей или находит лучший сниппет, содержащий этот факт, чтобы предоставить прямой ответ пользователю.

US9081814B1
2015-07-14

Knowledge Graph
Семантика и интент
SERP

Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя

Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.

US8843466B1
2014-09-23

Семантика и интент
Knowledge Graph
Индексация

Как Google изучает свойства и атрибуты сущностей, анализируя логи поисковых запросов пользователей

Google использует автоматизированный метод для построения базы знаний о сущностях (Entity) и их атрибутах (Attribute). Система анализирует миллионы поисковых запросов, выявляя лингвистические паттерны (например, «столица Франции»). Это позволяет понять, какие атрибуты важны для разных типов сущностей (например, «население» для города, «побочные эффекты» для лекарства), и сформировать структурированное знание об объектах реального мира.

US8005842B1
2011-08-23

Knowledge Graph
Семантика и интент

Как Google определяет сущности (например, болезни) по их атрибутам (например, симптомам), анализируя результаты поиска и аннотации индекса

Google использует систему для ответа на запросы, которые перечисляют атрибуты (например, симптомы), но ищут сущность (например, болезнь). Система определяет связь между ними, используя несколько методов: предварительное аннотирование индекса связями сущностей, анализ частоты упоминания сущностей в топе выдачи или генерацию комбинированных запросов. Также система предлагает дополнительные атрибуты для уточнения.

US8856099B1
2014-10-07

Индексация
Семантика и интент
SERP

Как Google распознает сущности в результатах поиска по описательным запросам и предлагает их для уточнения поиска

Google использует этот механизм для улучшения поиска, особенно по картинкам. Если пользователь вводит описательный запрос (например, «коричневая собака-пловец»), система распознает конкретные сущности в найденных результатах (например, «Чесапик-бей-ретривер») и отображает их названия как кликабельные элементы. Это позволяет пользователю перейти от общего описания к поиску конкретной сущности.

US9418121B2
2016-08-16

Семантика и интент
Индексация
SERP

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)

Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.

US7797316B2
2010-09-14

Свежесть контента
Ссылки
Техническое SEO

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов

Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.

US7536408B2
2009-05-19

Индексация
Семантика и интент
Ссылки

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу

Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.

US20150310100A1
2015-10-29

Персонализация
Индексация
Поведенческие сигналы

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)

Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.

US9165040B1
2015-10-20

Ссылки
EEAT и качество
Антиспам

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента

Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).

US8095876B1
2012-01-10

EEAT и качество
Техническое SEO
Ссылки

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов

Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.

US20140372873A1
2014-12-18

Структура сайта
Техническое SEO
Ссылки

Как Google использует данные о выделении текста пользователями (явно или неявно) для генерации сниппетов и анализа контента

Google может собирать данные о том, какие фрагменты текста пользователи выделяют на веб-страницах, используя специальные инструменты или просто выделяя текст мышью. Эти данные агрегируются для определения наиболее важных частей документа. На основе этой "популярности" Google может динамически генерировать поисковые сниппеты, включающие наиболее часто выделяемые фрагменты.

US8595619B1
2013-11-26

Поведенческие сигналы
SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя

Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.

US20060224583A1
2006-10-05

Персонализация
Поведенческие сигналы

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями

Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.

US10073882B1
2018-09-11

Семантика и интент
Поведенческие сигналы

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента

Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.

US8145636B1
2012-03-27

Семантика и интент
Поведенческие сигналы