Как Google использует контент топовых результатов для генерации разнообразных и контекстуально связанных поисковых подсказок

GENERATING QUERY SUGGESTIONS USING CONTEXTUAL INFORMATION (Генерирование предлагаемых запросов с использованием контекстной информации)

US7725485B1
Google LLC
2005-08-01
2010-05-25

Google анализирует контент страниц, ранжирующихся в топе по исходному запросу, чтобы понять его контекст. На основе этого контекста система находит похожие запросы из своей базы данных. Затем она фильтрует эти запросы, оставляя только те, которые лексически отличаются от исходного, чтобы предложить пользователю разнообразные и релевантные альтернативы для исследования темы.

Какую проблему решает

Патент решает проблему генерации полезных и неизбыточных поисковых подсказок (query suggestions). Часто пользователи не выбирают оптимальные ключевые слова. Существующие системы часто предлагают варианты, которые лексически слишком похожи на исходный запрос (например, предложение "star wars movie" на запрос "star wars") и не несут новой ценности. Изобретение направлено на то, чтобы предложить пользователю контекстуально релевантные, но при этом лексически разнообразные альтернативы.

Что запатентовано

Запатентована система генерации предлагаемых запросов, использующая контекстную информацию, извлеченную из результатов поиска. Суть изобретения в двух механизмах: 1) Понимание контекста запроса путем анализа контента топовых результатов и создания вектора запроса (Centroid). 2) Применение строгого фильтра лексического разнообразия (lexical diversity filter) к потенциальным подсказкам, чтобы гарантировать их существенное отличие от исходного запроса.

Как это работает

Система работает следующим образом:

Контекстуализация: Поисковая система выполняет исходный запрос и анализирует контент Топ-N (например, 50) результатов.
Генерация Центроида: Из этих результатов извлекаются наиболее значимые термины, которые объединяются в Query Vector (или Centroid). Этот вектор представляет контекст запроса.
Поиск Кандидатов: Система сравнивает этот Query Vector с базой данных ранее вычисленных центроидов (Centroid Repository) других запросов.
Ранжирование Кандидатов: Находятся наиболее похожие центроиды (используя Dot Product), которые преобразуются обратно в текстовые запросы (Candidate Queries).
Фильтрация и Разнообразие: Применяется строгий фильтр. Кандидат добавляется в список предложений, только если он лексически отличается (более чем на 50% терминов) от исходного запроса и от уже выбранных предложений.

Актуальность для SEO

Высокая (концептуально). Принципы, заложенные в патенте — использование результатов поиска для понимания контекста запроса и необходимость разнообразия в подсказках (например, в блоках "Related Searches") — фундаментальны для современных поисковых систем. Хотя конкретные методы, такие как Centroids и Dot Product, вероятно, были заменены более продвинутыми нейросетевыми эмбеддингами (BERT, MUM), общая концепция остается крайне актуальной.

Важность для SEO

Патент имеет умеренно-высокое значение для SEO (6.5/10). Он не описывает алгоритмы ранжирования напрямую, но критически важен для понимания того, как Google определяет контекст темы и как он направляет поисковый путь пользователя. Патент подчеркивает, что контент, который ранжируется в топе, напрямую формирует понимание запроса системой и влияет на то, какие связанные запросы будут предложены.

Термины и определения

Candidate Queries (Кандидаты в предлагаемые запросы): Набор потенциальных запросов, сгенерированных системой на основе сходства контекста с исходным запросом. Они проходят фильтрацию перед показом пользователю.
Centroid (Центроид): Векторное представление, которое описывает наиболее распространенные и значимые термины в наборе документов. Используется для представления контекста запроса (см. Query Vector).
Centroid Repository (Репозиторий Центроидов): База данных, хранящая предварительно вычисленные центроиды для большого количества запросов (например, из логов поиска).
Disjunction (Дизъюнкция): Логическое объединение терминов с помощью оператора OR. Используется для эффективного поиска совпадающих центроидов в репозитории (например, "car OR rental OR Denver").
Dot Product (Скалярное произведение): Математическая операция, используемая для вычисления степени сходства между двумя векторами (например, между Query Vector и центроидом из репозитория).
Filtering Module (Модуль Фильтрации): Компонент системы, отвечающий за применение фильтров разнообразия к Candidate Queries для выбора финального набора предложений.
Query Vector (Вектор Запроса): Centroid, сгенерированный на лету для текущего запроса пользователя. Он создается путем объединения Term Vectors из Топ-N результатов поиска по этому запросу.
Term Vector (Вектор Терминов): Векторное представление отдельного документа, содержащее 'm' наиболее взвешенных (значимых) терминов этого документа.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает полный процесс генерации контекстуальных и разнообразных подсказок.

Система получает исходный запрос.
Выбираются документы, релевантные запросу (Топ-N).
Для каждого документа генерируется Term Vector (наиболее взвешенные термины).
Из Term Vectors генерируется search query centroid (Query Vector), представляющий собой наиболее общие термины среди векторов.
Выполняется поиск в Centroid Repository для нахождения ранее сохраненных центроидов, совпадающих с текущим.
Вычисляется Dot Product для определения степени сходства.
Центроиды сортируются по сходству (Dot Product).
Наиболее похожие центроиды преобразуются в Candidate Queries.
Кандидаты проверяются в порядке ранжирования.
Кандидат добавляется в набор предложений, ЕСЛИ он содержит пороговое количество терминов, НЕ включенных в исходный запрос.
Набор предложений предоставляется пользователю.

Claim 2 (Зависимый от 1): Определяет точную формулу для фильтра разнообразия (шаг 10).

Кандидат (qj) добавляется в набор предложений (Z), только если выполняется условие: $(| q_{j} | - | q_{j} \cap z | > 0.5 | z | \forall z \in (Z \cup {u}))$

Это означает, что кандидат должен отличаться более чем на половину своих терминов от исходного запроса И от любого другого запроса, уже добавленного в набор предложений Z. Это обеспечивает строгое лексическое разнообразие.

Claim 4 (Зависимый от 1): Уточняет метод поиска в репозитории (шаг 5).

Система генерирует Disjunction (объединение через OR) наиболее взвешенных терминов из текущего search query centroid. Этот дизъюнктивный запрос используется для эффективного поиска совпадающих центроидов в репозитории.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая данные индексирования с процессом понимания запроса и финальным представлением результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе для документов вычисляются и сохраняются Term Vectors (наиболее взвешенные термины), которые позже используются для генерации центроидов.

QUNDERSTANDING – Понимание Запросов (Офлайн)
Система заранее анализирует логи запросов, выполняет их и генерирует Centroid Repository. Это офлайн-процесс создания базы данных контекстов запросов.

RANKING – Ранжирование
Система выполняет исходный запрос пользователя и генерирует первичный набор результатов (SERP). Топ-N результатов этого этапа используются для дальнейшего анализа.

QUNDERSTANDING – Понимание Запросов (Онлайн) / METASEARCH – Метапоиск
Основное применение патента происходит после генерации первичной выдачи:

Анализ SERP: Система анализирует Топ-N результатов этапа RANKING.
Генерация Контекста: На лету создается Query Vector (Centroid) для определения контекста запроса.
Генерация Подсказок: Query Vector сравнивается с Centroid Repository, генерируются и ранжируются Candidate Queries.
Фильтрация: Применяется формула разнообразия для выбора финального набора подсказок, которые будут показаны пользователю (например, в блоке Related Searches). Патент также упоминает использование этого метода для выбора целевой рекламы.

Входные данные:

Исходный запрос пользователя.
Топ-N результатов поиска по этому запросу.
Term Vectors для этих результатов.
Centroid Repository (предварительно вычисленный).

Выходные данные:

Набор разнообразных, контекстуально релевантных поисковых подсказок.

На что влияет

Типы контента и запросов: Влияет на все типы контента (текст, изображения, видео, как указано в патенте) и запросов. Особенно заметно влияние на информационные и исследовательские запросы, где требуется изучение темы с разных сторон.
Поисковый путь пользователя: Напрямую влияет на то, как пользователи уточняют или расширяют свои поисковые сессии.

Когда применяется

Условия применения: Алгоритм применяется в момент генерации поисковой выдачи для предоставления пользователю связанных запросов (Related Searches) или других форм поисковых подсказок.
Триггеры активации: Активируется при обработке запроса, если система настроена на генерацию подсказок и может найти подходящих кандидатов в репозитории.

Пошаговый алгоритм

Процесс А: Обработка запроса и генерация подсказок в реальном времени

Получение запроса: Система получает исходный запрос (Uq).
Выполнение запроса: Запрос выполняется, определяются Топ-N (например, 50) результатов.
Генерация Вектора Запроса (Vuq):
- Для каждого из Топ-N результатов извлекается или генерируется Term Vector (Топ-M наиболее взвешенных терминов).
- Эти Term Vectors объединяются для создания Centroid (Vuq), представляющего контекст запроса.
Генерация Кандидатов:
- Создается Disjunction из наиболее взвешенных терминов Vuq (например, Топ-3 термина через OR).
- Выполняется поиск в Centroid Repository с использованием этой дизъюнкции.
- Вычисляется сходство (Dot Product) между Vuq и найденными центроидами.
- Центроиды ранжируются по сходству. Топ-K центроидов преобразуются обратно в текстовые запросы (Список кандидатов L).
Фильтрация и Диверсификация:
- Инициализируется пустой набор предложений (Z). Устанавливается максимальный размер MAX (например, 5).
- Система итерирует по ранжированному списку кандидатов L (запрос qj).
- Проверка разнообразия: Проверяется, отличается ли qj более чем на 50% своих терминов от исходного запроса Uq И от всех запросов, уже добавленных в Z (согласно формуле).
- Если ДА: qj добавляется в Z.
- Процесс останавливается, когда Z достигает размера MAX или список L исчерпан.
Возврат результата: Набор предложений Z возвращается пользователю.

Процесс Б: Офлайн-генерация Репозитория Центроидов

Сбор данных: Система анализирует логи предыдущих запросов (real-world queries).
Генерация Центроидов: Для каждого значимого запроса выполняются шаги 2 и 3 Процесса А.
Сохранение: Сгенерированные центроиды и соответствующие им текстовые запросы сохраняются в Centroid Repository.

Какие данные и как использует

Данные на входе

Контентные факторы: Критически важные данные. Используется фактический текст контента страниц, ранжирующихся в Топ-N. Система анализирует "highest-weighted terms" (наиболее взвешенные термины) в этих документах. Вес термина может определяться с помощью TF-IDF или аналогичных метрик значимости слова в контексте документа.
Поведенческие факторы: Centroid Repository строится на основе анализа логов предыдущих пользовательских запросов.

Какие метрики используются и как они считаются

Term Weights (Веса терминов): Используются для создания Term Vectors. Определяют значимость термина в документе.
Dot Product (Скалярное произведение): Используется как мера сходства между Query Vector и центроидами в репозитории. Более высокое значение указывает на большее сходство контекста.
Lexical Difference/Overlap (Лексическое различие/пересечение): Ключевая метрика для фильтрации. Рассчитывается по формуле: $(| q_{j} | - | q_{j} \cap z | > 0.5 | z |)$

Контекст определяется контентом, а не только ключевыми словами: Патент демонстрирует, что Google определяет контекст и интент запроса не просто анализируя текст запроса, а путем анализа контента, который фактически ранжируется по этому запросу (Топ-N результатов).
SERP как источник контекста: Состав и содержание топовой выдачи напрямую диктуют, какие связанные запросы будут предложены. Система генерирует Centroid (контекстный вектор) на основе Топ-N результатов.
Влияние высокоранжирующегося контента: Сайты, находящиеся в Топ-N (например, Топ-50), активно участвуют в формировании контекстуального понимания (Centroid) данного запроса. Если ваш контент ранжируется высоко, он влияет на то, как Google интерпретирует тему.
Разнообразие как обязательное условие: Система активно обеспечивает лексическое разнообразие в подсказках. Предложения, слишком похожие на исходный запрос, отфильтровываются с помощью строгой математической формулы (более 50% различий).
Промежуточное представление контекста: Google использует промежуточные векторные представления (Centroids или современные эмбеддинги) для сравнения контекстов различных запросов, даже если они не имеют общих ключевых слов.

Best practices (это мы делаем)

Укрепление тематического авторитета (Topical Authority): Необходимо стремиться к стабильному ранжированию в Топ-N по всему кластеру связанных запросов. Это позволяет влиять на формирование контекстуального понимания (Centroids) всей темы, а не только отдельных запросов.
Семантическая насыщенность контента: Используйте богатый и релевантный словарь, включающий синонимы, связанные сущности и терминологию, характерную для ниши. Это гарантирует, что ваш контент вносит значимый вклад в Centroid через "highest-weighted terms".
Анализ связанных запросов (Related Searches): Регулярно анализируйте подсказки, которые Google предлагает для ваших целевых запросов. Эти подсказки являются прямым отражением вычисленного контекста (Centroid). Убедитесь, что ваш контент покрывает эти связанные области для укрепления релевантности.
Оптимизация под контекст, а не под ключевое слово: Создавайте контент, который соответствует общему контексту (консенсусу), сформированному топовыми результатами. Если ваш контент сильно выбивается из общего тематического вектора SERP, его релевантность может быть поставлена под сомнение.

Worst practices (это делать не надо)

Keyword Stuffing и фокус на точном вхождении: Фокусировка только на основном ключевом слове без использования связанной терминологии не поможет повлиять на более широкий контекст, фиксируемый Centroid.
Создание поверхностного контента (Thin Content): Контент, лишенный семантической глубины, не будет содержать значимых "weighted terms" и, следовательно, не внесет существенного вклада в расчет Centroid, даже если попадет в Топ-N.
Игнорирование интента, сформированного выдачей: Попытка ранжировать контент, который не соответствует доминирующему контексту Топ-N результатов, будет затруднена, так как этот контекст используется системой для валидации релевантности.

Стратегическое значение

Патент подтверждает стратегическую важность понимания контекста на уровне темы, а не отдельного запроса. Он показывает механизм, с помощью которого Google использует уже ранжирующийся контент для калибровки своего понимания запросов. Для SEO это означает, что стратегия должна быть направлена на доминирование в тематическом контексте. Влияние на подсказки — это не только источник дополнительного трафика, но и индикатор того, насколько сильно ваш сайт ассоциируется с темой в системах Google.

Практические примеры

Сценарий: Анализ и фильтрация подсказок (Пример из патента)

Исходный запрос (Uq): "mars exploration" (2 термина).
Кандидаты (L), ранжированные по контекстному сходству:
1. "mars attacks"
2. "rover mission"
3. "mars rover 2003"
Фильтрация (Порог 50%):
- Кандидат 1: "mars attacks" (2 термина). Пересечение с Uq: "mars" (1 термин). Различие: 2 - 1 = 1. Порог для Uq: 0.5 * 2 = 1. Условие (1 > 1) не выполняется. Кандидат отклонен (слишком похож).
- Кандидат 2: "rover mission" (2 термина). Пересечение с Uq: 0. Различие: 2 - 0 = 2. Условие (2 > 1) выполняется. Кандидат принят в набор Z.
- Кандидат 3: "mars rover 2003" (3 термина).
  Проверка с Uq: Пересечение 1 ("mars"). Различие 3-1=2. Условие (2 > 1) выполняется.
  Проверка с Z ("rover mission"): Пересечение 1 ("rover"). Различие 3-1=2. Порог для Z: 0.5 * 2 = 1. Условие (2 > 1) выполняется.
  Кандидат принят в набор Z.
Результат: Пользователю предлагаются подсказки "rover mission" и "mars rover 2003", которые контекстуально связаны (похожие центроиды), но лексически разнообразны.

Что такое Centroid (Центроид) в контексте этого патента?

Centroid — это векторное представление, которое суммирует контекст запроса. Он создается путем анализа Топ-N результатов поиска по этому запросу и извлечения из них наиболее значимых и часто встречающихся терминов (highest-weighted terms). По сути, это тематический отпечаток того, о чем говорится на страницах, которые хорошо ранжируются по данному запросу.

Как именно контент моего сайта влияет на генерацию этих подсказок?

Если ваш сайт стабильно находится в Топ-N результатов (например, Топ-50, как указано в патенте) по определенному запросу, контент вашей страницы напрямую участвует в генерации Centroid для этого запроса. Значимые термины с вашей страницы становятся частью этого контекстного вектора. Чем авторитетнее и семантически богаче ваш контент, тем сильнее вы влияете на определение контекста темы в Google.

Почему Google просто не предлагает самые контекстуально похожие запросы?

Потому что самые похожие запросы часто являются лексически почти идентичными исходному запросу (например, изменение окончаний, добавление стоп-слов). Патент направлен на устранение этой избыточности. Система использует строгий фильтр разнообразия, требующий, чтобы предложенный запрос отличался более чем на 50% терминов от исходного.

Что означает формула фильтрации (|qj| - |qj ∩ z| > 0.5|z|)?

Эта формула гарантирует лексическое разнообразие. Она проверяет, что количество уникальных терминов в предлагаемом запросе (qj) по сравнению с существующим запросом (z, который может быть исходным запросом или уже выбранной подсказкой) превышает половину длины существующего запроса. Это математический способ сказать: "предлагай только те запросы, которые существенно отличаются по написанию".

Что такое Centroid Repository и как он создается?

Это база данных, хранящая предварительно вычисленные контекстные векторы (Centroids) для миллионов запросов. Он создается офлайн путем анализа исторических логов поиска. Система обрабатывает эти запросы, анализирует их результаты и сохраняет полученные центроиды для быстрого доступа в будущем.

Использует ли Google этот механизм сейчас, учитывая возраст патента (подача 2005 г.)?

Концептуально — да. Принципы использования результатов поиска для понимания контекста и обеспечения разнообразия подсказок остаются ключевыми. Однако техническая реализация, скорее всего, изменилась. Вместо Centroids на основе TF-IDF и Dot Product, современные системы (BERT, MUM) используют плотные нейросетевые эмбеддинги для более глубокого понимания контекста и сходства.

Как использовать этот патент для улучшения SEO-стратегии?

Ключевой вывод — необходимость фокусироваться на Topical Authority и семантической глубине. Чтобы влиять на контекст темы, нужно постоянно присутствовать в Топ-N результатах с контентом, который содержит богатый набор релевантных терминов. Анализируйте предлагаемые Google подсказки как индикатор текущего контекста и расширяйте свой контент для его покрытия.

Что такое "Term Vector" и чем он отличается от "Query Vector"?

Term Vector — это представление отдельного документа, содержащее его самые важные термины. Query Vector (или Centroid запроса) — это агрегированное представление, созданное путем объединения Term Vectors нескольких топовых документов, ранжирующихся по данному запросу. Первый описывает документ, второй — контекст запроса.

Что такое "Disjunction" и зачем она используется?

Disjunction — это способ ускорить поиск похожих центроидов. Вместо сравнения текущего Query Vector со всеми векторами в базе данных, система берет Топ-3 (например) самых важных термина из Query Vector и ищет в базе только те центроиды, которые содержат хотя бы один из этих терминов (Term1 OR Term2 OR Term3). Это сужает пространство поиска.

Влияет ли этот патент на ранжирование моего сайта?

Напрямую — нет. Патент описывает механизм генерации подсказок, а не ранжирования документов. Однако он влияет косвенно: формируя контекст запроса (Centroid), он определяет "идеальное" тематическое направление для контента по этому запросу. Кроме того, он влияет на поисковый путь пользователя, направляя его на связанные запросы, где ваш сайт может получить дополнительный трафик.

Как Google сегментирует сложные запросы на смысловые компоненты для генерации поисковых подсказок и связанных запросов

Google использует механизм для генерации уточнений запроса (поисковых подсказок или связанных запросов) путем разделения исходного запроса на семантические компоненты (устойчивые фразы) с помощью вероятностного анализа. Система находит уточнения для каждого компонента по отдельности, а затем рекомбинирует их, сохраняя исходный порядок. Финальные кандидаты строго фильтруются на основе пользовательских данных (CTR) и синтаксической схожести.

US9703871B1
2017-07-11

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete

Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.

US20140108445A1
2014-04-17

Персонализация
Поведенческие сигналы
Семантика и интент

Как Google анализирует сессии пользователей и кластеризует концепции для генерации блока "Связанные запросы" (Related Searches)

Google анализирует последовательности запросов пользователей в рамках одной сессии для выявления шаблонов уточнений. Система кластеризует эти уточнения по смыслу, анализируя контент ранжирующихся по ним документов или другие запросы, ведущие на эти документы. Это позволяет предлагать пользователям концептуально различные варианты для сужения или изменения темы поиска.

US8065316B1
2011-11-22

Семантика и интент
SERP
Поведенческие сигналы

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories

Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.

US8775436B1
2014-07-08

Мультимедиа
Семантика и интент
SERP

Как Google использует контент, который вы сейчас просматриваете, для фильтрации и уточнения вашей поисковой выдачи

Google анализирует контекст веб-страницы или документа, который просматривает пользователь, чтобы определить основную тему (топик). Когда пользователь вводит запрос, система фильтрует результаты поиска, отдавая предпочтение тем документам, которые соответствуют этой контекстной теме, тем самым уточняя выдачу для неоднозначных запросов.

US8762368B1
2014-06-24

Семантика и интент
SERP
Персонализация

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика

Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.

US9031929B1
2015-05-12

Поведенческие сигналы
EEAT и качество

Как Google динамически перестраивает SERP в реальном времени, основываясь на взаимодействии пользователя с подзадачами

Google использует специализированные AI-модели для разбивки сложных запросов (задач) на подзадачи. Система отслеживает, с какими подзадачами взаимодействует пользователь, и динамически обновляет выдачу, подгружая больше релевантного контента для этой подзадачи прямо во время скроллинга страницы. Это позволяет уточнять интент пользователя в реальном времени.

US20250209127A1
2025-06-26

SERP
Поведенческие сигналы
Семантика и интент

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов

Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.

US9971746B2
2018-05-15

Структура сайта
SERP
Ссылки

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)

Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.

US20250005303A1
2025-01-02

SERP
EEAT и качество
Персонализация

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче

Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.

US8392429B1
2013-03-05

Ссылки
SERP
EEAT и качество

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов

Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.

US8423538B1
2013-04-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов

Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.

US8200694B1
2012-06-12

Local SEO
Поведенческие сигналы
Семантика и интент

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта

Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.

US9348846B2
2016-05-24

Структура сайта
SERP
Ссылки

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования

Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.

US7783644B1
2010-08-24

Поведенческие сигналы
Индексация
Семантика и интент