Как Google рассчитывает оценки для связанных запросов (Related Searches) на основе частоты терминов и популярности уточнений

SEARCH QUERY SUGGESTIONS (Предложения поисковых запросов)

US8515985B1
Google LLC
2011-06-24
2013-08-20

Google анализирует логи поисковых сессий, чтобы понять, как пользователи уточняют свои запросы. Система вычисляет, какие термины чаще всего встречаются в этих уточнениях (Term Occurrence Score) и насколько популярен сам путь уточнения (Refinement Rate). На основе этих метрик формируются релевантные поисковые подсказки и блоки «Связанные запросы».

Какую проблему решает

Патент решает проблему сложности формулирования точных и эффективных поисковых запросов. Пользователи, особенно в незнакомых тематиках, часто начинают с общих, неоднозначных или слишком узких запросов. Это требует ручного уточнения, что занимает время. Изобретение автоматизирует этот процесс, предлагая релевантные подсказки (suggested queries), основанные на анализе того, как другие пользователи ранее уточняли аналогичные запросы.

Что запатентовано

Запатентован метод расчета оценок для потенциальных уточнений запроса (query refinements). Система анализирует логи прошлых запросов (Log Files) и использует два ключевых типа оценок: Term Occurrence Scores (TOS), которые измеряют частоту отдельных терминов внутри всего набора уточнений, и Query Refinement Scores (QRS), которые агрегируют TOS для оценки качества конкретного кандидата. Также учитывается популярность самого пути уточнения (Refinement Rate).

Как это работает

Система работает в несколько этапов:

Сбор данных и Идентификация: Анализируются логи сессий для выявления последовательностей запросов (Q1 → Q2). Составляется список уникальных кандидатов (Candidate Query Refinements) для Q1.
Расчет TOS: Система подсчитывает, как часто каждый термин встречается во всем списке кандидатов, и вычисляет Term Occurrence Score. Для обработки редких терминов может применяться сглаживание (Smoothing).
Расчет QRS: Для каждого кандидата вычисляется Query Refinement Score, обычно как сумма TOS его терминов, нормализованная по длине запроса.
Оценка популярности: Вычисляется Refinement Rate, отражающий, насколько часто пользователи переходили от Q1 именно к этому уточнению.
Выбор подсказок: Suggestion Engine использует комбинацию QRS и оценок популярности для выбора лучших предложений (например, в блоке "Related Searches").

Актуальность для SEO

Средне-Высокая. Концепция предложения уточнений на основе поведения пользователей остается фундаментальной для функций "Related Searches" и "Autocomplete". Хотя конкретные статистические методы, описанные в патенте (модель "мешка слов", явные формулы нормализации), вероятно, были дополнены или заменены более сложными нейросетевыми моделями (эмбеддинги, трансформеры), описанный механизм дает базовое понимание принципов оценки предлагаемых запросов.

Важность для SEO

Влияние на SEO умеренное (6.5/10). Патент не описывает алгоритмы ранжирования основного поиска, но он критически важен для понимания того, как Google направляет пользователей к смежным темам и специфическим нишам. Понимание механизма расчета QRS и Refinement Rate помогает SEO-специалистам анализировать пути пользователей ("Related Searches"), оптимизировать контент под эти уточнения и строить Topical Authority.

Термины и определения

Candidate Query Refinements (Кандидаты в уточнения запроса): Уникальный список запросов, которые были идентифицированы в логах как уточнения (последующие запросы) для данного исходного запроса.
Global Refinement Count (Глобальный счетчик уточнений): Общее количество раз, когда конкретный запрос (Q2) выступал в качестве уточнения для любого исходного запроса в логе.
Log Files (Лог-файлы): Хранилище данных о прошлых поисковых сессиях пользователей, включающее последовательности введенных запросов.
Query Refinement (Уточнение запроса): Запрос, который пользователь вводит после исходного запроса в рамках одной сессии. Уточнение не обязательно должно содержать термины исходного запроса (например, "Лондон" → "Англия").
Query Refinement Popularity Score / Refinement Rate (Оценка популярности уточнения / Частота уточнения): Метрика популярности перехода от Q1 к Q2. Рассчитывается как Specific Refinement Count, деленный на Global Refinement Count.
Query Refinement Score (QRS) (Оценка уточнения запроса): Итоговая оценка, рассчитываемая для кандидата в уточнения, обычно основанная на Term Occurrence Scores его составных терминов.
Smoothing (Сглаживание): Техника корректировки статистических данных (например, добавление константы к счетчикам) для уменьшения влияния шума и малых выборок.
Specific Refinement Count (Специфический счетчик уточнений): Количество раз, когда пользователи перешли от конкретного исходного запроса (Q1) к конкретному уточнению (Q2).
Suggestion Engine (Механизм предложений): Компонент системы, который использует рассчитанные оценки (QRS, Popularity Score) для выбора и отображения предложений пользователю.
Term Occurrence Score (TOS) (Оценка встречаемости термина): Метрика, показывающая частоту встречаемости конкретного термина внутри всего списка Candidate Query Refinements для данного запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод идентификации и оценки уточнений запроса.

Идентификация кандидатов в уточнения запроса (candidate query refinements) для данного запроса на основе прошлых запросов пользователей.
Генерация Term Occurrence Scores (TOS) для терминов в этих кандидатах, отражающих частоту этих терминов.
Расчет Query Refinement Scores (QRS) для кандидатов с использованием TOS.
Расчет Query Refinement Popularity Score для конкретного кандидата. Это включает генерацию Первого счетчика уточнений (First refinement count, основанного на частоте этого кандидата в логе) и Второго счетчика уточнений (Second refinement count). (Примечание: В контексте патента это соответствует расчету Specific и Global Refinement Counts для определения Refinement Rate).
Хранение данных, связывающих QRS и Popularity Score с кандидатами для последующего выбора предложений.

Claim 2 и 3 (Зависимые): Детализируют расчет TOS.

Генерация счетчиков встречаемости (occurrence counts) для терминов путем подсчета их появления в кандидатах (Claim 2).
(Claim 3) Введение механизма сглаживания (Smoothing): генерация модифицированных счетчиков путем добавления константы к исходным счетчикам. Эти модифицированные счетчики затем используются для генерации TOS. Это стабилизирует результаты при малом количестве данных.

Claim 4 и 5 (Зависимые): Детализируют расчет QRS.

(Claim 4) Расчет QRS для кандидата использует сумму TOS отдельных терминов внутри этого кандидата И количество отдельных терминов в нем (нормализация по длине).
(Claim 5) Приводится конкретная формула расчета QRS: $QRS = \frac{\sum_{k=1}^{h} TOS(T_k)}{\sqrt{h}}$ . Где $TOS(T_k)$ — это TOS для k-го термина, а h — общее количество терминов в кандидате. Система суммирует TOS всех терминов и делит на квадратный корень из длины запроса, штрафуя длинные запросы.

Где и как применяется

Изобретение применяется на этапах, связанных с пониманием запросов и формированием пользовательского интерфейса.

CRAWLING (Data Acquisition/Logging)
Система собирает и хранит Log Files, содержащие последовательности запросов пользователей в рамках сессий. Эти данные являются входными для всего процесса.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения. Refinement Engine анализирует собранные логи в офлайн-режиме для идентификации кандидатов и расчета всех метрик (TOS, QRS, Popularity Score). Это часть глобального моделирования прогрессии пользовательского интента.

METASEARCH / RERANKING (Формирование SERP)
На этапе формирования выдачи Suggestion Engine обращается к базе данных рассчитанных оценок. Он использует QRS и Popularity Score для выбора и ранжирования предложений, которые будут показаны в блоке «Related Searches» или в выпадающем списке автодополнения (Auto-Suggest).

Входные данные:

Log Files (последовательности запросов пользователей) (офлайн).
Исходный запрос пользователя (онлайн).

Выходные данные:

База данных, связывающая исходные запросы с кандидатами в уточнения и их оценками (офлайн).
Отсортированный список предложений для показа пользователю (онлайн).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на широкие, информационные или неоднозначные запросы, где пользователям часто требуется помощь в сужении темы (например, "London", "baseball glove").
Конкретные типы контента: Патент упоминает возможность использования дополнительных сигналов, например, в поиске по картинкам. TOS может рассчитываться на основе меток (labels) наиболее высоко ранжированных изображений по исходному запросу.

Когда применяется

Временные рамки: Основные вычисления происходят офлайн в пакетном режиме. Использование данных происходит онлайн в реальном времени при вводе запроса пользователем.
Условия работы: Алгоритм применяется, когда в логах существует достаточно данных о том, как пользователи ранее уточняли данный запрос. Для новых или очень редких запросов данных может быть недостаточно.

Пошаговый алгоритм

Офлайн-процесс: Расчет оценок уточнений

Идентификация уточнений: Анализ Log Files для поиска последовательностей запросов (Q1 → Q2) в рамках пользовательских сессий.
Агрегация и фильтрация: Агрегация всех уточнений (Q2) для данного исходного запроса (Q1). Уточнения, встречающиеся реже порогового значения, могут быть отфильтрованы.
Генерация списка кандидатов: Создание уникального списка Candidate Query Refinements для Q1.
Расчет Оценок Популярности: Для каждого кандидата Q2 рассчитывается Refinement Rate = Specific Refinement Count (Q1→Q2) / Global Refinement Count (Any→Q2).
Моделирование и сегментация: Каждый кандидат рассматривается как неупорядоченный набор слов (bag-of-words). Кандидаты сегментируются на отдельные термины.
Расчет счетчиков встречаемости (Occurrence Counts): Подсчет, сколько раз каждый уникальный термин встречается во всем списке кандидатов.
Сглаживание (Smoothing): Применение сглаживания путем добавления константы (x) к счетчику каждого термина. Это уменьшает влияние шума при малых выборках.
Расчет TOS: Вычисление Term Occurrence Score для каждого термина. Например, путем деления (сглаженного) счетчика термина на сумму всех счетчиков.
Расчет QRS: Вычисление Query Refinement Score для каждого кандидата путем суммирования TOS всех терминов в кандидате и нормализации по длине запроса (делением на квадратный корень из количества терминов).
Финальная оценка (Опционально): QRS может быть скомбинирован с Refinement Rate с использованием весовых коэффициентов для получения финальной оценки.
Хранение данных: Сохранение связи между Q1 и его кандидатами Q2 вместе с их финальными оценками.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Это основной тип данных. Система полагается на Log Files, содержащие историю поисковых запросов и последовательности, в которых пользователи их вводили (данные сессий).
Контентные факторы (Косвенно): В одном из вариантов реализации упоминается, что для расчета TOS могут использоваться данные из результатов поиска (например, метки топовых изображений в поиске по картинкам).

Какие метрики используются и как они считаются

Система вычисляет несколько ключевых метрик:

Occurrence Count: Простой подсчет частоты термина в списке кандидатов.
Term Occurrence Score (TOS): Нормализованная частота термина. Пример (Eq. 1 в патенте): $TOS(T_j) = \frac{Occurrence(T_j)}{\sum_{i=1}^{n} Occurrence(T_i)}$ (Счетчик термина, деленный на сумму всех счетчиков).
Query Refinement Score (QRS): Агрегированная оценка для всего запроса-кандидата. Основная формула (Eq. 3): $QRS(Q_m) = \frac{\sum_{k=1}^{h} TOS(T_k)}{\sqrt{h}}$ (Сумма TOS терминов, деленная на квадратный корень из количества терминов).
Refinement Rate: Метрика популярности перехода. Specific Refinement Count / Global Refinement Count.
Методы анализа текста: Используется простая модель "мешок слов" (bag-of-words), где порядок слов не важен.

Двойная оценка релевантности подсказок: Google оценивает потенциальные подсказки по двум основным критериям: тематическая релевантность (QRS, основанный на частоте терминов TOS) и популярность пути (Refinement Rate, основанный на поведении пользователей).
Важность отдельных терминов (TOS): Ключевым фактором является то, насколько часто составные термины уточнения встречаются среди всех возможных уточнений. Термины, часто используемые для уточнения темы (высокий TOS), имеют больший вес.
Нормализация по длине (Предпочтение краткости): Формула QRS ( $Sum(TOS)/\sqrt{h}$ ) явно включает нормализацию по длине запроса (h). Это означает, что система предпочитает более короткие и емкие уточнения, содержащие термины с высоким TOS, а не длинные многословные запросы.
Обработка разреженных данных (Smoothing): Механизм сглаживания позволяет стабилизировать оценки TOS, предотвращая переоценку или недооценку терминов на основе малых выборок (шума).
Зависимость от коллективного поведения: Система полагается на анализ логов сессий как на источник данных о том, как люди исследуют информацию. Это подчеркивает важность поведенческих факторов в понимании интента.

Best practices (это мы делаем)

Анализ "Related Searches" и Autocomplete: Регулярно анализируйте блоки "Связанные запросы" и автодополнение для ваших целевых запросов. Это прямой индикатор того, какие Candidate Query Refinements получили высокий QRS и Refinement Rate.
Идентификация ключевых терминов (TOS-драйверов): Определяйте термины, которые часто повторяются в предложенных уточнениях. Согласно патенту, эти термины имеют высокий Term Occurrence Score и являются семантически важными для темы в глазах Google.
Построение Topical Authority вокруг TOS-драйверов: Убедитесь, что ваш контент всесторонне охватывает эти ключевые термины. Если по запросу "baseball glove" часто предлагаются уточнения со словом "leather" (высокий TOS для "leather"), ваш контент должен детально раскрывать тему кожаных перчаток.
Оптимизация под предложенные пути (User Journey): Создавайте контент и структуру сайта, оптимизированные под запросы, которые Google активно предлагает в качестве уточнений. Это пути, по которым система направляет пользователей, и соответствие им увеличивает релевантность всего тематического кластера.
Оптимизация внутренней перелинковки: Связывайте страницы, соответствующие последовательности запросов с высоким Refinement Rate. Если пользователи часто переходят от запроса А к запросу Б, на странице А должна быть явная ссылка на страницу Б.

Worst practices (это делать не надо)

Игнорирование предложений Google: Рассматривать "Related Searches" как второстепенный элемент. Эти предложения являются важными индикаторами пользовательского интента и того, как Google структурирует информацию по теме на основе поведения пользователей.
Фокус только на основном ВЧ-запросе: Оптимизация страницы только под один высокочастотный запрос без учета смежных терминов и уточнений, которые пользователи реально ищут дальше.
Создание искусственных уточнений: Попытки манипулировать логами запросов для продвижения нужных уточнений. Система основана на анализе больших объемов данных и использует механизмы сглаживания для борьбы с шумом.

Стратегическое значение

Патент подчеркивает важность понимания пути пользователя за пределами начального запроса. Он демонстрирует, как Google использует данные о поведении масс для определения тематической релевантности и взаимосвязей между запросами. Для SEO-стратегии это означает, что построение комплексных тематических кластеров (Topic Clusters), которые отвечают не только на исходный запрос, но и на последующие высоко оцененные уточнения, является ключом к достижению Topical Authority и соответствию User Journey.

Практические примеры

Сценарий: Оптимизация категории E-commerce "Кроссовки"

Анализ исходного запроса: Вводим "Кроссовки".
Изучение уточнений (Related Searches/Auto-Suggest): Наблюдаем подсказки: "мужские кроссовки", "женские кроссовки", "кроссовки Nike", "кроссовки для бега", "белые кроссовки".
Интерпретация (на основе патента):
- Термины "мужские", "женские", "Nike", "бег", "белые", вероятно, имеют высокий TOS в наборе уточнений для "Кроссовки".
- Запросы типа "кроссовки Nike" имеют высокий QRS (популярные термины + короткая длина) и высокий Refinement Rate.
Действия SEO-специалиста:
- Убедиться, что на главной странице категории "Кроссовки" присутствуют эти ключевые термины (High TOS).
- Создать подкатегории или оптимизированные фильтры, точно соответствующие этим уточнениям ("Кроссовки для бега", "Белые кроссовки").
- Организовать навигацию и перелинковку так, чтобы пользователи могли легко перейти от общего раздела к этим уточненным подразделам, повторяя популярный путь поиска.

Что такое Term Occurrence Score (TOS) и почему он важен?

Term Occurrence Score (TOS) — это метрика, которая показывает, насколько часто конкретный термин встречается среди всех возможных уточнений исходного запроса. Это важно, потому что TOS является основой для расчета итоговой оценки предложения (Query Refinement Score). Термины с высоким TOS считаются наиболее важными для исследования темы пользователями, и уточнения, содержащие эти термины, будут предлагаться чаще.

В чем разница между Query Refinement Score (QRS) и Refinement Rate (Popularity Score)?

QRS оценивает тематическую согласованность уточнения на основе частоты его терминов (TOS). Высокий QRS означает, что запрос состоит из терминов, которые часто используются для уточнения данной темы. Refinement Rate оценивает популярность конкретного пути: как часто пользователи переходили от исходного запроса именно к этому уточнению. Система использует оба показателя.

Как длина запроса влияет на его шансы стать предложенным уточнением?

Длина запроса оказывает негативное влияние. Формула QRS делит сумму TOS на квадратный корень из количества слов в запросе ( $\sqrt{h}$ ). Это означает, что при прочих равных более короткие и емкие уточнения, содержащие термины с высоким TOS, получат преимущество перед длинными запросами.

Что такое "сглаживание" (Smoothing) и зачем оно нужно?

Сглаживание — это техника, описанная в Claim 3, которая заключается в добавлении константы к счетчикам встречаемости терминов перед расчетом TOS. Это необходимо для обработки ситуаций с малым количеством данных. Если термин встретился 1 раз, а другой 2 раза, соотношение 1:2 может быть случайным шумом. Добавление константы стабилизирует оценки при малых выборках.

Как этот патент влияет на блок "Related Searches" (Связанные запросы)?

Этот патент напрямую описывает механизм для оценки и выбора запросов, которые отображаются в блоке "Related Searches" (и, возможно, в Auto-Suggest). Запросы, которые вы видите там, — это Candidate Query Refinements, которые получили наивысший Query Refinement Score (QRS) и/или Popularity Score, рассчитанные описанным методом.

Могу ли я повлиять на то, какие запросы Google предлагает для моей темы?

Прямое влияние сложно, так как система основана на анализе поведения миллионов пользователей. Однако косвенно повлиять можно, создавая авторитетный контент, который всесторонне охватывает тему и использует терминологию, популярную среди пользователей. Если ваш сайт станет основным источником информации по определенным уточнениям, это может повлиять на поведение пользователей и, со временем, на логи запросов.

Как использовать информацию из этого патента для построения семантического ядра?

Анализируйте "Related Searches" и Autocomplete для выявления терминов с высоким TOS и путей с высоким Refinement Rate. Эти термины и запросы должны стать обязательной частью вашего семантического ядра. Это поможет создать структуру сайта и контент-план, которые соответствуют реальным путям исследования темы пользователями (User Journey).

Применяется ли этот механизм в поиске по картинкам?

Да, патент упоминает применение в поиске по картинкам. В этом случае для расчета Term Occurrence Scores могут использоваться не только логи запросов, но и анализ меток (labels) или описаний наиболее высоко ранжированных изображений по исходному запросу. Это позволяет генерировать предложения, специфичные для визуального контента.

Является ли этот патент устаревшим, учитывая развитие нейронных сетей?

Хотя методы анализа запросов эволюционировали (например, использование векторных эмбеддингов вместо простого подсчета частоты терминов), базовая идея использования поведения пользователей для генерации предложений остается актуальной. Этот патент описывает эффективный статистический метод, и его принципы (анализ логов, оценка популярности, нормализация) по-прежнему лежат в основе работы систем предложений.

Что важнее для попадания в предложения: наличие ключевого слова в уточнении или его семантическая связь?

В контексте данного патента важнее статистическая связь, выявленная через поведение пользователей. Патент определяет Query Refinement как любой последующий запрос, даже если он не содержит терминов исходного запроса (например, "London" → "England"). Система оценивает релевантность через частоту совместного использования в сессиях, а не только через лексическое совпадение.

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

US8392443B1
2013-03-05

Семантика и интент
Поведенческие сигналы

Как Google сегментирует сложные запросы на смысловые компоненты для генерации поисковых подсказок и связанных запросов

Google использует механизм для генерации уточнений запроса (поисковых подсказок или связанных запросов) путем разделения исходного запроса на семантические компоненты (устойчивые фразы) с помощью вероятностного анализа. Система находит уточнения для каждого компонента по отдельности, а затем рекомбинирует их, сохраняя исходный порядок. Финальные кандидаты строго фильтруются на основе пользовательских данных (CTR) и синтаксической схожести.

US9703871B1
2017-07-11

Семантика и интент
SERP
Поведенческие сигналы

Как Google комбинирует временные тренды и контекстуальный анализ для определения схожести поисковых запросов

Google использует систему машинного обучения для определения схожести между запросами путем объединения разнородных сигналов. Система анализирует как временные паттерны использования терминов в разных источниках (Temporal Correlation), так и контекст, в котором термины появляются в интернете (Distributional Similarity). Комбинация этих данных позволяет генерировать более точные поисковые подсказки и связанные запросы.

US8478699B1
2013-07-02

Семантика и интент

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google предлагает контекстные уточнения запроса на основе взаимодействия пользователя с текстом в строке поиска

Google использует механизм для предложения уточнений запроса, основанный на том, с какой частью (токеном) исходного запроса взаимодействует пользователь в строке поиска. Когда пользователь выделяет или кликает на слово, система определяет контекст и предлагает релевантные замены именно для этой части, используя алгоритм "голосования по перекрытиям" и сортировку по качеству/популярности для выбора лучших вариантов.

US7917528B1
2011-03-29

Семантика и интент
SERP
Поведенческие сигналы

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам

Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.

US8209330B1
2012-06-26

Поведенческие сигналы
SERP
Мультимедиа

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц

Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.

US7308643B1
2007-12-11

Ссылки
Индексация
Техническое SEO

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта

Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.

US7962462B1
2011-06-14

Поведенческие сигналы
Ссылки
SERP

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей

Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.

US9244972B1
2016-01-26

EEAT и качество
Семантика и интент
SERP

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени

Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.

US9235653B2
2016-01-12

Knowledge Graph
Свежесть контента
Семантика и интент

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче

Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.

US8392429B1
2013-03-05

Ссылки
SERP
EEAT и качество

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи

Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).

US9298777B2
2016-03-29

Персонализация
Поведенческие сигналы
SERP

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства

Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.

US8868592B1
2014-10-21

Персонализация
Поведенческие сигналы
Local SEO

Как Google автоматически определяет важность различных частей веб-страницы (DOM-узлов) для ранжирования

Google анализирует коллекции похожих структурированных документов (например, товарных карточек) и создает общую модель (DOM). Затем система изучает логи запросов и кликов, чтобы понять, какие части структуры (заголовки, основной контент, реклама) чаще всего содержат ключевые слова из успешных запросов. Этим частям присваивается больший вес при расчете релевантности.

US8538989B1
2013-09-17

Семантика и интент
Индексация
Структура сайта

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска

Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.

US8447760B1
2013-05-21

Поведенческие сигналы
Персонализация
Семантика и интент