Как Google группирует свежие варианты запросов для быстрого выявления трендов в Автозаполнении (Autocomplete)

IDENTIFYING RECENTLY SUBMITTED QUERY VARIANTS FOR USE AS QUERY SUGGESTIONS (Идентификация недавно отправленных вариантов запросов для использования в качестве предлагаемых запросов)

US20150178278A1
Google LLC
2012-03-13
2015-06-25

Google использует механизм для быстрого выявления новых трендов в поиске. Система анализирует "свежие запросы", приводит их к канонической форме и группирует варианты с одинаковым смыслом. Если группа набирает достаточную совокупную популярность, эти запросы добавляются в Автозаполнение (Query Suggestions), позволяя предлагать актуальные подсказки, даже если каждый отдельный вариант еще не популярен.

Какую проблему решает

Патент решает проблему "устаревания" (staleness) поисковых подсказок (Query Suggestions, Автозаполнение). Системы, основанные только на исторически популярных запросах, медленно реагируют на новые тренды, актуальные события или вирусный контент. Также решается проблема разреженности данных (data sparsity) для новых тем: пользователи формулируют свежий интент по-разному, и ни одна формулировка по отдельности может не набрать достаточной популярности, чтобы быть замеченной системой.

Что запатентовано

Запатентована система для агрегации популярности семантически схожих "свежих запросов" (fresh queries). Система периодически анализирует недавно введенные запросы, приводит их к каноническому виду (canonical representation) и группирует варианты, выражающие один и тот же интент. Вычисляется совокупная оценка популярности группы (group popularity score), что позволяет быстро идентифицировать зарождающиеся тренды и добавлять их в поисковые подсказки.

Как это работает

Система (Fresh Query Engine) работает следующим образом:

Идентификация: Анализируются логи запросов за короткий, актуальный временной интервал (current time interval), например, за последние 24-48 часов.
Каноникализация: Свежие запросы нормализуются с помощью правил (canonicalization rules), включающих стемминг, удаление стоп-слов и упорядочивание терминов.
Группировка: Запросы с идентичными каноническими формами объединяются в группы (например, "snow in london" и "snows in london").
Оценка популярности: Для каждой группы рассчитывается group popularity score, основанный на суммарной частоте всех запросов в группе.
Валидация: Если оценка группы превышает пороговое значение (threshold popularity score), запросы из этой группы помечаются как разрешенные для использования в Suggestion Engine.

Актуальность для SEO

Высокая. Быстрое выявление трендов и предоставление актуальных подсказок в Автозаполнении остается критически важной задачей для поисковых систем (концепция QDF - Query Deserves Freshness). Механизмы, описанные в патенте, лежат в основе способности Google реагировать на текущие события и изменения в информационных потребностях пользователей в реальном времени.

Важность для SEO

Влияние на SEO значительное (7/10). Патент не описывает механизмы ранжирования документов, но он критически важен для Real-Time SEO и новостных сайтов. Он объясняет, как Google интерпретирует свежий спрос и формирует Автозаполнение. Это напрямую влияет на анализ трендов и контент-стратегию, позволяя специалистам быстрее идентифицировать актуальные темы и понимать, какие формулировки запросов Google считает семантически идентичными.

Термины и определения

Canonical Representation (Каноническое представление): Стандартизированная форма запроса, полученная после применения правил каноникализации. Используется для группировки различных вариантов запроса, имеющих одинаковый интент. Например, запросы "snow in london" и "is there snow in london" могут иметь каноническое представление "london snow".
Canonicalization Rules (Правила каноникализации): Набор правил для преобразования запроса в стандартную форму. Может включать стемминг (stemming), удаление стоп-слов, упорядочивание терминов (например, по алфавиту), удаление пунктуации, перевод в нижний регистр.
Current Time Interval (Текущий временной интервал): Период времени, за который анализируются запросы для выявления свежих трендов. Обычно это короткий интервал (например, 24-48 часов или менее), в течение которого сложно оценить популярность запросов по отдельности.
Fresh Query (Свежий запрос): Запрос, отправленный пользователями в течение Current Time Interval.
Group Popularity Score (Оценка популярности группы): Метрика, отражающая совокупную популярность всех свежих запросов, объединенных в одну группу (имеющих одинаковое Canonical Representation). Рассчитывается на основе частоты отправки этих запросов в течение Current Time Interval.
Individual Popularity Score (Индивидуальная оценка популярности): Метрика популярности отдельного свежего запроса, основанная на частоте его отправки в течение Current Time Interval.
Suggestion Engine (Система генерации подсказок): Компонент, который в ответ на ввод пользователя (частичный или полный запрос) выбирает и предоставляет поисковые подсказки.
Threshold Popularity Score (Пороговая оценка популярности): Минимальное значение Group Popularity Score, необходимое для того, чтобы запросы из группы были разрешены для использования в качестве подсказок.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки запросов.

Идентификация множества fresh queries, отправленных в течение current time interval.
Преобразование этих запросов в соответствующие canonical representations с использованием canonicalization rules.
Выбор группы свежих запросов, основанный на том, что они имеют совпадающие (matching) канонические представления.
Расчет group popularity score для этой группы, основанный на количестве отправок одного или нескольких запросов из группы в течение интервала.
Определение того, удовлетворяет ли group popularity score пороговому значению (threshold popularity score).
В случае положительного ответа, сохранение данных, идентифицирующих свежие запросы в этой группе как разрешенные (permitted) для использования при определении query suggestion.

Ядро изобретения — это метод агрегации популярности семантически близких, но текстуально различных свежих запросов через механизм каноникализации. Это позволяет системе преодолеть проблему нехватки данных по отдельным вариантам и быстро идентифицировать общий тренд на уровне группы.

Claim 4 (Зависимый): Детализирует расчет Group Popularity Score.

Расчет individual popularity scores для каждого свежего запроса в группе на основе частоты его отправки.
Использование этих индивидуальных оценок для расчета оценки группы.

Claim 5 (Зависимый от 4): Уточняет, что расчет оценки группы может быть суммой индивидуальных оценок.

Claim 6 и 7 (Зависимые от 4): Предлагают альтернативный вариант расчета оценки группы: использование индивидуальных оценок только для предопределенного числа наиболее популярных запросов в группе (например, только Топ-1, как указано в Claim 7).

Claims 9 и 10 (Зависимые): Уточняют, что Canonicalization Rules могут включать стемминг терминов (Claim 9) и упорядочивание канонических форм терминов в соответствии с предопределенным порядком, например, алфавитным (Claim 10).

Где и как применяется

Изобретение применяется в системах обработки запросов и генерации поисковых подсказок.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система (Fresh Query Engine) выполняет периодический офлайн (или near real-time) анализ логов запросов для идентификации новых трендов и интентов. Процессы каноникализации, группировки и оценки популярности направлены на понимание того, что ищут пользователи прямо сейчас, и как они это формулируют.

Взаимодействие с компонентами:

Records (Логи запросов): Источник данных о свежих запросах и их частотности.
Fresh Query Engine: Выполняет анализ, каноникализацию и оценку.
Suggestion Engine: Использует выходные данные (список разрешенных свежих запросов) для генерации подсказок в реальном времени в ответ на ввод пользователя.

Входные данные:

Логи запросов (Records), отправленных пользователями.
Определение Current Time Interval.
Набор Canonicalization Rules.

Выходные данные:

Данные (например, список запросов), идентифицирующие свежие запросы, которые разрешено использовать в качестве Query Suggestions.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, связанные с актуальными событиями, новостями (breaking news), вирусным контентом и новыми трендами (QDF). Меньшее влияние на "вечнозеленые" (evergreen) темы.
Конкретные ниши или тематики: Влияет на динамичные ниши: Новости, Спорт, Развлечения, Технологии (запуски продуктов).

Когда применяется

Частота применения: Алгоритм выполняется периодически (periodically) для анализа самой последней порции собранных запросов. Интервал может быть коротким (например, 24-48 часов или менее).
Условия работы и Триггеры: Анализ запускается для обработки данных, накопленных с момента последнего анализа. Активация для конкретной группы происходит, когда её Group Popularity Score превышает Threshold Popularity Score.

Пошаговый алгоритм

Процесс выбора свежих запросов для использования в качестве поисковых подсказок:

Идентификация свежих запросов: Система идентифицирует fresh queries, которые были отправлены в течение current time interval. Также подсчитывается частота каждого запроса (Individual Popularity Score).
Каноникализация запросов: Идентифицированные запросы преобразуются в их canonical representations с использованием canonicalization rules (стемминг, удаление стоп-слов, упорядочивание терминов).
Группировка запросов: Система идентифицирует группы свежих запросов, где запросы в группе имеют совпадающие канонические представления. Запросы без совпадений могут быть отклонены.
Расчет популярности группы: Для каждой группы рассчитывается group popularity score. Это может быть сумма индивидуальных оценок популярности всех запросов в группе или функция от оценок наиболее популярных запросов в группе.
Проверка порога популярности: Система проверяет, удовлетворяет ли group popularity score пороговому значению (threshold popularity score).
Сохранение разрешенных запросов: Если порог удовлетворен, данные, идентифицирующие свежие запросы в этой группе, сохраняются как разрешенные (permitted) для использования при определении query suggestion.
Итерация: Процесс повторяется для всех групп.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Основные данные — это логи запросов (Records). Используется частота отправки (submission frequency) каждого запроса пользователями.
Временные факторы: Критически важный фактор — Current Time Interval. Анализируются только запросы, попадающие в этот недавний интервал.

Какие метрики используются и как они считаются

Individual Popularity Score: Рассчитывается на основе количества отправок конкретного запроса в течение Current Time Interval.
Group Popularity Score: Агрегированная метрика. Может рассчитываться как:
- Сумма Individual Popularity Scores всех запросов в группе.
- Сумма логарифмов индивидуальных оценок.
- Функция от Individual Popularity Scores предопределенного числа наиболее популярных запросов в группе (например, только самого популярного).
Threshold Popularity Score: Пороговое значение для валидации группы. Может быть фиксированным или определяться на основе статистической информации (уровень достоверности).
Методы анализа текста (Каноникализация):
- Стемминг (Stemming): Приведение слов к их корневой форме.
- Удаление стоп-слов: Исключение общих слов (артикли, предлоги, союзы).
- Упорядочивание (Ordering): Расположение канонических форм терминов в предопределенном порядке (например, алфавитном).
Нормализация и Масштабирование (при смешивании): При интеграции свежих запросов в общий список подсказок (вместе с исторически популярными запросами) их оценки популярности могут масштабироваться. Это делается для компенсации разницы в длительности временных интервалов сбора данных (например, 1 день для свежих против 60 дней для исторических). Оценка свежего запроса может быть умножена на соотношение длительности интервалов, чтобы сделать оценки сопоставимыми.

Агрегация интента, а не формулировки: Google стремится понять зарождающийся интент, независимо от того, как пользователи его формулируют. Механизм группировки позволяет объединить "сигналы" от разных вариантов запроса.
Каноникализация как ключ к семантике свежих запросов: Система использует достаточно агрессивные методы каноникализации (включая изменение порядка слов, стемминг и удаление стоп-слов) для выявления семантической идентичности запросов. Это важно для понимания того, какие запросы Google считает взаимозаменяемыми при анализе трендов.
Скорость важнее исторической статистики для трендов: Патент описывает механизм, позволяющий быстро выводить новые темы в Query Suggestions, не дожидаясь накопления значительной истории по конкретной формулировке.
Совокупная популярность группы: Запрос, который сам по себе не является популярным (низкий Individual Popularity Score), может попасть в Автозаполнение, если он принадлежит к группе, которая в совокупности преодолела порог популярности (высокий Group Popularity Score).
Нормализация по времени: Google учитывает разницу во временных интервалах при сравнении популярности свежих и исторических запросов, используя масштабирование оценок. Это позволяет свежим трендам конкурировать с устоявшимися запросами в Автозаполнении.

Best practices (это мы делаем)

Мониторинг Автозаполнения для выявления трендов: Регулярно отслеживайте изменения в Query Suggestions по вашим основным тематикам. Появление новых подсказок сигнализирует о том, что определенная группа свежих запросов преодолела Threshold Popularity Score. Это индикатор зарождающегося спроса.
Фокус на каноническом интенте при работе с трендами (News SEO): При создании контента под актуальное событие концентрируйтесь на основных сущностях и фактах (каноническом интенте), а не на конкретной формулировке новостного заголовка. Поскольку Google группирует варианты (игнорируя порядок слов и стоп-слова), важно быть релевантным ядру темы.
Анализ вариантов запросов в Google Trends: Используйте Google Trends для анализа того, какие формулировки использует аудитория при поиске свежей информации. Патент подтверждает, что Google видит связь между этими вариантами. Учитывайте все релевантные формулировки в контент-стратегии.
Быстрое создание качественного контента (Speed Factor): Поскольку система быстро выявляет тренды, скорость реакции SEO-команды и редакции критична. Необходимо оперативно создавать контент, отвечающий на новый интент, чтобы занять позиции в формирующейся выдаче.

Worst practices (это делать не надо)

Игнорирование новых подсказок: Рассматривать новые подсказки в Автозаполнении как временный шум — это упущенная возможность. Они являются валидированными системой индикаторами нового спроса.
Оптимизация только под одну формулировку тренда: Фокусироваться только на самом частотном варианте свежего запроса не оптимально. Необходимо учитывать семантическое ядро (каноническую форму), чтобы быть релевантным для всей группы запросов.
Использование только исторических данных Keyword Research: Полагаться исключительно на инструменты, показывающие историческую частотность, неэффективно для работы с трендами. Google использует механизмы для выявления популярности за гораздо более короткие интервалы (часы/дни).

Стратегическое значение

Патент подчеркивает стратегическую важность Real-Time SEO и адаптивности контент-стратегии. Он демонстрирует механизм, с помощью которого Google идентифицирует и валидирует зарождающийся спрос. Для SEO-специалистов это подтверждает необходимость интеграции инструментов мониторинга трендов и Автозаполнения в ежедневные процессы. Понимание принципов каноникализации, описанных в патенте, помогает лучше понять, как Google интерпретирует семантическую близость запросов на ранних этапах.

Практические примеры

Сценарий: Быстрое реагирование на внезапное событие (Breaking News)

Событие: Происходит незапланированное событие, например, "Сбой в работе Сервиса X".
Поведение пользователей (Fresh Queries): Пользователи начинают искать информацию, используя разные формулировки: "Сервис X не работает", "почему упал Сервис X", "Сервис X статус сбоя". Каждая по отдельности имеет низкую частотность.
Работа системы Google: Fresh Query Engine анализирует запросы за последний час (Current Time Interval).
Каноникализация и Группировка: Система применяет Canonicalization Rules. Все вышеуказанные запросы могут быть приведены к схожей канонической форме (например, "[Сервис X] сбой"). Они объединяются в одну группу.
Оценка: Система суммирует частотность всех вариантов. Group Popularity Score быстро превышает Threshold Popularity Score.
Результат в Автозаполнении: Когда новые пользователи начинают вводить "Сервис X н...", система предлагает "Сервис X не работает" в качестве подсказки.
Действия SEO-специалиста: Специалист мониторит Автозаполнение и Google Trends, видит появление нового тренда и оперативно создает/обновляет страницу статуса или новость о сбое, оптимизированную под этот выявленный интент.

Какие именно правила каноникализации использует Google согласно патенту?

Патент явно упоминает несколько конкретных правил (Canonicalization Rules). К ним относятся: стемминг (приведение слов к корневой форме), удаление стоп-слов (артикли, предлоги и т.д.), а также упорядочивание канонических форм терминов в предопределенном порядке (например, алфавитном). Также упоминаются удаление пунктуации и перевод в нижний регистр. Это означает, что порядок слов и их форма могут игнорироваться при определении смысловой близости свежих запросов.

Влияет ли этот патент на ранжирование документов в поиске?

Нет, напрямую этот патент не влияет на ранжирование документов. Он описывает исключительно механизм идентификации и отбора запросов для использования в системе поисковых подсказок (Query Suggestions/Автозаполнение). Однако он влияет на то, какие запросы пользователи будут в итоге отправлять, и дает представление о том, как Google понимает и группирует свежие интенты.

Что такое "свежий запрос" (Fresh Query) и какой временной интервал используется?

Fresh Query — это запрос, отправленный в течение текущего анализируемого интервала (Current Time Interval). Патент не устанавливает точную продолжительность, но указывает, что он обычно короткий (например, 24 или 48 часов или менее). Это интервал времени с момента последнего анализа логов, в течение которого сложно надежно оценить популярность запросов по отдельности.

Как система решает проблему нехватки данных по новым запросам?

Проблема решается путем агрегации данных на уровне группы, а не отдельного запроса. Система каноникализирует свежие запросы и группирует семантически схожие варианты. Затем она вычисляет Group Popularity Score — совокупную популярность всех вариантов в группе. Это позволяет группе преодолеть порог популярности, даже если ни один отдельный запрос этого сделать не смог.

Как SEO-специалист может использовать знание этого патента для контент-стратегии?

Знание этого механизма подчеркивает важность быстрого реагирования на тренды (Real-Time SEO). Необходимо мониторить Автозаполнение для выявления новых подсказок, которые сигнализируют о валидированном спросе. При создании контента под тренд следует фокусироваться на ядре интента (канонической форме), а не зацикливаться на конкретной формулировке, так как Google группирует варианты.

Как система сравнивает популярность свежих запросов и исторических?

Патент описывает механизм нормализации (масштабирования) оценок популярности для компенсации разницы в длительности временных интервалов сбора данных. Если исторические данные собирались за 60 дней, а свежие за 1 день, Individual Popularity Score свежего запроса может быть масштабирован (например, умножен на соотношение 60/1). Это позволяет свежим трендам конкурировать на равных с устоявшимися запросами при формировании списка подсказок.

Все ли запросы из валидированной группы попадают в Автозаполнение?

Патент указывает, что запросы из группы помечаются как "разрешенные для использования" (permitted for use). Это не гарантирует, что все они будут показаны. Финальный выбор подсказок для конкретного пользователя осуществляется Suggestion Engine, который может использовать дополнительные критерии отбора и ранжирования подсказок.

Может ли система использовать только самый популярный запрос из группы для оценки?

Да, патент описывает такую возможность (Claim 6 и 7). В одном из вариантов реализации Group Popularity Score может основываться на Individual Popularity Score предопределенного числа (например, одного или двух) наиболее популярных запросов в группе, а не на сумме всех запросов.

Какая связь между этим патентом и Google Trends?

Механизм, описанный в патенте, напрямую связан с тем, как Google выявляет всплески интереса к темам, что отражается в Google Trends (особенно в разделе "Тренды в реальном времени"). Идентификация групп свежих запросов, преодолевших порог популярности, является технической основой для определения этих трендов.

Означает ли это, что порядок слов в запросе не имеет значения?

В контексте этого конкретного механизма обнаружения трендов — да, порядок слов может игнорироваться, так как одно из правил каноникализации включает упорядочивание терминов (например, по алфавиту). Однако это не означает, что порядок слов не важен для Google в целом, особенно при ранжировании или понимании сложных запросов с помощью современных NLP-моделей.

Как Google создает новые поисковые подсказки (Autocomplete), комбинируя структуры и термины из прошлых запросов

Google расширяет покрытие поисковых подсказок (Autocomplete), создавая новые, ранее не использованные запросы. Система анализирует логи, находит запросы с похожей структурой (шаблоны), определяет семантически близкие термины (используя distributional similarity) и комбинирует их. Это позволяет предлагать пользователям релевантные подсказки, даже если такой запрос никогда ранее не вводился.

US8521739B1
2013-08-27

Семантика и интент

Как Google автоматически создает и ранжирует шаблоны запросов с сущностями для улучшения поисковых подсказок (Autocomplete)

Google использует систему для автоматического обнаружения паттернов в поисковых запросах, которые включают фиксированные термины и сущности из определенной категории (например, «рестораны в [городе]»). Система генерирует шаблоны запросов, оценивает их качество на основе частоты использования, разнообразия сущностей и их распределения, а затем использует эти шаблоны для формирования более точных и структурированных поисковых подсказок в реальном времени.

US9529856B2
2016-12-27

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности

Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.

US8868591B1
2014-10-21

Семантика и интент

Как Google проверяет и отбирает редкие (long-tail) запросы для поисковых подсказок (Autocomplete)

Google использует механизм для валидации редких поисковых запросов, чтобы определить, стоит ли добавлять их в поисковые подсказки (Autocomplete). Редкие запросы нормализуются (каноникализируются) и сравниваются с популярными запросами. Если редкий запрос семантически эквивалентен популярному, он признается качественным и допускается к показу в подсказках. Это позволяет Google предлагать разнообразные и полезные long-tail подсказки, отсеивая спам и бессмысленные запросы.

US20150120773A1
2015-04-30

Семантика и интент
Антиспам

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента

Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.

US9449095B1
2016-09-20

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google использует время просмотра (Watch Time) и поведение пользователей для расчета независимой от запроса оценки качества видео

Google рассчитывает независимый от запроса сигнал качества (Q) для видео, анализируя корреляции между поведенческими метриками: временем просмотра, рейтингами и количеством просмотров. Система использует математические функции (Predictor и Voting) для моделирования качества и определения достоверности данных, а также активно фильтрует спам в рейтингах. Этот сигнал Q затем используется для ранжирования видео в поиске.

US8903812B1
2014-12-02

Поведенческие сигналы
SERP
Антиспам

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)

Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.

US8386495B1
2013-02-26

Поведенческие сигналы
Ссылки
SERP

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках

Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.

US8417692B2
2013-04-09

Семантика и интент
Поведенческие сигналы

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций

Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.

US10180965B2
2019-01-15

Персонализация
Семантика и интент
Local SEO

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования

Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.

US8661029B1
2014-02-25

Поведенческие сигналы
SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank

Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.

US8122026B1
2012-02-21

Семантика и интент
Ссылки
Knowledge Graph

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента

Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.

US8892549B1
2014-11-18

EEAT и качество
Семантика и интент

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов

Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.

US9436709B1
2016-09-06

EEAT и качество
Поведенческие сигналы

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов

Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).

US8090736B1
2012-01-03

Ссылки
SERP
Структура сайта