Как Google проверяет и отбирает редкие (long-tail) запросы для поисковых подсказок (Autocomplete)

INFREQUENT QUERY VARIANTS FOR USE AS QUERY SUGGESTIONS (Варианты редких запросов для использования в качестве поисковых подсказок)

US20150120773A1
Google LLC
2011-10-26
2015-04-30

Google использует механизм для валидации редких поисковых запросов, чтобы определить, стоит ли добавлять их в поисковые подсказки (Autocomplete). Редкие запросы нормализуются (каноникализируются) и сравниваются с популярными запросами. Если редкий запрос семантически эквивалентен популярному, он признается качественным и допускается к показу в подсказках. Это позволяет Google предлагать разнообразные и полезные long-tail подсказки, отсеивая спам и бессмысленные запросы.

Какую проблему решает

Патент решает проблему оценки качества и полезности редких (infrequent) или "длиннохвостых" (long-tail) запросов, найденных в логах поиска. Из-за того, что такие запросы встречаются редко (sparse nature), сложно определить, являются ли они полезными формулировками, спамом или бессмыслицей. Если система подсказок (например, Autocomplete) полагается только на популярные запросы, она не сможет помочь пользователям, вводящим редкие или нестандартные формулировки. Цель изобретения — идентифицировать качественные редкие запросы, чтобы расширить покрытие и разнообразие поисковых подсказок.

Что запатентовано

Запатентована система валидации редких запросов для использования в качестве поисковых подсказок. Механизм основан на предположении, что если редкий запрос семантически эквивалентен популярному запросу, то этот редкий запрос также является качественным и полезным. Для проверки эквивалентности используется процесс каноникализации (canonicalization) — приведения запросов к стандартной форме. Если каноническая форма редкого запроса совпадает с канонической формой популярного запроса, редкий запрос получает статус «разрешенного» (permitted) для использования в системе подсказок.

Как это работает

Система работает в несколько этапов офлайн:

Классификация: Анализируются логи запросов. Запросы делятся на Infrequent Queries (встречаются реже первого порога) и Popular Queries (встречаются чаще второго порога).
Каноникализация: И редкие, и популярные запросы преобразуются в Canonical Representations с помощью правил (удаление стоп-слов, стемминг, сортировка слов).
Сопоставление: Канонические формы редких запросов сравниваются с каноническими формами популярных запросов.
Валидация: Если каноническая форма редкого запроса совпадает с формой хотя бы одного популярного запроса, редкий запрос валидируется.
Хранение: Валидированные редкие запросы сохраняются как разрешенные для использования.

В реальном времени Suggestion Engine использует этот список разрешенных редких запросов для генерации подсказок пользователю.

Актуальность для SEO

Высокая. Системы поисковых подсказок (Google Autocomplete) и блоки связанных запросов являются ключевыми элементами пользовательского интерфейса. Эффективная обработка long-tail запросов и предоставление разнообразных, но качественных подсказок остается приоритетной задачей для улучшения пользовательского опыта. Описанные методы каноникализации и валидации через сопоставление с популярными запросами являются фундаментальными для работы с большими объемами пользовательских данных.

Важность для SEO

Патент имеет высокое значение для SEO, особенно в области исследования ключевых слов (Keyword Research) и контент-стратегии. Он раскрывает механизм, с помощью которого Google определяет семантическую связь между head-запросами и long-tail запросами. Понимание этого механизма позволяет понять, какие именно формулировки Google считает валидными вариациями основного интента и как формируется спрос через Autocomplete. Это напрямую влияет на стратегию охвата семантического ядра и использования естественного языка в контенте.

Термины и определения

Canonical Representation (Каноническое представление): Стандартизированная форма запроса, полученная после применения правил каноникализации. Используется для сравнения различных запросов на предмет семантической эквивалентности.
Canonicalization Rules (Правила каноникализации): Набор правил для преобразования запроса в его каноническую форму. Может включать стемминг, удаление стоп-слов, сортировку терминов и т.д.
Infrequent Query (Редкий запрос): Запрос из логов, который был отправлен менее, чем First threshold number раз.
Infrequent Query Selection Engine (Система выбора редких запросов): Компонент, отвечающий за обработку логов и валидацию редких запросов.
Log Files (Лог-файлы): Хранилище данных о прошлых поисковых сессиях пользователей.
Popular Query (Популярный запрос): Запрос из логов, который был отправлен как минимум Second threshold number раз.
Stemming (Стемминг): Процесс приведения слова к его основе или корню путем отсечения окончаний и суффиксов.
Stop Words (Стоп-слова): Часто встречающиеся слова (артикли, предлоги, союзы), которые часто удаляются при обработке текста, так как не несут значительной смысловой нагрузки.
Suggestion Engine (Система подсказок): Компонент, который в реальном времени предоставляет пользователю поисковые подсказки (например, Autocomplete).
Threshold Numbers (Пороговые значения): Числовые значения (First, Second, Third), используемые для классификации запросов по частотности.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки лога прошлых запросов.

Идентификация Infrequent Queries (частотность ниже первого порога).
Реформулирование (каноникализация) этих редких запросов в Canonical Representations.
Идентификация редких запросов, чьи канонические представления совпадают с каноническим представлением хотя бы одного Popular Query (частотность выше второго порога). Сравнение происходит между каноническими формами.
Выбор этих совпадающих редких запросов.
Сохранение данных, идентифицирующих выбранные редкие запросы как разрешенные (permitted) для использования при определении поисковых подсказок.

Claim 3 (Зависимый): Уточняет процесс отклонения.

Редкие запросы, чьи канонические представления НЕ совпадают ни с одним популярным запросом, отклоняются и не используются для генерации подсказок в ответ на будущие запросы.

Claims 6 и 7 (Зависимые): Детализируют правила каноникализации.

Canonicalization rules включают стемминг (stemming) терминов в запросах (Claim 6).
Canonicalization rules включают упорядочивание канонических форм терминов на основе предопределенного порядка (например, алфавитного) (Claim 7).

Claim 8 (Зависимый от 1): Описывает альтернативный механизм валидации через агрегацию.

Идентификация набора (set) редких запросов, которые имеют одинаковое Canonical Representation.
Вычисление суммы вхождений всех этих редких запросов в логе.
Определение, что эта сумма превышает третье пороговое значение (third threshold number).
В ответ на это определение, все редкие запросы в этом наборе сохраняются как разрешенные для использования в подсказках.

Этот механизм позволяет валидировать концепцию, которая популярна в сумме, но выражена множеством разных редких формулировок, даже если нет ни одного доминирующего «популярного запроса».

Где и как применяется

Изобретение применяется на этапе понимания запросов и напрямую связано с работой системы поисковых подсказок.

QUNDERSTANDING – Понимание Запросов
Основное применение патента происходит на этом этапе в режиме офлайн-обработки данных. Infrequent Query Selection Engine анализирует Log Files для понимания взаимосвязей между запросами и валидации long-tail запросов.

Анализ логов и классификация: Система определяет частотность запросов и классифицирует их как редкие или популярные.
Каноникализация и сопоставление: Система генерирует канонические формы и ищет совпадения для валидации редких запросов.
Генерация списка разрешенных запросов: Создается база данных или список запросов, одобренных для подсказок.

Взаимодействие с компонентами (Real-Time):

Suggestion Engine (Система подсказок): В реальном времени, когда пользователь вводит запрос, Suggestion Engine обращается к списку разрешенных запросов (включая валидированные редкие запросы), чтобы сгенерировать подсказки (например, Autocomplete или Related Searches).

Входные данные:

Log Files прошлых поисковых запросов.
Canonicalization Rules (правила стемминга, список стоп-слов, правила сортировки).
Пороговые значения (Threshold Numbers) для определения редкости и популярности.

Выходные данные:

Данные, идентифицирующие выбранные редкие запросы как разрешенные (permitted) для использования в подсказках.
(Опционально) Данные, связывающие выбранные редкие запросы с соответствующими популярными запросами (Claim 2).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на long-tail запросы, вопросительные формулировки, и запросы на естественном языке. Система позволяет этим запросам появляться в Autocomplete.
Разнообразие подсказок: Увеличивает лингвистическое разнообразие предлагаемых подсказок для популярных концепций.
Качество подсказок: Фильтрует спам, бессмысленные или слишком нишевые запросы из логов, не позволяя им попадать в Autocomplete, если они не связаны с популярной концепцией.

Когда применяется

Условия работы алгоритма (Офлайн): Алгоритм валидации применяется периодически при обработке накопленных логов поисковых запросов.
Условия работы алгоритма (Real-Time): Результаты работы алгоритма (список разрешенных запросов) используются каждый раз, когда пользователь взаимодействует с поисковой строкой и активируется Suggestion Engine.

Пошаговый алгоритм

Процесс А: Валидация редких запросов через популярные (Основной процесс)

Сбор и классификация данных: Анализ Log Files. Идентификация Infrequent Queries (ниже Порога 1) и Popular Queries (выше Порога 2).
Каноникализация: Применение Canonicalization Rules (стемминг, удаление стоп-слов, сортировка) ко всем редким и популярным запросам для создания Canonical Representations.
Сопоставление (Matching): Сравнение канонической формы каждого редкого запроса с каноническими формами всех популярных запросов (например, с помощью join-type operation).
Отбор (Selection): Выбор редких запросов, для которых найдено хотя бы одно совпадение с популярным запросом.
Фильтрация (Rejection): Отклонение редких запросов, для которых совпадений не найдено.
Сохранение результатов: Сохранение отобранных редких запросов в базе данных как разрешенных (permitted) для использования в подсказках.

Процесс Б: Валидация через агрегацию редких запросов (Альтернативный процесс)

Группировка: Идентификация наборов (sets) различных редких запросов, имеющих идентичное Canonical Representation.
Агрегация частотности: Суммирование количества вхождений всех запросов внутри каждого набора.
Проверка порога: Определение, превышает ли суммарная частотность набора Порог 3.
Отбор (Selection): Если порог превышен, все редкие запросы в этом наборе помечаются как разрешенные.
Сохранение результатов: Сохранение отобранных запросов в базе данных.

Процесс В: Использование в реальном времени (Suggestion Engine)

Получение ввода пользователя: Получение частичного или полного запроса от пользователя.
Выбор кандидатов: Suggestion Engine выбирает кандидатов для подсказок из списка разрешенных запросов (включая популярные и валидированные редкие), используя стандартные методы (например, prefix-based matching).
Предоставление подсказок: Отправка выбранных подсказок пользователю.

Какие данные и как использует

Данные на входе

Поведенческие факторы: Основной источник данных — Log Files прошлых запросов. Учитывается частота отправки запросов. В некоторых реализациях может учитываться количество уникальных пользователей, отправивших запрос (на основе уникальных cookie идентификаторов).
Контентные (Лингвистические) факторы: Используются лингвистические данные для каноникализации: словари для стемминга, списки стоп-слов.

Какие метрики используются и как они считаются

First threshold number (Первый порог): Определяет максимальную частотность для классификации запроса как Infrequent Query.
Second threshold number (Второй порог): Определяет минимальную частотность для классификации запроса как Popular Query. (Может быть равен первому порогу или выше).
Third threshold number (Третий порог): Определяет минимальную суммарную частотность набора семантически эквивалентных редких запросов для их валидации (Процесс Б). (Часто равен второму порогу).
Методы анализа текста (Каноникализация):
- Стемминг: Приведение слов к основе.
- Удаление стоп-слов: Исключение незначащих слов.
- Сортировка: Упорядочивание оставшихся терминов (например, по алфавиту) для обеспечения независимости от порядка слов в исходном запросе.
- Также упоминаются: удаление пунктуации, приведение к нижнему регистру, удаление диакритических знаков, нормализация URL.
Методы сравнения: Используется точное совпадение (exact matching) канонических представлений. В патенте также упоминается возможность использования неточного совпадения (soft matching), например, на основе расстояния редактирования (edit distance).

Валидация Long-Tail через Head-запросы: Ключевой вывод — Google использует популярные запросы как эталон качества для валидации редких запросов. Редкий запрос считается полезным, если он является лингвистической вариацией популярного интента.
Каноникализация как мера семантической эквивалентности: Патент демонстрирует, как Google определяет семантическую эквивалентность запросов. Используются агрессивные методы нормализации: стемминг, игнорирование стоп-слов и игнорирование порядка слов. Это означает, что система фокусируется на ключевых концепциях внутри запроса.
Autocomplete — это не только популярность: Система подсказок стремится не просто показать самые частые запросы, но и охватить разнообразие формулировок для популярных концепций, при этом активно фильтруя низкокачественные или спамные запросы.
Агрегация интента (Механизм Б): Система может признать концепцию популярной, даже если нет единой доминирующей формулировки. Популярность может достигаться суммированием множества различных редких запросов, имеющих одинаковую каноническую форму.
Фильтрация шума в логах: Механизм служит важным фильтром, предотвращая попадание случайных, бессмысленных или спамных запросов из логов в системы, ориентированные на пользователя (Autocomplete).

Best practices (это мы делаем)

Фокус на концепциях, а не на точных формулировках: При создании контента ориентируйтесь на охват интента (концепции), а не на конкретную высокочастотную ключевую фразу. Поскольку Google агрессивно каноникализирует запросы (игнорируя порядок слов, стоп-слова и окончания), разные формулировки будут приведены к единой форме.
Использование естественного языка и разнообразных формулировок: Используйте синонимы, вопросительные формы и различные способы выражения одного и того же интента в тексте и заголовках. Это повышает вероятность соответствия валидированным редким запросам, которые Google активно продвигает в подсказках.
Анализ Autocomplete для исследования Long-Tail: Активно используйте Google Autocomplete для поиска ключевых слов. Патент подтверждает, что подсказки, даже если они кажутся редкими, прошли валидацию (скорее всего, связаны с популярной концепцией) и являются качественными формулировками с точки зрения системы.
Создание контента под агрегированный интент (Механизм Б): Если вы видите множество низкочастотных запросов в своей нише, которые семантически означают одно и то же, стоит создавать контент, охватывающий их все. Google может агрегировать этот спрос и валидировать эти запросы для подсказок.

Worst practices (это делать не надо)

Оптимизация под бессмысленные или спамные запросы: Попытки манипулировать логами или оптимизировать контент под запросы, которые не связаны с реальными популярными интентами, не приведут к их появлению в Autocomplete. Они будут отфильтрованы, так как их каноническая форма не совпадет с популярными запросами.
Чрезмерное внимание к порядку слов и стоп-словам (для семантического ядра): Не стоит тратить ресурсы на создание отдельных страниц для незначительно отличающихся формулировок (например, отличающихся только порядком слов или наличием предлогов), если их каноническая форма идентична. Google рассматривает их как один и тот же запрос на этапе анализа интента.
Игнорирование Long-Tail вариаций: Стратегия, сфокусированная только на самых высокочастотных (Head) запросах, упускает возможность охватить пользователей, которые используют валидированные редкие формулировки.

Стратегическое значение

Патент подчеркивает важность семантического понимания запросов Google. Он показывает, как система связывает разнообразные пользовательские формулировки с основными интентами. Для SEO это означает, что стратегия должна быть направлена на построение Topical Authority и глубокое раскрытие тем, используя естественный язык. Понимание механизмов каноникализации помогает эффективнее кластеризовать семантическое ядро и понимать, какие запросы Google считает дубликатами, а какие — уникальными вариациями интента.

Практические примеры

Сценарий: Валидация Long-Tail запроса для Autocomplete

Анализ логов: Google анализирует логи и видит следующие запросы:
- [planting ginger root] (Популярный запрос, 1000 раз)
- [can ginger root be planted] (Редкий запрос, 2 раза)
- [ginger root how to plant] (Редкий запрос, 3 раза)
- [buy cheap ginger online fast] (Редкий запрос, 1 раз)
Каноникализация: Применяются правила (стемминг, удаление стоп-слов, алфавитная сортировка).
- [planting ginger root] -> [ginger plant root]
- [can ginger root be planted] -> [ginger plant root]
- [ginger root how to plant] -> [ginger plant root]
- [buy cheap ginger online fast] -> [buy cheap fast ginger online]
Сопоставление: Система сравнивает редкие запросы с популярным.
- Первые два редких запроса совпадают с популярным.
- Третий редкий запрос не совпадает.
Валидация: Запросы [can ginger root be planted] и [ginger root how to plant] помечаются как разрешенные (permitted). Запрос [buy cheap ginger online fast] отклоняется (если нет других популярных запросов, с которыми он совпадает).
Применение (Autocomplete): Когда пользователь начинает вводить "can ginger root...", система подсказок теперь может предложить валидированный запрос [can ginger root be planted], хотя он сам по себе встречается редко.

Как Google определяет, является ли запрос «редким» или «популярным»?

Система анализирует логи поисковых запросов и подсчитывает частоту каждого запроса. Затем эта частота сравнивается с предопределенными пороговыми значениями (Threshold Numbers). Если частота ниже первого порога, запрос считается редким (Infrequent). Если выше второго порога — популярным (Popular). Эти пороги могут быть фиксированными или динамическими.

Что такое каноникализация запроса в контексте этого патента?

Это процесс приведения запроса к стандартной, нормализованной форме для сравнения с другими запросами. Патент описывает агрессивную каноникализацию, включающую стемминг (приведение слов к основе), удаление стоп-слов (предлоги, артикли) и сортировку оставшихся слов (например, по алфавиту). Цель — сделать так, чтобы запросы с одинаковым смыслом, но разной формулировкой, имели идентичное каноническое представление.

Почему Google просто не показывает все редкие запросы в подсказках?

Логи содержат много шума: спам, бессмысленные наборы символов, опечатки или слишком специфичные запросы, не полезные широкой аудитории. Патент описывает механизм фильтрации этого шума. Редкий запрос допускается в подсказки, только если он валидирован — то есть доказано, что он является вариацией популярного, качественного запроса.

Как этот патент влияет на исследование ключевых слов (Keyword Research)?

Он подтверждает важность анализа Google Autocomplete как источника качественных long-tail запросов. Если запрос появился в подсказках, значит, он прошел валидацию и связан с популярным интентом. Также это подчеркивает необходимость фокусироваться на концепциях и интентах, а не зацикливаться на точных формулировках, так как система агрессивно нормализует запросы.

Игнорирует ли Google порядок слов в запросе согласно этому патенту?

Да, на этапе каноникализации для сравнения интентов. Одно из правил каноникализации (Claim 7) — это упорядочивание терминов в запросе по предопределенному порядку (например, алфавитному). Это означает, что запросы [ginger plant root] и [root plant ginger] будут считаться идентичными на этом этапе анализа.

Что произойдет, если много людей ищут одну и ту же вещь, но разными редкими фразами (Механизм Б)?

Патент предусматривает такой сценарий (Claim 8). Система группирует все редкие запросы с одинаковой канонической формой и суммирует их частоту. Если суммарная частота превышает порог популярности, то все эти редкие формулировки валидируются и допускаются в подсказки, даже если нет единого доминирующего популярного запроса.

Влияет ли этот механизм на ранжирование сайтов?

Патент напрямую описывает только процесс отбора запросов для Suggestion Engine (подсказок), а не ранжирование результатов поиска. Однако, появление запроса в Autocomplete косвенно влияет на SEO, так как увеличивает видимость и частоту использования этого запроса пользователями, что может привести к росту трафика по нему.

Стоит ли создавать отдельные страницы под запросы, отличающиеся только предлогами или окончаниями?

С точки зрения этого патента, такие запросы будут иметь одинаковую каноническую форму из-за стемминга и удаления стоп-слов. Это подтверждает практику объединения таких запросов в один кластер и оптимизации одной страницы под весь кластер, вместо создания множества дублирующих страниц.

Как использовать знание об этом патенте для улучшения контент-стратегии?

Необходимо обеспечить максимальное лингвистическое разнообразие при раскрытии темы. Используйте естественный язык, вопросительные конструкции, различные синонимы и релевантные термины. Это увеличит релевантность вашего контента широкому спектру валидированных long-tail запросов, которые Google предлагает пользователям через Autocomplete.

Могу ли я повлиять на то, чтобы мой редкий запрос появился в Autocomplete?

Напрямую — сложно. Однако, если ваш редкий запрос является естественной и логичной вариацией популярного интента (т.е. имеет ту же каноническую форму, что и популярный запрос), и он появится в логах (например, через контекстную рекламу или прямые заходы), у него есть шанс пройти валидацию по описанному механизму и попасть в Autocomplete.

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности

Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.

US8868591B1
2014-10-21

Семантика и интент

Как Google Autocomplete обрезает начало длинных фраз, чтобы показать популярные подсказки

Google использует механизм для улучшения подсказок в Autocomplete. Если пользователь вводит длинную или редкую фразу, которая не дает хороших подсказок, система удаляет начальные слова (префикс) и ищет подсказки для оставшейся части (суффикса). Это гарантирует показ популярных запросов, основанных на логах поиска, даже если пользователь начал ввод нетипичным образом.

US9031970B1
2015-05-12

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно

Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.

US9235654B1
2016-01-12

Семантика и интент

Как Google создает новые поисковые подсказки (Autocomplete), комбинируя структуры и термины из прошлых запросов

Google расширяет покрытие поисковых подсказок (Autocomplete), создавая новые, ранее не использованные запросы. Система анализирует логи, находит запросы с похожей структурой (шаблоны), определяет семантически близкие термины (используя distributional similarity) и комбинирует их. Это позволяет предлагать пользователям релевантные подсказки, даже если такой запрос никогда ранее не вводился.

US8521739B1
2013-08-27

Семантика и интент

Как Google консолидирует оценки популярности и фильтрует подсказки в Autocomplete для оптимизации выдачи

Google использует механизм консолидации оценок в Autocomplete: популярность длинных запросов суммируется с популярностью их коротких префиксов. Это позволяет точнее определить реальный спрос. Затем система фильтрует список, предпочитая более длинные и информативные подсказки коротким, если длинная подсказка составляет значительную часть популярности короткой, оптимизируя интерфейс пользователя.

US8713042B1
2014-04-29

SERP

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets

Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.

US9448992B2
2016-09-20

Семантика и интент
EEAT и качество
Индексация

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи

Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.

US8825639B2
2014-09-02

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя

Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.

US9116952B1
2015-08-25

Семантика и интент
Поведенческие сигналы

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче

Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.

US9418156B2
2016-08-16

Local SEO
SERP
Ссылки

Как Google персонализирует сниппеты и заголовки в выдаче на основе истории поиска и интересов пользователя

Google может динамически изменять сниппеты и заголовки (Title) результатов поиска, чтобы выделить ту часть контента на странице, которая соответствует известным интересам пользователя (история поиска, демография, недавний контекст). Это позволяет сделать представление выдачи более персонализированным, не обязательно изменяя ранжирование документов.

US9235626B2
2016-01-12

Персонализация
SERP
Семантика и интент

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях

Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.

US10628511B2
2020-04-21

Ссылки
Индексация
Поведенческие сигналы

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток

Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.

US9465871B1
2016-10-11

Антиспам
SERP
Ссылки

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента

Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.

US8959093B1
2015-02-17

Поведенческие сигналы
Ссылки
SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок

Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.

US12353458B2
2025-07-08

Ссылки
Семантика и интент
SERP

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска

Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.

US20150006290A1
2015-01-01

Поведенческие сигналы
Персонализация
Local SEO