Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно

QUERY REWRITES FOR GENERATING AUTO-COMPLETE SUGGESTIONS (Переписывание запросов для генерации подсказок автозаполнения)

US9235654B1
Google LLC
2013-02-05
2016-01-12

Семантика и интент

Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.

Какую проблему решает

Патент решает проблему предоставления полезных подсказок автозаполнения (Autocomplete suggestions) для длинных, сложных или редких частичных запросов (partial search queries). Стандартные системы, полагающиеся на префиксное совпадение, часто терпят неудачу, если введенный текст не соответствует началу популярных запросов в базе данных. Это ухудшает пользовательский опыт, так как система не может предложить релевантные варианты завершения запроса.

Что запатентовано

Запатентована система для выборочного переписывания частичных запросов с целью генерации дополнительных подсказок автозаполнения. Если набор подсказок, найденных по исходному частичному запросу, не удовлетворяет предопределенным критериям (predefined criteria) по количеству или качеству, система генерирует набор переписанных частичных запросов (rewritten partial search queries). Переписывание включает удаление опциональных слов или замену терминов синонимами. Затем система ищет полные запросы, соответствующие этим переписанным версиям, и предлагает их пользователю.

Как это работает

Механизм работает следующим образом:

Первичный поиск: Система ищет полные запросы, соответствующие частичному запросу, в базе данных исторических запросов (Historical Complete Queries Database).
Оценка и Триггер: Оценивается количество и качество (например, популярность) найденных подсказок. Если критерии не выполнены, активируется механизм переписывания.
Классификация терминов: Слова в частичном запросе классифицируются как обязательные (required), опциональные (optional) или стоп-слова (stop words).
Генерация переписанных запросов: Создаются новые версии запроса путем удаления опциональных/стоп-слов и/или замены терминов на синонимы, с соблюдением ограничений на количество удаленных слов.
Вторичный поиск и Ранжирование: По переписанным запросам ищутся новые подсказки. Они ранжируются на основе схожести с исходным запросом (Similarity Score) и их популярности (Popularity Metric).
Вывод: Лучшие подсказки из вторичного поиска отправляются пользователю.

Актуальность для SEO

Высокая. Механизм Autocomplete является критически важной частью пользовательского интерфейса Google, особенно на мобильных устройствах. Способность системы обрабатывать сложные и длиннохвостые запросы, направляя пользователей к эффективным формулировкам, остается актуальной задачей. Описанные методы классификации терминов и переписывания лежат в основе современных систем понимания запросов.

Важность для SEO

Влияние на SEO – среднее (65/100). Патент не описывает алгоритмы ранжирования документов, поэтому прямого влияния на позиции сайта нет. Однако он имеет значительное стратегическое и косвенное влияние. Он описывает, как Google формирует поисковые подсказки и, следовательно, направляет поведение пользователей. Понимание того, как Google классифицирует важность терминов и использует синонимы при генерации подсказок, критически важно для исследования ключевых слов и понимания интентов.

Термины и определения

Partial Search Query (Частичный поисковый запрос): Неполный запрос, введенный пользователем в строку поиска.
Complete Search Query (Полный поисковый запрос): Завершенный запрос, который ранее отправлялся пользователями. Хранится в Historical Complete Queries Database и используется как кандидат для подсказки.
Rewritten Partial Search Query (Переписанный частичный поисковый запрос): Модифицированная версия исходного частичного запроса, созданная путем удаления терминов или замены их синонимами.
Required Query Term (Обязательный термин запроса): Термин, который система считает критически важным. Определяется на основе высокого IDF, принадлежности к сущностям (имена, бренды, локации), распознанным n-граммам или если термин является неполным (Incomplete Term).
Optional Query Term (Опциональный термин запроса): Термин, который не является обязательным и не является стоп-словом. Кандидат на удаление или замену при переписывании.
Stop Word Query Term (Стоп-слово): Слово с низкой семантической нагрузкой, определяемое по предопределенному списку.
Incomplete Term (Неполный термин): Термин, который пользователь еще не закончил вводить (определяется по положению курсора). Всегда считается обязательным.
Similarity Score (Оценка схожести): Метрика, определяющая, насколько полный запрос похож на исходный частичный запрос. Включает Term Drop Factor и Edit Distance Factor.
Popularity Metric (Метрика популярности): Историческая частота отправки полного запроса пользователями.
Term Drop Factor (Фактор удаления терминов): Часть Similarity Score, которая штрафует за удаленные термины и использование синонимов. Учитывает тип удаленного слова и уверенность в синониме (Synonym Confidence Score).
Edit Distance Factor (Фактор редакционного расстояния): Часть Similarity Score, которая штрафует за операции на уровне слов (вставка, транспозиция, создание пробелов), необходимые для преобразования частичного запроса в полный.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления подсказок с использованием переписывания.

Система получает частичный запрос.
Выполняется поиск первого набора совпадающих полных запросов.
Проверяется условие: удовлетворяет ли первый набор предопределенным критериям.
Если НЕТ (критерии не выполнены):
1. Выполняется переписывание частичного запроса.
2. Условие переписывания: хотя бы один переписанный запрос должен (A) включать синоним термина из исходного запроса ИЛИ (B) включать меньше не-стоп-слов, чем исходный запрос.
3. Переписывание ограничено максимальным количеством удаленных терминов.
4. Выполняется поиск второго набора полных запросов, совпадающих с переписанными версиями.
5. Подмножество второго набора отправляется клиенту.

Ядром изобретения является условная активация механизма переписывания запроса (используя синонимы или удаление слов) только тогда, когда стандартные подсказки недостаточны.

Claim 2 (Зависимый от 1): Детализирует классификацию терминов.

Перед переписыванием система идентифицирует термины как обязательные (required), опциональные (optional) и/или стоп-слова (stop words).

Claim 3 (Зависимый от 2): Определяет критерии для обязательных терминов.

Термин считается обязательным, если он: имеет показатель Inverse Document Frequency (IDF), удовлетворяющий критериям (т.е. достаточно специфичный); является именем человека, названием продукта/бренда или местоположением (сущность); ИЛИ является частью n-граммы, которая совпадает с записью в предопределенной таблице.

Claim 6 (Зависимый от 2): Уточняет статус неполного термина.

Если частичный запрос включает Incomplete term, этот термин автоматически считается обязательным.

Claim 11 (Зависимый от 1): Описывает ранжирование второго набора подсказок.

Каждая подсказка оценивается на основе Similarity Score и Popularity Metric.

Где и как применяется

Изобретение применяется исключительно в рамках системы автозаполнения (Autocomplete/Google Suggest), которая является частью этапа понимания запросов.

QUNDERSTANDING – Понимание Запросов

Система (Prediction Server) работает в реальном времени, когда пользователь вводит запрос.

Обработка частичного запроса: Принимает ввод пользователя и ищет совпадения в Historical Complete Queries Database.
Переписывание запроса: Если стандартных подсказок недостаточно, активируется механизм переписывания. Это включает классификацию терминов (Required/Optional/Stop Word) и генерацию альтернативных версий.
Ранжирование подсказок: Ранжирует найденные полные запросы на основе схожести и популярности.

INDEXING – Индексирование и извлечение признаков

Косвенное взаимодействие. На этом этапе предварительно вычисляются данные, необходимые для работы системы:

Расчет IDF для терминов.
Составление списков синонимов и расчет Synonym Confidence Score.
Составление таблиц n-грамм и списков сущностей.
Обработка логов запросов (Query Log) для расчета Popularity Metric.

Входные данные:

Частичный поисковый запрос от клиента.
Данные о положении курсора.
База данных исторических запросов.
Вспомогательные данные (IDF, синонимы, стоп-слова, n-граммы).

Выходные данные:

Отранжированный набор полных поисковых запросов (подсказки).

На что влияет

Специфические запросы: Наибольшее влияние оказывается на длиннохвостые (long-tail), сложные или редкие запросы, для которых мало исторических данных о точном префиксном совпадении.
Запросы с ошибками или нестандартными формулировками: Система может помочь, предложив более популярные или корректные варианты через механизм синонимов или удаления слов.

Когда применяется

Алгоритм переписывания применяется условно.

Триггер активации: Когда первый набор совпадающих полных запросов (найденных по исходному частичному запросу) не удовлетворяет предопределенным критериям (fails to satisfy predefined criteria).
Пороговые значения: Критерии могут включать:
- Количество подсказок меньше порогового значения N.
- Суммарная или средняя оценка качества/популярности Топ-N подсказок ниже порогового значения Y.
Временные рамки: Применяется в реальном времени при вводе каждого символа в строку поиска.

Пошаговый алгоритм

Процесс обработки частичного запроса в Autocomplete

Получение ввода: Система получает частичный поисковый запрос.
Первичный поиск: Поиск в базе данных исторических запросов для идентификации первого набора полных запросов.
Оценка первого набора: Определение, удовлетворяет ли первый набор предопределенным критериям (количество и качество/популярность).
Принятие решения о переписывании:
- Если ДА: Отправить первый набор пользователю. Процесс завершен.
- Если НЕТ: Инициировать процесс переписывания.
Классификация терминов: Идентификация типов терминов в частичном запросе:
- Определение неполного термина (Incomplete Term) по позиции курсора (помечается как обязательный).
- Идентификация обязательных терминов (Required) с использованием IDF, списков сущностей, таблиц n-грамм.
- Идентификация стоп-слов (Stop Words).
- Оставшиеся термины помечаются как опциональные (Optional).
Генерация переписанных запросов: Создание набора переписанных частичных запросов путем:
- Замены терминов на синонимы.
- Удаления опциональных терминов или стоп-слов.
Применение ограничений: Обеспечение того, что количество удаленных терминов (или удаленных не-стоп-слов) не превышает предопределенное значение (например, 1 или 2).
Вторичный поиск: Поиск в базе данных для идентификации второго набора полных запросов, совпадающих с переписанными запросами.
Ранжирование (второй набор): Расчет оценки для каждой подсказки на основе:
- Popularity Metric (частота).
- Similarity Score, включающей:
  - Term Drop Factor (штрафы за удаленные слова и синонимы).
  - Edit Distance Factor (штрафы за редакционные правки).
Выбор и отправка: Выбор подмножества лучших подсказок из второго набора и отправка их клиенту.

Какие данные и как использует

Данные на входе

Система использует разнообразные данные для классификации терминов и ранжирования подсказок.

Контентные факторы (Анализ терминов): Текст частичного запроса анализируется для определения его состава.
Временные/Поведенческие факторы (Популярность): Используется Query Log и Historical Complete Queries Database для определения исторической частоты (Popularity Metric) полных запросов.
Пользовательские факторы (Ввод): Введенный текст и положение курсора (для определения Incomplete Term).
Лингвистические данные:
- Списки стоп-слов.
- База данных синонимов и оценки уверенности (Synonym Confidence Score).
- Таблицы n-грамм и списки сущностей (имена людей, бренды, локации).
Системные данные (Индекс):
- Inverse Document Frequency (IDF) для терминов.

Какие метрики используются и как они считаются

Классификация терминов:
- Required Term: Определяется, если IDF > порога, ИЛИ термин является сущностью/n-граммой, ИЛИ термин является Incomplete.
- Stop Word: Определяется по наличию в списке.
- Optional Term: Если не Required и не Stop Word.
Ранжирование подсказок (Scoring): Оценка обычно является функцией (например, произведением) от Similarity Score и Popularity Metric.
Similarity Score: Функция от Term Drop Factor и Edit Distance Factor.
Term Drop Factor рассчитывается на основе:
- Штрафа за удаленные не-стоп-слова (более высокий штраф).
- Штрафа за удаленные стоп-слова (более низкий штраф).
- Synonym Confidence Score для каждого использованного синонима.
Edit Distance Factor рассчитывается на основе количества операций на уровне слов (с возможными весами):
- Вставка (Insert).
- Транспозиция (Transpose).
- Создание пробела (Open Gap).
Патент отмечает, что при расчете факторов схожести части полного запроса, следующие после последнего совпадающего термина из частичного запроса, игнорируются (не штрафуются).

Autocomplete – это не только префиксы: Google активно переписывает ввод пользователя для генерации подсказок, если стандартных префиксных совпадений недостаточно. Подсказки могут не содержать всех введенных слов или могут содержать синонимы.
Иерархия важности терминов: Система классифицирует слова в запросе на обязательные, опциональные и стоп-слова. Понимание того, какие слова Google считает обязательными (редкие слова по IDF, сущности, устоявшиеся фразы), критично для анализа семантики.
Неполный термин всегда обязателен: Слово, которое пользователь вводит в данный момент (Incomplete Term), всегда сохраняется в переписанных запросах.
Ограниченное переписывание: Система ограничивает агрессивность переписывания, устанавливая лимит на количество удаляемых слов (например, 1 или 2), чтобы сохранить релевантность.
Сложное ранжирование подсказок: Ранжирование подсказок – это баланс между популярностью (Popularity) и схожестью (Similarity). Схожесть учитывает сложные штрафы за удаление слов (с разными весами) и редакционное расстояние.
Направление пользователя к популярным запросам: Механизм переписывания направляет пользователей от редких или неоптимальных формулировок к более популярным и проверенным запросам, которые есть в Historical Database.

Best practices (это мы делаем)

Анализ подсказок для понимания интента и синонимов: Активно изучайте Autocomplete, вводя разные комбинации запросов. Обращайте внимание на то, какие слова Google заменяет синонимами (считает взаимозаменяемыми), а какие удаляет (считает опциональными). Это дает прямое понимание интерпретации запроса системой.
Оптимизация под популярные формулировки: Поскольку система ранжирует подсказки с учетом Popularity Metric и стремится направить пользователя к исторически частым запросам, ключевая стратегия – выявлять эти популярные формулировки и оптимизировать контент под них.
Укрепление связи с Сущностями и N-граммами: Работайте над тем, чтобы ключевые фразы вашего сайта (бренды, продукты, имена) распознавались как Required Query Terms. Это гарантирует, что они не будут удалены при переписывании запросов пользователей, ищущих ваш ресурс.
Исследование длиннохвостых запросов через Autocomplete: При исследовании long-tail запросов проверяйте, не пытается ли Google "сократить" или переписать эти запросы в более общие через подсказки. Если да, необходимо учитывать обе версии запроса в контент-стратегии.

Worst practices (это делать не надо)

Игнорирование Autocomplete при сборе семантики: Опираться только на инструменты анализа ключевых слов без проверки подсказок в реальном времени. Патент показывает, что Autocomplete активно формирует спрос, переписывая запросы, а не только пассивно отражает его.
Фокус на неестественных или редких формулировках: Создание контента под очень специфические, редкие формулировки может быть неэффективным, если Autocomplete будет активно переписывать эти запросы в более популярные варианты.
Использование стоп-слов или опциональных терминов для дифференциации: Не стоит полагаться на стоп-слова или опциональные термины как на ключевой элемент уникальности запроса. Система легко удалит их при генерации подсказок, если это поможет найти более качественные варианты.

Стратегическое значение

Патент подтверждает, что Google Autocomplete является интеллектуальной системой, а не простым поиском по префиксам. Стратегическое значение для SEO заключается в понимании, что поведение пользователя активно формируется еще до отправки запроса. Система стремится максимизировать вероятность успешного поиска, направляя пользователя к запросам, которые уже доказали свою эффективность (популярность). Это подчеркивает важность оптимизации под реальные интенты и необходимость глубокого понимания механизмов классификации терминов и синонимизации.

Практические примеры

Сценарий: Анализ синонимов и важности терминов в нише электроники

Задача: Определить, считает ли Google термины "OLED" и "QLED" синонимами или разными сущностями, и какие слова в запросе являются опциональными.
Действие: Ввести в строку поиска длинный и редкий частичный запрос: сравнение телевизоров samsung oled и qled 2025 ц
Наблюдение (Гипотетический пример на основе патента):
1. Система не находит достаточно популярных запросов с этим префиксом. Активируется переписывание.
2. Классификация: "samsung", "oled", "qled", "2025" (Required/Entity), "ц" (Incomplete/Required), "сравнение", "телевизоров" (Optional), "и" (Stop Word).
3. Переписанные варианты:
  - samsung oled qled 2025 цена (удалены "сравнение", "телевизоров", "и").
  - разница samsung oled qled 2025 цена (синоним "разница" вместо "сравнение").
Вывод для SEO: Google сохранил "OLED" и "QLED" как обязательные термины, не заменив их друг другом, что подтверждает их статус как разных сущностей. Термины "сравнение" и "телевизоров" были легко удалены (Optional). Необходимо фокусироваться на контенте, отвечающем на интент сравнения цен и характеристик конкретных моделей.

Описывает ли этот патент алгоритмы ранжирования сайтов в поиске?

Нет, этот патент не имеет отношения к ранжированию документов в основной поисковой выдаче. Он полностью сосредоточен на механизме работы системы автозаполнения (Google Autocomplete). Патент описывает, как генерируются и ранжируются сами поисковые подсказки, а не результаты поиска по ним.

Что происходит, если Google не находит хороших подсказок для моего запроса?

Именно эту проблему решает патент. Если стандартный поиск подсказок не удовлетворяет критериям качества или количества, система активирует механизм переписывания. Она попытается модифицировать ваш частичный запрос, удалив менее важные слова или заменив некоторые слова на синонимы, чтобы найти больше популярных и релевантных полных запросов в своей базе данных.

Как Google определяет, какие слова можно удалить из запроса при генерации подсказок?

Система классифицирует термины на обязательные (Required), опциональные (Optional) и стоп-слова (Stop Words). Стоп-слова и опциональные термины являются кандидатами на удаление. Обязательные термины (например, редкие слова с высоким IDF, имена, бренды, устоявшиеся фразы или слово, которое вы сейчас печатаете) сохраняются.

Может ли мой бренд быть удален из подсказки как "опциональное слово"?

Если ваш бренд хорошо известен и распознается как сущность (имя, продукт, бренд), он будет классифицирован как Required Query Term (согласно Claim 3). В этом случае система не должна удалять его при переписывании запроса. Однако, если бренд новый или не распознан как сущность, есть риск, что он будет классифицирован как опциональный и удален.

Как ранжируются подсказки, созданные путем переписывания?

Они ранжируются на основе баланса двух ключевых метрик: Popularity Metric (насколько часто этот запрос использовался ранее) и Similarity Score (насколько он похож на исходный ввод пользователя). Similarity Score включает штрафы за каждое удаленное слово (Term Drop Factor) и за изменения порядка слов или вставки (Edit Distance Factor).

Насколько агрессивно Google может переписать запрос?

Патент предполагает ограничения на агрессивность переписывания. Упоминается, что система ограничивает максимальное количество удаленных терминов (maximum number of dropped terms). В одном из примеров это значение составляет 1 или 2 слова. Это делается для того, чтобы подсказки оставались релевантными интенту пользователя.

Как этот патент влияет на исследование ключевых слов (Keyword Research)?

Он имеет значительное влияние. Он показывает, что Autocomplete активно направляет пользователей к популярным формулировкам. SEO-специалистам необходимо анализировать подсказки, чтобы понять, какие синонимы использует Google и какие слова он считает несущественными в конкретной тематике. Нельзя полагаться только на редкие формулировки, так как они могут быть переписаны.

Что такое 'Incomplete Term' и почему это важно?

Incomplete Term – это слово, которое пользователь вводит в данный момент (например, ввел "автом" и курсор стоит сразу после буквы "м"). Патент четко указывает, что этот неполный термин всегда классифицируется как обязательный (Required). Это гарантирует, что система будет пытаться завершить именно это слово, а не удалит его при переписывании.

Использует ли Google IDF для определения важности слова в Autocomplete?

Да, согласно патенту (Claim 3), Inverse Document Frequency (IDF) является одним из способов идентификации обязательных терминов (Required Query Terms). Термины с высоким IDF (более редкие и специфичные) с меньшей вероятностью будут удалены при переписывании запроса для генерации подсказок.

Что такое 'Term Drop Factor'?

Это механизм штрафования подсказок, которые были получены путем удаления слов из исходного частичного запроса. Он снижает Similarity Score подсказки. При этом штраф за удаление стоп-слова обычно меньше, чем штраф за удаление опционального термина. Также этот фактор учитывает уверенность в синонимах (Synonym Confidence Score), если они использовались при переписывании.

Как Google использует анализ окончаний запросов (суффиксов) для улучшения работы Автокомплита, игнорируя начало запроса

Google использует механизм для улучшения подсказок Автокомплита (Search Suggest), фокусируясь на окончании (суффиксе) запроса. Если начало запроса редкое или неоднозначное, система ищет популярные прошлые запросы с похожими окончаниями, но разными началами. Это позволяет предлагать релевантные подсказки, основываясь на том, как пользователи обычно заканчивают схожие по структуре запросы.

US8417718B1
2013-04-09

Как Google использует частичные запросы, логи и профили пользователей для формирования подсказок (Autocomplete) и предварительной загрузки результатов

Патент описывает технологию Google Autocomplete (Suggest). Система предсказывает финальный запрос на основе частично введенного текста, используя словари, составленные из популярных запросов сообщества. Предсказания ранжируются по популярности и персонализируются с учетом профиля пользователя. Система также может заранее кэшировать результаты для наиболее вероятных подсказок, чтобы ускорить выдачу.

US7836044B2
2010-11-16

Персонализация
Семантика и интент

Как Google переписывает запросы на естественном языке для поиска более качественных результатов

Google использует систему для улучшения результатов поиска по запросам на естественном языке. Если первоначальная выдача не удовлетворяет требованиям качества (например, отсутствуют прямые ответы или релевантность низкая), система генерирует и тестирует альтернативные, переписанные версии запроса. Если альтернативная версия дает лучшие результаты, они заменяют или дополняют исходную выдачу.

US20170270159A1
2017-09-21

Семантика и интент
SERP

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности

Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.

US8868591B1
2014-10-21

Семантика и интент

Как Google формирует и ранжирует подсказки в Autocomplete на основе исторических данных о запросах пользователей

Google использует систему, которая анализирует логи исторических запросов пользователей для предсказания полного запроса при вводе частичного. Система генерирует упорядоченный набор вероятных завершений, ранжируя их по популярности (частоте использования) или другим критериям. Это позволяет пользователям быстрее находить информацию и показывает, какие формулировки запросов наиболее распространены в сообществе.

US7487145B1
2009-02-03

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске

Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.

US10853432B2
2020-12-01

Семантика и интент
SERP
Поведенческие сигналы

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью

Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.

US9348945B2
2016-05-24

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)

Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.

US7590628B2
2009-09-15

Семантика и интент
Структура сайта
Ссылки

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче

Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.

US9418156B2
2016-08-16

Local SEO
SERP
Ссылки

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов

Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.

US8423538B1
2013-04-16

Семантика и интент
Поведенческие сигналы
SERP

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки

Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.

US8442984B1
2013-05-14

SERP
EEAT и качество
Поведенческие сигналы

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам

Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).

US11609949B2
2023-03-21

Антиспам
SERP
Поведенческие сигналы

Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»

Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.

US9275147B2
2016-03-01

Семантика и интент
Поведенческие сигналы
Персонализация

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса

Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.

US9454621B2
2016-09-27

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)

Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.

US9146966B1
2015-09-29

Поведенческие сигналы
SERP