Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности

MODIFYING A USER QUERY TO IMPROVE THE RESULTS (Модификация пользовательского запроса для улучшения результатов)

US8868591B1
Google LLC
2011-09-21
2014-10-21

Семантика и интент

Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.

Какую проблему решает

Патент решает проблему неэффективных формулировок запросов. Пользователи часто испытывают трудности с подбором терминов, которые точно отражают их информационную потребность, что приводит к низкому качеству выдачи. Традиционные системы подсказок (Autocomplete) обычно предлагают только завершение запроса (дописывают его на основе префикса). Это изобретение направлено на предложение альтернативных формулировок (перефразирование), которые семантически идентичны, но исторически показывают лучшие результаты и более высокую удовлетворенность пользователей.

Что запатентовано

Запатентована система для идентификации и выбора улучшенных вариантов запроса (Selected Variants). Система ищет альтернативные прошлые запросы, которые не содержат исходную подсказку как префикс (или подстроку), но имеют идентичную каноническую форму (Canonical Representation). Выбор финального варианта основывается на Query Utility Score — метрике, отражающей историческую удовлетворенность пользователей результатами по этому запросу. Это позволяет предлагать более эффективные формулировки, даже если они отличаются от вводимого текста.

Как это работает

Система работает (преимущественно офлайн) путем сравнения исходной подсказки с базой уникальных прошлых запросов:

Фильтрация: Отбираются прошлые запросы, которые структурно отличаются от исходной подсказки (не содержат ее как префикс).
Каноникализация: Исходная подсказка и прошлые запросы приводятся к канонической форме (например, удаление стоп-слов, стемминг, алфавитный порядок терминов).
Сравнение: Идентифицируются кандидаты (Candidate Variants), чья каноническая форма точно совпадает с канонической формой исходной подсказки.
Оценка полезности: Кандидаты оцениваются с помощью Query Utility Score.
Выбор: Выбирается вариант с наивысшим Query Utility Score (обычно превышающим оценку исходной подсказки). Этот вариант сохраняется как улучшенная альтернатива.

Актуальность для SEO

Высокая. Понимание интента пользователя и направление его к наиболее качественным результатам остается ключевой задачей поиска. Механизмы каноникализации запросов и использования поведенческих метрик (Query Utility Score) для оптимизации формулировок активно используются, особенно в контексте Autocomplete и Related Searches. Хотя конкретные методы определения семантической близости могли эволюционировать (например, в сторону векторных представлений), базовая концепция остается актуальной.

Важность для SEO

Патент имеет высокое значение для понимания того, как Google интерпретирует интент и оценивает качество самих формулировок запросов. Он демонстрирует, что Google активно пытается направить пользователя к той формулировке, которая обеспечивает наибольшую удовлетворенность (Utility). Для SEO это подчеркивает необходимость фокусироваться на базовом каноническом интенте и оптимизировать контент под ту формулировку запроса, которая демонстрирует наилучшие поведенческие сигналы, а не пытаться охватить все возможные синтаксические вариации.

Термины и определения

Canonical Representation / Canonical Form (Каноническое представление / Каноническая форма): Стандартизированная форма запроса, полученная после применения правил каноникализации. Используется для идентификации запросов с одинаковым интентом, несмотря на различия в формулировках.
Canonicalization Rules (Правила каноникализации): Набор правил для нормализации запросов. В патенте упоминаются: стемминг (stemming), удаление стоп-слов (stopword removal), переупорядочивание слов (word reordering, например, по алфавиту), удаление дубликатов терминов.
Candidate Variants (Варианты-кандидаты): Уникальные запросы, прошедшие проверку на схожесть с исходной подсказкой. В основном варианте реализации это запросы с идентичной канонической формой.
Given Query Suggestion (Исходная подсказка запроса): Подсказка, сгенерированная стандартными методами (например, автодополнение), которая подвергается анализу для поиска улучшенных альтернатив.
Prefix (Префикс) / Substring (Подстрока): Последовательность терминов в начале запроса (префикс) или в любом месте запроса (подстрока). Система ищет альтернативы, которые НЕ содержат исходную подсказку как префикс (и опционально, как подстроку).
Query Utility Score (Оценка полезности запроса): Метрика, оценивающая качество результатов по запросу на основе прошлых реакций пользователей (user response). Отражает удовлетворенность пользователей (user satisfaction). Может включать частотность запроса, клики, время просмотра результатов.
Selected Variants (Выбранные варианты): Финальный набор Candidate Variants, которые имеют высокий Query Utility Score (обычно выше, чем у исходной подсказки) и предлагаются как альтернатива.
Similarity Score (Оценка схожести): Метрика, определяющая степень схожести между исходной подсказкой и уникальным запросом. Рассчитывается на основе сравнения канонических форм.
Unique Queries (Уникальные запросы): Набор прошлых запросов из логов (Log Files), используемый для поиска альтернатив.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора варианта для исходной подсказки запроса.

Определение канонических представлений (используя Canonicalization Rules) для исходной подсказки и уникальных запросов (которые не включают исходную подсказку как префикс).
Сравнение канонических представлений для получения оценок схожести (Similarity Scores).
Выбор кандидатов (Candidate Variants) на основе оценок схожести, удовлетворяющих порогу. Ключевое требование, указанное в Claim 1: выбор включает как минимум один уникальный запрос, чье каноническое представление идентично каноническому представлению исходной подсказки.
Выбор финальных вариантов (Selected Variants) из числа кандидатов с использованием Query Utility Scores.
Сохранение ассоциации между исходной подсказкой и выбранными вариантами.

Ядро изобретения — использование идентичности канонических форм как строгого критерия семантической эквивалентности и последующее использование оценок полезности для выбора наилучшей формулировки.

Claim 2 (Зависимый от 1): Уточняет критерий выбора финальных вариантов. Выбираются кандидаты, чьи Query Utility Scores выше, чем у исходной подсказки запроса. Это гарантирует, что предложенная альтернатива является улучшением.

Claim 3, 4, 5 (Зависимые): Детализируют процесс выбора. Кандидаты сортируются по их Query Utility Scores для создания рейтинга. Выбирается предопределенное количество (например, один, согласно Claim 5) лучших кандидатов.

Claim 8 (Зависимый от 1): Ужесточает требования к уникальным запросам. Они не должны включать исходную подсказку не только как префикс, но и как подстроку (substring). Это гарантирует предложение структурно отличающихся альтернатив.

Где и как применяется

Изобретение применяется на этапе понимания запросов и в системах генерации поисковых подсказок.

QUNDERSTANDING – Понимание Запросов
Большая часть работы происходит офлайн или в качестве фонового процесса. Система анализирует логи запросов (Log Files), применяет правила каноникализации ко всем уникальным запросам и рассчитывает Query Utility Scores. Это позволяет построить базу данных соответствий между различными формулировками запросов и определить наиболее эффективные формулировки для каждого интента.

Применение в реальном времени (Suggestion Engine):
Когда пользователь вводит запрос, стандартная система подсказок (Suggestion Engine) генерирует исходные подсказки. Затем Query Variant Engine использует предварительно рассчитанные данные для поиска и предложения Selected Variants.

Входные данные: Исходная подсказка запроса (Given Query Suggestion), база уникальных запросов (Unique Queries) с их каноническими формами и Query Utility Scores.
Выходные данные: Один или несколько Selected Variants (улучшенных альтернативных формулировок).

Технические особенности: Ключевой особенностью является строгий подход к определению схожести через идентичность канонических форм. Это позволяет находить структурно разные запросы, которые выражают одинаковый интент.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на запросы, которые имеют множество синтаксических вариаций, разный порядок слов или включают много стоп-слов (например, информационные запросы, запросы-вопросы).
Пользовательский интерфейс: Влияет на блок автодополнения (Autocomplete), направляя пользователя к более эффективным формулировкам.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

Условие 1 (Структурное различие): Существуют прошлые уникальные запросы, которые не содержат исходную подсказку как префикс (и/или подстроку).
Условие 2 (Идентичность интента): Каноническая форма этих уникальных запросов идентична канонической форме исходной подсказки.
Условие 3 (Улучшение полезности): Query Utility Score уникального запроса выше, чем у исходной подсказки.
Временные рамки: Расчет происходит офлайн. Применение — в момент генерации поисковых подсказок в реальном времени.

Пошаговый алгоритм

Процесс выбора улучшенных вариантов запроса (Офлайн):

Получение и фильтрация данных: Система получает исходную подсказку запроса. Извлекается набор уникальных прошлых запросов, которые не содержат исходную подсказку как префикс.
Каноникализация: Исходная подсказка и все отобранные уникальные запросы преобразуются в свои канонические представления. Это включает удаление стоп-слов, стемминг, сортировку терминов по алфавиту и удаление дубликатов.
Расчет схожести и отбор кандидатов: Система сравнивает канонические представления. Уникальные запросы, чьи канонические формы точно совпадают с формой исходной подсказки (или превышают высокий порог схожести), отбираются как Candidate Variants.
Оценка полезности: Система извлекает предварительно рассчитанные Query Utility Scores для исходной подсказки и всех кандидатов.
Фильтрация по полезности: Отбрасываются кандидаты, чей Query Utility Score не превышает оценку исходной подсказки.
Ранжирование и выбор: Оставшиеся кандидаты ранжируются по Query Utility Score. Выбирается предопределенное количество (например, один) лучших кандидатов в качестве Selected Variants.
Сохранение ассоциации: Система сохраняет связь между исходной подсказкой и выбранными вариантами для последующего использования.

Какие данные и как использует

Данные на входе

Патент фокусируется на анализе запросов и поведенческих данных.

Поведенческие факторы (Ключевые):
- Логи запросов (Log Files): Источник уникальных прошлых запросов.
- Данные о сессиях пользователей: Используются для расчета Query Utility Score. В патенте упоминаются данные о том, какие результаты были выбраны пользователями после поиска и как долго каждый результат просматривался.
Лингвистические данные: Текст самих запросов, который обрабатывается с использованием правил каноникализации.

Какие метрики используются и как они считаются

Query Utility Score (Оценка полезности запроса): Ключевая метрика для выбора лучшей формулировки. Рассчитывается на основе агрегированных данных о поведении пользователей для оценки их удовлетворенности результатами поиска по данному запросу.
Similarity Score (Оценка схожести): Метрика для определения идентичности интента. Рассчитывается путем сравнения канонических форм.
- Методы анализа текста (Нормализация): Запросы нормализуются с использованием стемминга, удаления стоп-слов, сортировки терминов.
- Пороговое значение: В основном варианте реализации используется требование идентичности канонических форм (бинарная оценка: 1 или 0).

Интент определяется канонической формой: Патент демонстрирует, как Google определяет семантическую идентичность запросов. Если два структурно разных запроса приводятся к одной и той же канонической форме (после нормализации), они считаются выражающими один и тот же интент.
Приоритет полезности над синтаксисом и популярностью: Если существует несколько способов выразить один и тот же интент, Google предпочтет ту формулировку, которая исторически приводила к большей удовлетворенности пользователей (выше Query Utility Score), а не обязательно самую популярную или синтаксически простую.
Отход от простого автодополнения: Система активно ищет перефразирования, а не просто завершения запроса. Обязательное условие — альтернатива не должна содержать исходную подсказку как префикс.
Важность поведенческих сигналов на уровне запроса: Query Utility Score является критически важной метрикой. Google оценивает не только качество страниц, но и качество самих формулировок запросов с точки зрения их способности удовлетворить пользователя.
Консолидация интента: Система стремится консолидировать трафик вокруг наиболее эффективных формулировок для каждого интента.

Best practices (это мы делаем)

Фокус на каноническом интенте в Keyword Research: Необходимо группировать запросы по их предполагаемой канонической форме, а не только по синтаксической близости. Понимайте, какие слова являются ключевыми для интента, а какие — стоп-словами или модификаторами, которые удаляются при нормализации.
Оптимизация под наиболее эффективные формулировки (High Utility): Анализируйте, какие формулировки запросов в вашей нише показывают лучшие поведенческие метрики (например, через анализ CTR в GSC или внутреннюю аналитику) и генерируют наибольший трафик. Используйте эти высокоэффективные формулировки в качестве основных целей оптимизации, так как Google будет направлять пользователей именно к ним.
Глубокий анализ Autocomplete: Внимательно изучайте предложения Autocomplete, особенно те, которые перефразируют введенный текст. Они показывают, какие варианты Google считает оптимальными (с высоким Utility Score).
Оптимизация удовлетворенности пользователей (User Satisfaction): Поскольку выбор лучшей формулировки основан на Query Utility Score, критически важно обеспечивать высокое качество контента. Удовлетворенность пользователей повышает вероятность того, что запросы, ведущие на ваш сайт, получат высокий Utility Score.

Worst practices (это делать не надо)

Фокус на неестественных или низкокачественных (Low Utility) формулировках: Попытки оптимизации под синтаксически специфичные запросы, которые приводят к плохим поведенческим сигналам, неэффективны. Google может активно перенаправлять пользователей с этих формулировок на более качественные альтернативы.
Создание отдельных страниц под каждую синтаксическую вариацию: Если несколько запросов имеют идентичную каноническую форму (например, отличаются только порядком слов или стоп-словами), они должны обрабатываться одной целевой страницей. Создание множества страниц является каннибализацией интента.

Стратегическое значение

Патент подтверждает стратегию Google по переходу от буквального сопоставления ключевых слов к глубокому пониманию интента и приоритезации пользовательского опыта. Он показывает механизм, с помощью которого Google консолидирует интент вокруг наиболее удачных формулировок. Для долгосрочной SEO-стратегии это означает, что необходимо строить семантическое ядро вокруг кластеров интентов (канонических форм) и оптимизировать под варианты запросов, демонстрирующие наивысшую полезность.

Практические примеры

Сценарий 1: Консолидация интента для рецептов

Исходные запросы пользователей: "best pizza dough recipe" (лучший рецепт теста для пиццы) и "recipe for pizza dough" (рецепт для теста пиццы).
Анализ системой (Каноникализация):
- Система удаляет стоп-слова ("best", "for") и сортирует термины.
- Оба запроса приводятся к канонической форме: [dough pizza recipe].
Оценка полезности: Система анализирует логи и определяет, что формулировка "pizza dough recipe" имеет самый высокий Query Utility Score.
Результат: Когда пользователь начнет вводить "best pizza dough...", система может предложить "pizza dough recipe" как более эффективную альтернативу.
SEO-действие: Оптимизировать основную страницу рецепта под интент [dough pizza recipe], используя предпочтительную формулировку "pizza dough recipe" в заголовках.

Сценарий 2: Обработка естественного языка

Пользователь вводит: "what the dollar" (что доллар).
Стандартная подсказка: Может быть неэффективной.
Анализ системой: Система находит альтернативный запрос "what is the dollar worth" (чего стоит доллар).
- Канонические формы могут совпадать (например, [dollar worth]).
- "what is the dollar worth" имеет более высокий Query Utility Score.
Результат: Система предлагает "what is the dollar worth" в Autocomplete, даже если префикс не совпадает.

Что такое "Каноническая форма" запроса согласно патенту?

Это стандартизированное представление запроса, полученное после его нормализации. Процесс включает удаление стоп-слов, стемминг (приведение слов к основе), сортировку оставшихся терминов (например, по алфавиту) и удаление дубликатов. Если два разных запроса имеют одинаковую каноническую форму, система считает их интент идентичным.

Что такое Query Utility Score и почему это важно?

Query Utility Score — это метрика, которая оценивает, насколько хорошо данный запрос удовлетворяет информационную потребность пользователей. Она рассчитывается на основе исторических поведенческих данных (клики, время просмотра результатов). Это важно, потому что Google использует эту оценку для выбора лучшей формулировки запроса среди всех семантически идентичных вариантов.

Чем этот механизм отличается от стандартного автодополнения (Autocomplete)?

Стандартный Autocomplete предлагает завершение запроса, то есть ищет запросы, которые содержат введенный текст как префикс. Описанный механизм специально ищет варианты, которые НЕ содержат введенный текст как префикс. Цель — найти структурно другой запрос (перефразирование) с тем же интентом, но лучшими результатами.

Насколько похожими должны быть альтернативные запросы?

Согласно основному варианту реализации, описанному в патенте (Claim 1), схожесть определяется очень строго: канонические формы исходного и альтернативного запросов должны быть идентичными. Это не просто семантическая близость, а точное совпадение интента после нормализации.

Как это влияет на Keyword Research?

Это подчеркивает необходимость кластеризации ключевых слов на основе их канонического интента, а не только синтаксиса. В рамках одного кластера интента следует определять формулировку с наивысшей "полезностью" (например, лучшими поведенческими показателями) и фокусировать оптимизацию на ней, так как Google будет стараться направлять пользователей именно к этой формулировке.

Стоит ли создавать отдельные страницы для запросов с разным порядком слов?

Нет. Если запросы отличаются только порядком слов (например, "pizza dough recipe" и "recipe pizza dough"), они будут приведены к одной канонической форме (при условии алфавитной сортировки терминов в правилах каноникализации). Они представляют один интент и должны обрабатываться одной страницей.

Влияет ли качество моего сайта на этот алгоритм?

Прямо — нет, алгоритм работает на уровне запросов. Однако косвенно — да. Если ваш сайт предоставляет качественные ответы, которые удовлетворяют пользователей, это способствует повышению Query Utility Score для запросов, по которым вы ранжируетесь. Это делает эти формулировки более приоритетными для Google.

Является ли этот процесс real-time или предварительно рассчитанным?

Согласно патенту, процесс идентификации улучшенных вариантов (каноникализация, сравнение полезности, маппинг) выполняется офлайн путем анализа исторических логов. Предложение этих вариантов пользователю в Autocomplete происходит в реальном времени, но оно основано на этих предварительно рассчитанных данных.

Как узнать каноническую форму моих ключевых запросов?

Точный алгоритм каноникализации Google неизвестен, но его можно аппроксимировать, следуя шагам, описанным в патенте: удалить предлоги и артикли, привести слова к их базовой форме (стемминг) и отсортировать по алфавиту. Это поможет понять, какие запросы Google может считать идентичными.

Как этот патент соотносится с современными алгоритмами, такими как BERT или MUM?

Этот патент (подан в 2011 году) использует более традиционные методы NLP (каноникализация) для понимания интента. BERT и MUM используют нейронные сети для более глубокого понимания контекста. Однако цель общая — понять намерение за разными формулировками. Современные системы, вероятно, используют сравнение векторных представлений (embeddings) для оценки схожести, но концепция использования поведенческих данных (Utility Score) для выбора лучшей формулировки остается актуальной.

Как Google использует анализ окончаний запросов (суффиксов) для улучшения работы Автокомплита, игнорируя начало запроса

Google использует механизм для улучшения подсказок Автокомплита (Search Suggest), фокусируясь на окончании (суффиксе) запроса. Если начало запроса редкое или неоднозначное, система ищет популярные прошлые запросы с похожими окончаниями, но разными началами. Это позволяет предлагать релевантные подсказки, основываясь на том, как пользователи обычно заканчивают схожие по структуре запросы.

US8417718B1
2013-04-09

Как Google создает новые поисковые подсказки (Autocomplete), комбинируя структуры и термины из прошлых запросов

Google расширяет покрытие поисковых подсказок (Autocomplete), создавая новые, ранее не использованные запросы. Система анализирует логи, находит запросы с похожей структурой (шаблоны), определяет семантически близкие термины (используя distributional similarity) и комбинирует их. Это позволяет предлагать пользователям релевантные подсказки, даже если такой запрос никогда ранее не вводился.

US8521739B1
2013-08-27

Семантика и интент

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно

Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.

US9235654B1
2016-01-12

Семантика и интент

Как Google формирует персонализированные поисковые подсказки (Autocomplete) на основе контента пользователя (например, в Gmail)

Google использует механизм для улучшения поисковых подсказок (Autocomplete) в таких сервисах, как Gmail. Система анализирует корпус документов пользователя, распознает сущности (например, email-адреса, имена) и предлагает их в качестве подсказок. Это помогает пользователю быстрее находить нужный контент, предлагая контекстуализированные подсказки (например, полный контакт) вместо отдельных слов.

US20140201229A1
2014-07-17

Персонализация
Индексация
Семантика и интент

Как Google консолидирует оценки популярности и фильтрует подсказки в Autocomplete для оптимизации выдачи

Google использует механизм консолидации оценок в Autocomplete: популярность длинных запросов суммируется с популярностью их коротких префиксов. Это позволяет точнее определить реальный спрос. Затем система фильтрует список, предпочитая более длинные и информативные подсказки коротким, если длинная подсказка составляет значительную часть популярности короткой, оптимизируя интерфейс пользователя.

US8713042B1
2014-04-29

SERP

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко

Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.

US8521725B1
2013-08-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)

Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.

US7996391B2
2011-08-09

Ссылки
Поведенческие сигналы
SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов

Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.

US7610282B1
2009-10-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента

Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.

US8799107B1
2014-08-05

EEAT и качество
SERP
Поведенческие сигналы

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей

Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.

US9244972B1
2016-01-26

EEAT и качество
Семантика и интент
SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)

Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.

US10146829B2
2018-12-04

Семантика и интент
Персонализация
Поведенческие сигналы

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)

Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.

US7797316B2
2010-09-14

Свежесть контента
Ссылки
Техническое SEO

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации

Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).

US8645393B1
2014-02-04

Персонализация
Семантика и интент
SERP

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов

Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.

US9015152B1
2015-04-21

Семантика и интент
Поведенческие сигналы
Local SEO

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов

Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.

US8478773B1
2013-07-02

Семантика и интент
Персонализация
Поведенческие сигналы