Как Google определяет, ищет ли пользователь информацию НА сайте сущности (бренда/издателя) или О ней, и переписывает запрос

QUERY REWRITING WITH ENTITY DETECTION (Переписывание запроса с обнаружением сущностей)

US7536382B2
Google LLC
2004-03-31
2009-05-19

Семантика и интент

Google использует систему для распознавания сущностей (например, брендов, новостных изданий) в поисковых запросах. Система оценивает, является ли название сущности общеупотребительным словом. Если название уникально (например, «MSNBC»), запрос автоматически переписывается для поиска только на сайте этой сущности. Если название общеупотребительно (например, «Time»), выполняется обычный поиск, но предлагается ссылка для ограничения поиска сайтом этой сущности.

Какую проблему решает

Патент решает проблему неоднозначности пользовательского интента, когда запрос содержит название сущности (например, бренда, магазина, новостного источника). Система должна определить, хочет ли пользователь ограничить поиск документами этой сущности (например, искать только на washingtonpost.com), или он ищет информацию об этой сущности в целом. Проблема усугубляется, когда названия сущностей совпадают с общеупотребительными словами (например, журнал "Time" против концепции "время"). Патент автоматизирует применение ограничивающих операторов (например, site: или source:), устраняя необходимость их ручного ввода.

Что запатентовано

Запатентована система для выборочного переписывания поисковых запросов на основе обнаружения названий сущностей (Entity Names). Ключевой механизм — это определение того, связано ли обнаруженное название сущности с общеупотребительным словом или фразой (common word or phrase). На основе этой оценки принимается решение: автоматически переписать запрос, добавив идентификатор ограничения (restrict identifier), или выполнить исходный запрос, предложив переписанный вариант как альтернативу.

Как это работает

Механизм включает офлайн и онлайн процессы:

Офлайн Подготовка: Генерируется список сущностей, их идентификаторов (доменов) и вариаций написания (Candidate Strings). Также определяется, какие названия являются общеупотребительными.
Онлайн Обнаружение: Система сверяет термины входящего запроса со списком Candidate Strings.
Онлайн Проверка: Определяется, является ли название обнаруженной сущности общеупотребительным словом.
Сценарий 1 (Уникальное название): Если название НЕ общеупотребительное (например, "MSNBC"), система автоматически переписывает запрос (например, добавляя "source:msnbc"), выполняет ограниченный поиск и предлагает ссылку на исходный запрос.
Сценарий 2 (Общеупотребительное название): Если название общеупотребительное (например, "Time"), система выполняет исходный запрос и предлагает ссылку на переписанный (ограниченный) запрос.

Актуальность для SEO

Высокая. Распознавание сущностей (Entity Recognition) и понимание намерений пользователя (Query Understanding) являются фундаментальными задачами поиска. Хотя конкретные методы оценки неоднозначности с момента подачи патента (2004 год) эволюционировали (например, от IDF к нейронным сетям и Knowledge Graph), описанный в патенте принцип интеллектуального переписывания запросов для разрешения неоднозначности между поиском "на сущности" и "о сущности" остается критически важным для Google в 2025 году.

Важность для SEO

Патент имеет высокое значение (75/100) для SEO, особенно в контексте брендовых запросов. Он описывает механизм, который напрямую влияет на то, как Google обрабатывает запросы, включающие названия компаний или изданий. Если Google интерпретирует запрос как поиск внутри вашего сайта (даже без оператора site:), это радикально меняет SERP. Понимание этого механизма критично для стратегий, связанных с видимостью бренда и управлением трафиком по смешанным запросам (тема + бренд).

Термины и определения

Candidate Strings (Строки-кандидаты): Предварительно сгенерированный список, содержащий различные варианты написания названий сущностей и их идентификаторов. Создается путем трансформаций (удаление Inc., .com, обработка пробелов и т.д.).
Common word or phrase (Общеупотребительное слово или фраза): Слово или фраза, имеющие широкое распространение в языке (определяется по словарю, IDF или лингвистическим моделям). Критерий для принятия решения о способе переписывания запроса.
Entity (Сущность): Объект, который может быть связан с определенными документами. Примеры: новостные источники, магазины, бренды, авторы, люди, места и организации.
Entity Identifier (Идентификатор сущности): Уникальный идентификатор, связанный с сущностью, например, доменное имя (URL) или идентификатор категории.
Entity Name (Название сущности): Текстовое название сущности (например, "Washington Post").
Restrict Identifier (Идентификатор ограничения): Специальный оператор, добавляемый к переписанному запросу для ограничения поиска доменом или контекстом, связанным с сущностью (например, source: или site:).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки поискового запроса и логику принятия решений.

Система получает поисковый запрос.
Определяется, включает ли запрос Entity Name.
Определяется, соответствует ли Entity Name одному из common words or phrases.
Запрос переписывается с включением Restrict Identifier, ограничивающего поиск доменом (domain), связанным с Entity Name.
Сценарий А: Поиск выполняется на основе переписанного запроса, ЕСЛИ Entity Name НЕ соответствует общеупотребительному слову.
Сценарий Б: Поиск выполняется на основе исходного запроса, ЕСЛИ Entity Name соответствует общеупотребительному слову. В этом случае также предоставляется ссылка на переписанный запрос.

Claim 12 (Независимый пункт): Детализирует оба сценария обработки и результат для пользователя.

Сценарий (Общеупотребительное название): Генерируется ссылка на переписанный запрос. Выполняется поиск по исходному запросу. Результаты и ссылка предоставляются пользователю.

Сценарий (Уникальное название): Исходный запрос переписывается с Restrict Identifier, идентифицирующим конкретный домен (particular domain). Генерируется ссылка на исходный запрос. Выполняется поиск в пределах этого домена. Результаты и ссылка предоставляются пользователю.

Claim 4 (Зависимый от 1): Вводит механизм защиты от разрыва устойчивых фраз.

Система определяет, образует ли слово рядом с Entity Name в запросе общеупотребительную фразу вместе с этим названием (например, "time travel"). Если ДА, поиск выполняется на основе исходного запроса, чтобы не разлагать фразу.

Claims 5, 6, 7 (Зависимые от 1): Описывают методы определения общеупотребительности.

Методы включают сравнение со словарем (Claim 5), использование IDF (inverse document frequency) или лингвистического моделирования (Claim 6), или использование предварительно сгенерированной таблицы (Claim 7).

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса и является ключевой частью интерпретации интента пользователя.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-подготовка данных: сбор сущностей, определение их идентификаторов (доменов), генерация Candidate Strings и расчет метрик общеупотребительности слов (например, IDF).

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система выполняет в реальном времени:

Распознавание сущностей (NER): Идентифицирует Entity Name в запросе путем сравнения со списком Candidate Strings.
Разрешение неоднозначности (Disambiguation): Определяет, является ли Entity Name общеупотребительным словом и не формирует ли оно устойчивое словосочетание с соседними словами (Claim 4).
Переписывание запроса (Query Rewriting): На основе разрешения неоднозначности система решает, переписать ли запрос, добавив Restrict Identifier, или предложить переписывание как опцию.

RANKING – Ранжирование
Этап ранжирования получает на вход уже обработанный запрос. Если запрос был переписан с Restrict Identifier, система ранжирования будет ограничена поиском только в пределах указанного домена или контекста.

Входные данные:

Исходный поисковый запрос пользователя.
Список Candidate Strings.
Лингвистические данные (словари, модели IDF) для определения common word or phrase.

Выходные данные:

Запрос для выполнения поиска (исходный или переписанный).
Ссылка на альтернативную интерпретацию запроса.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на брендовые, навигационные запросы и запросы типа [тема] + [бренд/источник] (например, "новости украина bbc" или "iphone 15 apple").
Конкретные ниши или тематики: Особенно актуально для СМИ (News), электронной коммерции (Stores, Brands) и любых ниш с большим количеством известных сущностей.
Типы контента: Влияет на то, будут ли в выдаче преобладать документы с официального сайта сущности или микс документов из разных источников.

Когда применяется

Триггер активации: В поисковом запросе обнаружен термин, который соответствует Entity Name в списке Candidate Strings.
Условия для автоматического переписывания: Происходит, если Entity Name НЕ является общеупотребительным словом.
Исключения: Автоматическое переписывание может быть заблокировано, если Entity Name является частью устойчивого словосочетания (например, "time travel").

Пошаговый алгоритм

Процесс А: Генерация данных (Офлайн)

Сбор сущностей: Получение списка Entity Names из директорий или путем анализа корпуса документов.
Идентификация: Определение Entity Identifier (например, домена) для каждого названия.
Генерация вариаций: Применение трансформаций (удаление Inc., .com, замена пробелов, обработка "and" и "&") для создания списка Candidate Strings.
Анализ общеупотребительности: Определение того, какие Entity Names являются common words or phrases (используя IDF, словари).

Процесс Б: Обработка запроса (Онлайн)

Получение запроса: Система получает запрос от пользователя.
Обнаружение сущности: Термины запроса (часто крайние левые или правые) сравниваются со списком Candidate Strings.
Проверка контекста (Опционально): Анализ соседних слов на предмет формирования устойчивой фразы. Если фраза найдена (например, "time travel"), процесс переписывания может быть остановлен.
Оценка общеупотребительности: Система определяет, является ли Entity Name common word or phrase.
Принятие решения и выполнение:
- Если НЕ общеупотребительное (Уникальное): Запрос переписывается с добавлением Restrict Identifier. Генерируется ссылка на исходный запрос. Поиск выполняется по переписанному запросу.
- Если общеупотребительное (Неоднозначное): Запрос остается исходным. Генерируется ссылка на переписанный (ограниченный) запрос. Поиск выполняется по исходному запросу.
Презентация результатов: Отображение результатов поиска и ссылки на альтернативный запрос.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании предварительно обработанных данных о сущностях и лингвистических данных.

Структурные данные (Сущности): Entity Names, Entity Identifiers (домены, URL) и их вариации (Candidate Strings). Эти данные собираются из внешних источников (директории) или путем анализа корпуса документов.
Лингвистические данные: Данные для определения common word or phrase. Это могут быть словари, данные об обратной частоте документов (IDF) или данные лингвистических моделей (частотность терминов).
Контентные факторы (Косвенно): Анализ корпуса документов используется офлайн для выявления устойчивых фраз, которые не следует разлагать (фразы, встречающиеся чаще порогового числа раз).

Какие метрики используются и как они считаются

В патенте упоминаются следующие методы оценки общеупотребительности (Commonality):

Inverse Document Frequency (IDF): Используется для определения распространенности Entity Name. Низкий IDF указывает на общеупотребительное слово.
Лингвистическое моделирование: Анализ корпуса документов для создания хэш-таблицы частотности терминов. Термины, встречающиеся чаще порогового значения, считаются общеупотребительными.
Словарная сверка: Прямое сравнение Entity Name со словарем слов и фраз.
Частотность фраз: Метрика для определения устойчивых словосочетаний, основанная на частоте их появления в корпусе документов.

Google активно управляет интентом при брендовых запросах: Система не просто ищет ключевые слова, а интерпретирует намерение пользователя: ищет ли он информацию НА сайте упомянутой сущности или О ней, и автоматически применяет ограничители (аналоги site: или source:).
Уникальность названия сущности как ключевой триггер: Критерием для автоматического переписывания запроса является уникальность названия сущности. Если оно совпадает с common word or phrase, Google предпочитает широкую интерпретацию (консервативный подход). Если оно уникально, Google склоняется к ограничению поиска доменом сущности.
Механизм разрешения неоднозначности и страховки: Система предусматривает "страховку" на случай ошибки интерпретации. Независимо от принятого решения, пользователю всегда предлагается ссылка на альтернативную версию поиска (широкую или ограниченную).
Защита от разрыва фраз: Включение опциональной проверки контекста (чтобы не разбивать фразы типа "time travel") показывает стремление сбалансировать агрессивное переписывание с сохранением исходного смысла запроса.
Зависимость от качества данных о сущностях: Эффективность системы зависит от полноты и точности предварительно сгенерированных списков Candidate Strings и корректности идентификации сущностей и их доменов.

Best practices (это мы делаем)

Обеспечение распознавания сущности (Entity Recognition): Убедитесь, что Google четко идентифицирует ваш бренд как сущность и ассоциирует его с правильным доменом (Entity Identifier). Используйте микроразметку Schema.org, поддерживайте актуальность данных в Knowledge Graph и обеспечивайте последовательный брендинг.
Стратегия для уникальных брендов: Если название вашего бренда уникально, этот механизм работает на вас, автоматически фокусируя смешанные запросы (тема + бренд) на вашем сайте. Критически важно иметь качественный контент на сайте по всем темам, связанным с брендом, так как выдача может быть ограничена только вашим доменом.
Стратегия для брендов с общеупотребительными названиями: Если название вашего бренда неоднозначно (например, "Apple", "Time"), необходимо активно работать над Topical Authority и E-E-A-T. Так как по умолчанию Google выполняет широкий поиск, ваш сайт должен быть достаточно авторитетным, чтобы занять высокие позиции в конкурентной выдаче.
Мониторинг интерпретации брендовых запросов: Регулярно проверяйте, как Google обрабатывает запросы с вашим брендом. Если Google предлагает ссылку "Искать только на сайте X", это значит, что он считает название общеупотребительным и выполняет широкий поиск по умолчанию.

Worst practices (это делать не надо)

Выбор общеупотребительных слов в качестве названия бренда: Это создает проблему неоднозначности. Google будет предпочитать широкую интерпретацию запроса, что усложняет контроль над выдачей по брендовым запросам и требует больших усилий для ранжирования.
Игнорирование неоднозначности бренда: Ошибочно предполагать, что Google всегда понимает, что пользователь ищет именно ваш бренд, если его название совпадает с общеупотребительными словами.
Непоследовательное представление бренда: Частое изменение названия или использование множества разных вариантов написания может затруднить формирование корректного списка Candidate Strings и привести к ошибкам в распознавании интента.

Стратегическое значение

Патент подчеркивает стратегическую важность распознавания сущностей в алгоритмах Google. Он демонстрирует переход от простого сопоставления ключевых слов к интерпретации интента пользователя, связанного с конкретными сущностями. Стратегическое значение для SEO заключается в понимании того, что интерпретация запроса может радикально меняться в зависимости от того, как Google классифицирует упомянутые в нем сущности (как уникальные или неоднозначные). Это напрямую влияет на долгосрочную стратегию построения и продвижения бренда.

Практические примеры

Сценарий 1: Бренд с уникальным названием (Пример: "MSNBC")

Запрос пользователя: "выборы 2024 msnbc"
Действие Google: Система распознает "msnbc" как Entity Name и определяет, что это НЕ common word or phrase.
Переписывание: Запрос автоматически переписывается в "выборы 2024 source:msnbc" (или аналог site:msnbc.com).
Результат в SERP: Пользователь видит результаты ТОЛЬКО с сайта MSNBC. Отображается ссылка: "Искать 'выборы 2024 msnbc' во всех источниках".
Действие SEO: Для MSNBC важно обеспечить полноту освещения темы "выборы 2024" на своем сайте.

Сценарий 2: Бренд с общеупотребительным названием (Пример: "Time")

Запрос пользователя: "лучшие изобретения time"
Действие Google: Система распознает "time" как Entity Name (журнал), но определяет, что это ЯВЛЯЕТСЯ common word or phrase.
Переписывание: Запрос НЕ переписывается автоматически.
Результат в SERP: Пользователь видит смешанные результаты по запросу "лучшие изобретения time". Отображается ссылка: "Искать 'лучшие изобретения' только на сайте Time".
Действие SEO: Для Time.com важно ранжироваться в этой широкой выдаче на основе авторитетности, конкурируя с другими источниками.

Как Google определяет, является ли название сущности «общеупотребительным словом» (common word or phrase)?

Патент предлагает несколько методов. Система может сравнивать название со словарем. Также может использоваться метод обратной частоты документов (IDF) — если слово встречается очень часто во многих документах (низкий IDF), оно считается общеупотребительным. Кроме того, могут применяться лингвистические модели, основанные на анализе частотности терминов в большом корпусе документов.

Что такое «Restrict Identifier» и как он используется?

Это специальный оператор, который система добавляет к запросу для ограничения области поиска. В патенте приводятся примеры, эквивалентные операторам source: (для новостей) или site: (для веб-поиска). Этот идентификатор позволяет сфокусировать поиск на конкретном домене (Entity Identifier), связанном с обнаруженной сущностью.

Что произойдет, если название моей компании уникально, но Google ошибочно считает его общеупотребительным?

В этом случае Google по умолчанию будет выполнять широкий поиск по запросам, включающим название вашей компании, вместо того чтобы автоматически ограничивать поиск вашим доменом. Это означает, что в выдаче будут присутствовать любые сайты, упоминающие это название. Вам придется конкурировать в этой широкой выдаче, хотя Google, вероятно, предложит пользователям ссылку для ограничения поиска вашим доменом.

Как система обрабатывает устойчивые словосочетания, включающие названия сущностей, например, «Time Travel»?

Патент предусматривает опциональный шаг проверки контекста (Claim 4). Если комбинация названия сущности и соседних слов идентифицируется как устойчивая фраза (на основе частотного анализа), система определяет, что фразу не следует разлагать. В этом случае автоматическое переписывание запроса для ограничения поиска сущностью (например, журналом "Time") не произойдет.

Влияет ли этот патент на то, как мне следует выбирать название для нового бренда?

Да, это следует учитывать. Уникальное название повышает вероятность того, что Google автоматически сфокусирует брендовые запросы на вашем домене. Общеупотребительное название (например, "Cookies") заставит вас конкурировать в широкой выдаче по этому термину, так как Google будет предпочитать интерпретацию запроса как общего понятия, а не как вашего бренда.

Как система узнает, какие сущности существуют и какие у них домены?

Это происходит в ходе офлайн-процесса. Система собирает список названий сущностей (Entity Names) из онлайн-директорий, списков или путем анализа документов. Затем для каждого названия определяется идентификатор (Entity Identifier), например, доменное имя. После этого генерируются различные варианты написания (Candidate Strings) для распознавания.

Применяется ли этот механизм только к названиям компаний или также к продуктам и людям?

Патент определяет "Сущность" (Entity) широко. Она может включать новостные источники, магазины, категории продуктов, бренды, производителей, конкретные модели продуктов, авторов, людей, места и организации. Механизм потенциально применим к любой из этих категорий, если для них определены соответствующие Restrict Identifiers.

Если мой бренд имеет общеупотребительное название, могу ли я заставить Google автоматически ограничивать поиск моим доменом?

Согласно патенту, если название классифицировано как common word or phrase, автоматическое ограничение по умолчанию не применяется. Ваша стратегия должна заключаться в том, чтобы стать настолько авторитетным источником по этому термину, чтобы доминировать в широкой выдаче. Со временем, если поведение пользователей покажет явное предпочтение вашего сайта, интерпретация может измениться, но описанный механизм работает против этого.

Насколько актуальны методы распознавания сущностей, описанные в этом патенте 2004 года?

Методы, описанные в патенте (сверка со списком Candidate Strings, использование IDF), вероятно, устарели. Современный Google использует гораздо более сложные методы NER (Named Entity Recognition), основанные на машинном обучении и Knowledge Graph. Однако базовый принцип — распознать сущность, оценить ее неоднозначность и переписать запрос — остается фундаментальным.

Что важнее для этого алгоритма: авторитетность сущности или уникальность ее названия?

Уникальность названия (отсутствие связи с common word or phrase) является определяющим фактором для активации автоматического переписывания запроса, согласно этому патенту. Авторитетность сущности не упоминается как критерий для принятия этого конкретного решения. Алгоритм фокусируется на разрешении лингвистической и интентовой неоднозначности.

Как Google использует окружающие слова для исправления опечаток в названиях брендов, продуктов и именах людей в запросах

Google создает базу данных, связывающую имена сущностей (бренды, люди, продукты) со словами, которые часто появляются рядом с ними (контекст). Когда пользователь допускает опечатку в имени, Google использует другие слова в этом запросе как контекстные подсказки, чтобы найти наиболее вероятную подразумеваемую сущность, учитывая её популярность, силу связи с контекстом и вероятность конкретной опечатки.

US8402032B1
2013-03-19

Индексация
Семантика и интент
Knowledge Graph

Как Google использует атрибуты сущностей для генерации «Дополненных запросов» и уточнения поиска

Google использует механизм для помощи в исследовании тем, связанных с сущностями (люди, места, продукты). Система распознает сущность в запросе, определяет ее ключевые атрибуты (анализируя результаты поиска или Knowledge Graph) и автоматически генерирует список предлагаемых «дополненных запросов» (Сущность + Атрибут). Это позволяет пользователю одним кликом запустить новый, более сфокусированный поиск по теме.

US10055462B2
2018-08-21

Семантика и интент
Knowledge Graph
SERP

Как Google распознает и объединяет дубликаты сущностей в Knowledge Graph, используя агрессивную нормализацию имен

Google использует многоэтапный процесс для разрешения сущностей (Entity Resolution). Система агрессивно нормализует имена сущностей (удаляя стоп-слова, титулы, знаки препинания и сортируя слова по алфавиту), чтобы сгруппировать потенциальные дубликаты. Затем она сравнивает другие атрибуты (факты) этих сущностей, чтобы принять окончательное решение об их объединении в Knowledge Graph.

US8700568B2
2014-04-15

Knowledge Graph

Как Google определяет сущности (например, болезни) по списку признаков (например, симптомов) в запросе пользователя

Google использует различные методы для ответа на запросы, содержащие список признаков (атрибутов), но не называющие саму сущность. Система определяет, какой тип сущности ищет пользователь (например, медицинское состояние по симптомам), и идентифицирует наиболее релевантные сущности. Для этого анализируется частота упоминания сущностей в результатах поиска по исходному запросу или используются специально сгенерированные комбинированные запросы.

US8843466B1
2014-09-23

Семантика и интент
Knowledge Graph
Индексация

Как Google использует историю кликов для автоматического переписывания запросов и ограничения поиска по конкретным сайтам или сущностям

Google анализирует агрегированные данные о поведении пользователей (Query Logs), чтобы определить, когда название бренда или сущности в запросе указывает на намерение искать только на этом сайте. Если пользователи подавляюще кликают на один домен при использовании определенного термина (пиковое распределение кликов), Google автоматически переписывает запрос для ограничения поиска (например, добавляя оператор типа store: или site:). Если намерение неоднозначно, Google предлагает переписанный запрос в виде ссылки.

US7996419B2
2011-08-09

Семантика и интент
Поведенческие сигналы
SERP

Как Google использует историю кликов пользователей для определения интента, связанного с физическим адресом, и таргетинга рекламы

Google анализирует, какие поисковые запросы исторически приводят к наибольшему количеству кликов по бизнесам, расположенным по определенному адресу. Когда пользователь ищет этот адрес (или смотрит его на карте), Google использует этот «Самый популярный поисковый термин» (Most-Popular Search Term), чтобы определить намерение пользователя и показать релевантную информацию и рекламу.

US20150261858A1
2015-09-17

Local SEO
Семантика и интент
Поведенческие сигналы

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска

Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.

US8874594B2
2014-10-28

Персонализация
Поведенческие сигналы
Local SEO

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи

Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.

US9092510B1
2015-07-28

Свежесть контента
Поведенческие сигналы
SERP

Как Google объединяет данные о ссылках и кликах для расчета авторитетности страниц (Query-Independent Score)

Google использует механизм расчета независимой от запроса оценки авторитетности (Query-Independent Score) с помощью дополненного графа ресурсов. Этот граф объединяет традиционные ссылки между страницами с данными о поведении пользователей, такими как клики по результатам поиска (CTR). Авторитетность передается не только через ссылки, но и через запросы, позволяя страницам с высоким уровнем вовлеченности пользователей набирать авторитет, даже если у них мало обратных ссылок.

US8386495B1
2013-02-26

Поведенческие сигналы
Ссылки
SERP

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко

Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.

US8521725B1
2013-08-27

Поведенческие сигналы
SERP
Семантика и интент

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников

Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.

US8745067B2
2014-06-03

EEAT и качество
Свежесть контента
Семантика и интент

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга

Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.

US11409812B1
2022-08-09

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования

Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.

US8195654B1
2012-06-05

Поведенческие сигналы
SERP

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории

Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.

US8788490B1
2014-07-22

Local SEO
Ссылки
SERP

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования

Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.

US8688716B1
2014-04-01

SERP
Поведенческие сигналы