
Google использует систему для распознавания сущностей (например, брендов, новостных изданий) в поисковых запросах. Система оценивает, является ли название сущности общеупотребительным словом. Если название уникально (например, «MSNBC»), запрос автоматически переписывается для поиска только на сайте этой сущности. Если название общеупотребительно (например, «Time»), выполняется обычный поиск, но предлагается ссылка для ограничения поиска сайтом этой сущности.
Патент решает проблему неоднозначности пользовательского интента, когда запрос содержит название сущности (например, бренда, магазина, новостного источника). Система должна определить, хочет ли пользователь ограничить поиск документами этой сущности (например, искать только на washingtonpost.com), или он ищет информацию об этой сущности в целом. Проблема усугубляется, когда названия сущностей совпадают с общеупотребительными словами (например, журнал "Time" против концепции "время"). Патент автоматизирует применение ограничивающих операторов (например, site: или source:), устраняя необходимость их ручного ввода.
Запатентована система для выборочного переписывания поисковых запросов на основе обнаружения названий сущностей (Entity Names). Ключевой механизм — это определение того, связано ли обнаруженное название сущности с общеупотребительным словом или фразой (common word or phrase). На основе этой оценки принимается решение: автоматически переписать запрос, добавив идентификатор ограничения (restrict identifier), или выполнить исходный запрос, предложив переписанный вариант как альтернативу.
Механизм включает офлайн и онлайн процессы:
Candidate Strings). Также определяется, какие названия являются общеупотребительными.Candidate Strings.Высокая. Распознавание сущностей (Entity Recognition) и понимание намерений пользователя (Query Understanding) являются фундаментальными задачами поиска. Хотя конкретные методы оценки неоднозначности с момента подачи патента (2004 год) эволюционировали (например, от IDF к нейронным сетям и Knowledge Graph), описанный в патенте принцип интеллектуального переписывания запросов для разрешения неоднозначности между поиском "на сущности" и "о сущности" остается критически важным для Google в 2025 году.
Патент имеет высокое значение (75/100) для SEO, особенно в контексте брендовых запросов. Он описывает механизм, который напрямую влияет на то, как Google обрабатывает запросы, включающие названия компаний или изданий. Если Google интерпретирует запрос как поиск внутри вашего сайта (даже без оператора site:), это радикально меняет SERP. Понимание этого механизма критично для стратегий, связанных с видимостью бренда и управлением трафиком по смешанным запросам (тема + бренд).
IDF или лингвистическим моделям). Критерий для принятия решения о способе переписывания запроса.source: или site:).Claim 1 (Независимый пункт): Описывает основной метод обработки поискового запроса и логику принятия решений.
Entity Name.Entity Name одному из common words or phrases.Restrict Identifier, ограничивающего поиск доменом (domain), связанным с Entity Name.Entity Name НЕ соответствует общеупотребительному слову.Entity Name соответствует общеупотребительному слову. В этом случае также предоставляется ссылка на переписанный запрос.Claim 12 (Независимый пункт): Детализирует оба сценария обработки и результат для пользователя.
Сценарий (Общеупотребительное название): Генерируется ссылка на переписанный запрос. Выполняется поиск по исходному запросу. Результаты и ссылка предоставляются пользователю.
Сценарий (Уникальное название): Исходный запрос переписывается с Restrict Identifier, идентифицирующим конкретный домен (particular domain). Генерируется ссылка на исходный запрос. Выполняется поиск в пределах этого домена. Результаты и ссылка предоставляются пользователю.
Claim 4 (Зависимый от 1): Вводит механизм защиты от разрыва устойчивых фраз.
Система определяет, образует ли слово рядом с Entity Name в запросе общеупотребительную фразу вместе с этим названием (например, "time travel"). Если ДА, поиск выполняется на основе исходного запроса, чтобы не разлагать фразу.
Claims 5, 6, 7 (Зависимые от 1): Описывают методы определения общеупотребительности.
Методы включают сравнение со словарем (Claim 5), использование IDF (inverse document frequency) или лингвистического моделирования (Claim 6), или использование предварительно сгенерированной таблицы (Claim 7).
Изобретение применяется на ранних этапах обработки запроса и является ключевой частью интерпретации интента пользователя.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит офлайн-подготовка данных: сбор сущностей, определение их идентификаторов (доменов), генерация Candidate Strings и расчет метрик общеупотребительности слов (например, IDF).
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Система выполняет в реальном времени:
Entity Name в запросе путем сравнения со списком Candidate Strings.Entity Name общеупотребительным словом и не формирует ли оно устойчивое словосочетание с соседними словами (Claim 4).Restrict Identifier, или предложить переписывание как опцию.RANKING – Ранжирование
Этап ранжирования получает на вход уже обработанный запрос. Если запрос был переписан с Restrict Identifier, система ранжирования будет ограничена поиском только в пределах указанного домена или контекста.
Входные данные:
Candidate Strings.IDF) для определения common word or phrase.Выходные данные:
Entity Name в списке Candidate Strings.Entity Name НЕ является общеупотребительным словом.Entity Name является частью устойчивого словосочетания (например, "time travel").Процесс А: Генерация данных (Офлайн)
Entity Names из директорий или путем анализа корпуса документов.Entity Identifier (например, домена) для каждого названия.Candidate Strings.Entity Names являются common words or phrases (используя IDF, словари).Процесс Б: Обработка запроса (Онлайн)
Candidate Strings.Entity Name common word or phrase.Restrict Identifier. Генерируется ссылка на исходный запрос. Поиск выполняется по переписанному запросу.Патент фокусируется на использовании предварительно обработанных данных о сущностях и лингвистических данных.
Entity Names, Entity Identifiers (домены, URL) и их вариации (Candidate Strings). Эти данные собираются из внешних источников (директории) или путем анализа корпуса документов.common word or phrase. Это могут быть словари, данные об обратной частоте документов (IDF) или данные лингвистических моделей (частотность терминов).В патенте упоминаются следующие методы оценки общеупотребительности (Commonality):
Entity Name. Низкий IDF указывает на общеупотребительное слово.Entity Name со словарем слов и фраз.site: или source:).common word or phrase, Google предпочитает широкую интерпретацию (консервативный подход). Если оно уникально, Google склоняется к ограничению поиска доменом сущности.Candidate Strings и корректности идентификации сущностей и их доменов.Entity Identifier). Используйте микроразметку Schema.org, поддерживайте актуальность данных в Knowledge Graph и обеспечивайте последовательный брендинг.E-E-A-T. Так как по умолчанию Google выполняет широкий поиск, ваш сайт должен быть достаточно авторитетным, чтобы занять высокие позиции в конкурентной выдаче.Candidate Strings и привести к ошибкам в распознавании интента.Патент подчеркивает стратегическую важность распознавания сущностей в алгоритмах Google. Он демонстрирует переход от простого сопоставления ключевых слов к интерпретации интента пользователя, связанного с конкретными сущностями. Стратегическое значение для SEO заключается в понимании того, что интерпретация запроса может радикально меняться в зависимости от того, как Google классифицирует упомянутые в нем сущности (как уникальные или неоднозначные). Это напрямую влияет на долгосрочную стратегию построения и продвижения бренда.
Сценарий 1: Бренд с уникальным названием (Пример: "MSNBC")
Entity Name и определяет, что это НЕ common word or phrase.site:msnbc.com).Сценарий 2: Бренд с общеупотребительным названием (Пример: "Time")
Entity Name (журнал), но определяет, что это ЯВЛЯЕТСЯ common word or phrase.Как Google определяет, является ли название сущности «общеупотребительным словом» (common word or phrase)?
Патент предлагает несколько методов. Система может сравнивать название со словарем. Также может использоваться метод обратной частоты документов (IDF) — если слово встречается очень часто во многих документах (низкий IDF), оно считается общеупотребительным. Кроме того, могут применяться лингвистические модели, основанные на анализе частотности терминов в большом корпусе документов.
Что такое «Restrict Identifier» и как он используется?
Это специальный оператор, который система добавляет к запросу для ограничения области поиска. В патенте приводятся примеры, эквивалентные операторам source: (для новостей) или site: (для веб-поиска). Этот идентификатор позволяет сфокусировать поиск на конкретном домене (Entity Identifier), связанном с обнаруженной сущностью.
Что произойдет, если название моей компании уникально, но Google ошибочно считает его общеупотребительным?
В этом случае Google по умолчанию будет выполнять широкий поиск по запросам, включающим название вашей компании, вместо того чтобы автоматически ограничивать поиск вашим доменом. Это означает, что в выдаче будут присутствовать любые сайты, упоминающие это название. Вам придется конкурировать в этой широкой выдаче, хотя Google, вероятно, предложит пользователям ссылку для ограничения поиска вашим доменом.
Как система обрабатывает устойчивые словосочетания, включающие названия сущностей, например, «Time Travel»?
Патент предусматривает опциональный шаг проверки контекста (Claim 4). Если комбинация названия сущности и соседних слов идентифицируется как устойчивая фраза (на основе частотного анализа), система определяет, что фразу не следует разлагать. В этом случае автоматическое переписывание запроса для ограничения поиска сущностью (например, журналом "Time") не произойдет.
Влияет ли этот патент на то, как мне следует выбирать название для нового бренда?
Да, это следует учитывать. Уникальное название повышает вероятность того, что Google автоматически сфокусирует брендовые запросы на вашем домене. Общеупотребительное название (например, "Cookies") заставит вас конкурировать в широкой выдаче по этому термину, так как Google будет предпочитать интерпретацию запроса как общего понятия, а не как вашего бренда.
Как система узнает, какие сущности существуют и какие у них домены?
Это происходит в ходе офлайн-процесса. Система собирает список названий сущностей (Entity Names) из онлайн-директорий, списков или путем анализа документов. Затем для каждого названия определяется идентификатор (Entity Identifier), например, доменное имя. После этого генерируются различные варианты написания (Candidate Strings) для распознавания.
Применяется ли этот механизм только к названиям компаний или также к продуктам и людям?
Патент определяет "Сущность" (Entity) широко. Она может включать новостные источники, магазины, категории продуктов, бренды, производителей, конкретные модели продуктов, авторов, людей, места и организации. Механизм потенциально применим к любой из этих категорий, если для них определены соответствующие Restrict Identifiers.
Если мой бренд имеет общеупотребительное название, могу ли я заставить Google автоматически ограничивать поиск моим доменом?
Согласно патенту, если название классифицировано как common word or phrase, автоматическое ограничение по умолчанию не применяется. Ваша стратегия должна заключаться в том, чтобы стать настолько авторитетным источником по этому термину, чтобы доминировать в широкой выдаче. Со временем, если поведение пользователей покажет явное предпочтение вашего сайта, интерпретация может измениться, но описанный механизм работает против этого.
Насколько актуальны методы распознавания сущностей, описанные в этом патенте 2004 года?
Методы, описанные в патенте (сверка со списком Candidate Strings, использование IDF), вероятно, устарели. Современный Google использует гораздо более сложные методы NER (Named Entity Recognition), основанные на машинном обучении и Knowledge Graph. Однако базовый принцип — распознать сущность, оценить ее неоднозначность и переписать запрос — остается фундаментальным.
Что важнее для этого алгоритма: авторитетность сущности или уникальность ее названия?
Уникальность названия (отсутствие связи с common word or phrase) является определяющим фактором для активации автоматического переписывания запроса, согласно этому патенту. Авторитетность сущности не упоминается как критерий для принятия этого конкретного решения. Алгоритм фокусируется на разрешении лингвистической и интентовой неоднозначности.

Индексация
Семантика и интент
Knowledge Graph

Семантика и интент
Knowledge Graph
SERP

Knowledge Graph

Семантика и интент
Knowledge Graph
Индексация

Семантика и интент
Поведенческие сигналы
SERP

Local SEO
Семантика и интент
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Local SEO

Свежесть контента
Поведенческие сигналы
SERP

Поведенческие сигналы
Ссылки
SERP

Поведенческие сигналы
SERP
Семантика и интент

EEAT и качество
Свежесть контента
Семантика и интент

Поведенческие сигналы
Семантика и интент
SERP

Поведенческие сигналы
SERP

Local SEO
Ссылки
SERP

SERP
Поведенческие сигналы
