
Google интерпретирует запросы в специализированных доменах (например, медиа, товары, музыка), используя базу данных сущностей с оценками популярности (Entity Scores). Система распознает сущности в запросе, разрешает неоднозначности с помощью этих оценок и контекста, и преобразует неструктурированный текстовый или голосовой запрос в структурированный поиск по конкретным полям (например, ищет имя актера в поле «Актер»).
Патент решает проблему неточной интерпретации поисковых запросов в специализированных доменах (Search Domains), где традиционный поиск по ключевым словам часто дает нерелевантные результаты. Например, поиск "action movie with tom cruise" может вернуть "Last Action Hero" и "Tom and Jerry". Изобретение направлено на понимание структуры запроса и идентификацию конкретных сущностей и их типов для выполнения точного структурированного поиска.
Запатентована система интерпретации запросов (текстовых и голосовых), которая использует предварительно созданную базу данных сущностей (Entity Table) для определенного домена. Эта база содержит имена сущностей, их типы (Entity Types) и оценки (Entity Scores), основанные на популярности. Система распознает сущности в запросе и использует Entity Scores и контекстную информацию (Contextual Information) для разрешения неоднозначностей, преобразуя запрос в структурированный формат.
Система работает в двух режимах: офлайн и онлайн.
Entity Table путем извлечения метаданных из источников домена. Для каждой сущности (например, "House" как сериал и "House" как фильм) рассчитывается Entity Score (на основе популярности, кликов, частоты доступа).Entity Table. Найденные совпадения интерпретируются: неоднозначности разрешаются с помощью Entity Scores (выбирается более популярная интерпретация), удаляются перекрывающиеся сущности (например, "Tom" удаляется, если найдено "Tom Cruise"), и учитывается контекст. Оставшиеся сущности используются для структурированного поиска (например, Жанр: "Action", Актер: "Tom Cruise").Высокая. Переход от ключевых слов к сущностям (entities) является фундаментальным направлением развития поиска Google (Knowledge Graph). Описанные механизмы критически важны для работы вертикального поиска (Shopping, Video, Books) и голосового поиска. Использование сигналов популярности и поведения пользователей для понимания запросов остается актуальной практикой.
Патент имеет высокое значение (8/10), особенно для сайтов в четко определенных вертикалях (eCommerce, медиа, книги). Он показывает, что для успешного ранжирования критически важно, чтобы Google правильно идентифицировал ваши сущности (продукты, авторов) и ассоциировал их с высоким Entity Score (популярностью). Это подчеркивает важность структурированных данных и работы над популярностью бренда/продукта для корректной интерпретации запросов.
Voice Recognition Terms) на основе Entity Scores соответствующих сущностей. Помогает выбрать наиболее вероятную текстовую интерпретацию голоса.Claim 1 (Независимый пункт): Описывает основной метод интерпретации поискового запроса в определенном домене.
Entity Name), извлеченному из метаданных домена.Entity Types).Entity Score) для каждой комбинации Имя+Тип. Entity Score указывает на связанность (relatedness) имени и типа и основан, в частности, на количестве доступов к медиаконтенту, ассоциированному с этой комбинацией (т.е. популярность/использование).Entity Score. (Выбирается наиболее вероятная интерпретация).Claim 4 (Зависимый от 1): Детализирует офлайн-процесс создания Entity Table.
Entity Table.Claim 5 (Зависимый от 4): Уточняет, что Entity Table может быть дополнена курируемой вручную информацией (curated entity information), включая игнорируемые термины (стоп-слова).
Claim 7 (Зависимый от 1): Описывает процесс периодического обновления Entity Table на основе обновленных метаданных.
Изобретение затрагивает несколько этапов поиска, фокусируясь на создании специализированных индексов и интерпретации запросов.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основной офлайн-процесс. Система извлекает метаданные из источников, специфичных для домена. Происходит извлечение сущностей, определение их типов и расчет Entity Scores на основе сигналов популярности или пользовательского поведения (клики, просмотры). Результатом является Entity Table – специализированный словарь для домена.
QUNDERSTANDING – Понимание Запросов
Это основная область применения патента в онлайн-режиме. Когда пользователь вводит запрос (текст или голос), система использует Entity Table для его интерпретации. Происходит сегментация, распознавание сущностей и разрешение неоднозначностей (Disambiguation) с использованием Entity Scores и контекста. На выходе неструктурированный запрос преобразуется в структурированное намерение.
RANKING – Ранжирование
Система выполняет структурированный поиск, используя интерпретированный запрос. Поиск выполняется по конкретным полям базы данных (Entity Types), что повышает точность. В патенте приводится пример SQL-подобного запроса: SELECT * from MOVIE where GENRE is "action" AND ACTOR is "tom cruise".
Входные данные:
click logs), вручную курируемые данные.Entity Table.Выходные данные:
Entity Table (Name, Type, Score).Search Domain или когда система определяет, что запрос относится к специфической вертикали (Claim 6).Entity Table для данного домена. Алгоритм интерпретации запускается при обнаружении совпадений между терминами запроса и записями в таблице.Процесс А: Генерация Таблицы Сущностей (Офлайн - INDEXING)
user click information) и курируемым данным (manual curation information).Entity Names и их Entity Types из метаданных (например, "Apple" как BRAND).Entity Score для каждой пары Имя/Тип. Оценка базируется на популярности (рейтинги, частота поиска, количество доступов к контенту). Может включать агрегацию и взвешивание (например, по свежести).Entity Table.Процесс Б: Интерпретация Текстового Запроса (Онлайн - QUNDERSTANDING)
Entity Table.Entity Score и Contextual Information: Entity Score (например, выбор "House" (Series) вместо "House" (Movie)).Процесс В: Интерпретация Голосового Запроса (Онлайн - QUNDERSTANDING)
Voice Recognition Terms.Entity Table.Feasibility Score для каждого термина на основе Entity Scores найденных сущностей. Могут применяться штрафы (penalty scores/weights) за слова, не распознанные как сущности.Voice Recognition Terms по Feasibility Score.Feasibility Score.Патент фокусируется на использовании метаданных и поведенческих сигналов для интерпретации запросов.
Entity Score. Упоминаются: click log, User Click Information).User ratings).popularity score). Entity Score актера может быть средним значением Entity Scores его фильмов) и взвешивание (например, недавний контент имеет больший вес).Entity Scores сущностей, распознанных в варианте речи. Может быть взвешенным средним с применением штрафов (penalty scores/weights), если часть термина не распознана как сущность.Entity Score, основанный на популярности и поведении пользователей, используется на этапе понимания запроса для разрешения неоднозначностей. Если сущность более популярна, Google с большей вероятностью интерпретирует запрос в ее пользу.Entity Tables – словари сущностей и их оценок для конкретных вертикалей. Попадание в этот словарь и наличие высокого Entity Score критически важно для видимости.Entity Score (популярность) и Contextual Information (структура запроса) для выбора наиболее вероятной интерпретации термина.Entity Score) напрямую используется для повышения точности распознавания речи (через Feasibility Score). Более популярные сущности распознаются лучше.Entity Names и Entity Types для построения Entity Table.Entity Score основан на популярности и взаимодействии (клики, просмотры, рейтинги), работайте над повышением узнаваемости и востребованности ваших ключевых сущностей. Это напрямую влияет на вероятность их правильной интерпретации в неоднозначных запросах.Contextual Information для правильной интерпретации.Entity Score, что увеличит Feasibility Score при распознавании речи.Entity Score.Entity Score с помощью накруток кликов или просмотров рискованны и, вероятно, будут отфильтрованы системами оценки качества Google.Патент подтверждает стратегическую важность Entity-Based SEO и глубокой интеграции данных о поведении пользователей на ранних этапах обработки запроса (Query Understanding). Для SEO-специалистов это означает, что стратегия должна включать не только оптимизацию контента, но и управление сущностями (Entity Management) и их популярностью. В вертикальном поиске преимущество получают те сайты, чьи сущности четко определены, структурированы и имеют высокий уровень взаимодействия с пользователями.
Сценарий 1: Разрешение неоднозначности для eCommerce
Entity Table для товаров и находит обе сущности.Entity Scores. Если Microsoft Surface имеет значительно больше поисковых запросов, кликов и покупок, его Entity Score будет выше.Entity Score в своем типе.Сценарий 2: Улучшение распознавания голосового запроса
Voice Recognition Terms): "Watch French", "Watch Fringe", "Watch Friends".Entity Scores для "French" (Язык/Жанр), "Fringe" (Сериал) и "Friends" (Сериал). Если "Fringe" имеет высокую популярность как сериал, комбинация ["Watch" (Action) + "Fringe" (Series)] получит высокий Feasibility Score.Entity Score и улучшить распознаваемость в голосовом поиске.Что такое Entity Score в контексте этого патента и как он влияет на SEO?
Entity Score — это оценка, которая отражает популярность или значимость сущности в определенном домене (паре Имя/Тип). Она рассчитывается на основе поведения пользователей: кликов, просмотров, рейтингов, частоты доступа к контенту. В SEO это критически важно, так как Entity Score используется Google на этапе понимания запроса для разрешения неоднозначностей. Если ваш продукт конкурирует с другим объектом с похожим названием, тот, у кого выше Entity Score, получит приоритет в интерпретации запроса.
Как этот патент связан с микроразметкой Schema.org?
Патент описывает процесс создания Entity Table путем извлечения метаданных из источников домена. Микроразметка Schema.org является одним из ключевых способов предоставления этих метаданных поисковой системе. Внедряя точную и полную разметку, вы помогаете Google правильно идентифицировать ваши Entity Names и ассоциировать их с корректными Entity Types, что является основой для работы описанного механизма.
Применяется ли этот патент к обычному веб-поиску или только к вертикалям?
Патент в первую очередь описывает механизмы для специализированных поисковых доменов (Search Domains), таких как медиа, товары (вертикальный поиск). Однако принципы интерпретации запросов на основе сущностей и использования оценок популярности для разрешения неоднозначностей применяются и в основном веб-поиске, особенно с развитием Knowledge Graph, который можно рассматривать как глобальную Entity Table.
Как я могу повлиять на Entity Score моих сущностей?
Вы можете повлиять на Entity Score, работая над реальной популярностью и востребованностью ваших сущностей. Это включает получение положительных отзывов и рейтингов, увеличение количества брендовых/продуктовых запросов, стимулирование кликов и взаимодействий с вашим контентом. Также важно обеспечить консистентное упоминание сущности в авторитетных источниках, чтобы Google мог консолидировать сигналы популярности.
Что такое Contextual Information и как она используется?
Contextual Information — это данные, извлеченные из самого запроса, такие как порядок слов и соседние термины. Система использует этот контекст вместе с Entity Score для удаления маловероятных интерпретаций. Например, в запросе "action movie 2012", контекст (наличие слов "action movie") подсказывает системе, что "2012" скорее всего является датой выпуска (Entity Type: DATE), а не названием фильма (Entity Type: MOVIE).
Как этот патент влияет на стратегию SEO для eCommerce?
Для eCommerce это означает, что оптимизация фида продуктов и структурированных данных критически важна для обеспечения правильной идентификации товаров и их атрибутов. Кроме того, популярность продукта (отраженная в Entity Score) напрямую влияет на его видимость, особенно по общим или неоднозначным запросам. Стратегия должна включать активное управление отзывами и стимулирование спроса.
Что означает удаление перекрывающихся сущностей (Merging/Removing Overlapping Entities)?
Это процесс очистки интерпретации запроса. Если система распознает несколько сущностей, которые перекрываются в тексте запроса, она обычно отдает предпочтение более длинной или более точной сущности. Например, если в запросе "...tom cruise..." распознаны "Tom" и "Tom Cruise", система удалит "Tom" и будет использовать только "Tom Cruise" для дальнейшего поиска.
Как патент помогает улучшить голосовой поиск?
Патент описывает использование Entity Scores для выбора наилучшей текстовой интерпретации голосового ввода. Система рассчитывает Feasibility Score для разных вариантов распознавания речи. Варианты, содержащие более популярные сущности (с высоким Entity Score), получают более высокий Feasibility Score и выбираются как правильная интерпретация. Это значит, что популярные бренды и продукты распознаются точнее.
Что такое Manually Curated Information и зачем это нужно?
Это информация, добавленная в систему вручную. Патент упоминает, что она может включать стоп-слова (например, "with", "the"), которые система должна игнорировать при интерпретации запроса. Также это может включать правила для обработки специальных символов или добавление новых популярных сущностей, которые еще не попали в автоматические источники метаданных.
В чем разница между Entity Score и PageRank?
Entity Score, как описано в патенте, основан на популярности и поведенческих факторах (клики, просмотры) и используется на этапе Понимания Запроса для разрешения неоднозначностей сущностей. PageRank основан на ссылочной структуре интернета и используется для определения авторитетности веб-страниц на этапах Индексирования и Ранжирования. Это разные метрики, применяемые для разных целей на разных этапах поиска.

Семантика и интент
Knowledge Graph
SERP

Семантика и интент
Мультимедиа
Индексация

Knowledge Graph
Семантика и интент

Knowledge Graph
Семантика и интент
Поведенческие сигналы

EEAT и качество
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Мультиязычность
Ссылки
SERP

Антиспам
Ссылки
Семантика и интент

Семантика и интент
Поведенческие сигналы

Ссылки
Индексация
Краулинг

Local SEO
SERP
Ссылки

Персонализация
Семантика и интент
Поведенческие сигналы

EEAT и качество
Ссылки
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Персонализация
Семантика и интент
Поведенческие сигналы
