
Google анализирует логи запросов, чтобы понять, какую информацию пользователи чаще всего ищут о конкретных сущностях (например, «высота» для здания или «альбомы» для музыканта). Система комбинирует данные по конкретной сущности с данными по её типу, чтобы определить и ранжировать наиболее востребованные атрибуты. Эти атрибуты затем используются для формирования блоков с фактами (например, Knowledge Panel) в ответ на запросы, даже если пользователь не спрашивал об этих фактах напрямую.
Патент решает задачу определения того, какие типы информации (атрибуты) наиболее востребованы пользователями при поиске информации о различных сущностях. Система должна учитывать, что интерес пользователей варьируется в зависимости от типа сущности (например, для машин важен пробег, для зданий — высота). Цель — автоматически идентифицировать и ранжировать наиболее часто запрашиваемые факты для конкретной сущности, чтобы затем превентивно предоставлять эту информацию в результатах поиска (например, в блоках знаний/Knowledge Panel).
Запатентована система для анализа логов поисковых запросов с целью идентификации и ранжирования атрибутов сущностей. Система разделяет запросы на часть, описывающую сущность (Entity-descriptive portion), и суффикс (Suffix), указывающий на желаемый атрибут. Она рассчитывает частотность суффиксов как на уровне конкретной сущности (Entity-level count), так и на уровне типа сущности (Type-level count). Затем эти два показателя комбинируются для создания итоговой оценки (Score) и ранжирования атрибутов по их важности для пользователей.
Система анализирует Query Data (логи запросов) и подсчитывает частоту запросов. Каждый запрос разбивается на идентификатор сущности и суффикс (например, в «new york weather» «new york» — сущность, «weather» — суффикс). Система учитывает неоднозначность (например, «phoenix» может быть городом или группой) и распределяет частоту запроса между возможными сущностями на основе вероятностных оценок. Подсчитывается частота суффиксов для каждой отдельной сущности. Затем сущности группируются по типам (например, «Музыкант», «Город»), и частота суффиксов агрегируется на уровне типа. Финальная оценка атрибута для конкретной сущности вычисляется путем интерполяции её индивидуальной частоты и частоты для её типа. Это позволяет выявить важные атрибуты даже для малоизвестных сущностей, опираясь на данные по типу.
Высокая. Понимание сущностей и их атрибутов является ядром современного поиска (Entity SEO) и основой для функционирования Knowledge Graph и формирования информационных панелей (Knowledge Panels). Описанный механизм напрямую связан с тем, как Google определяет, какие именно факты показывать пользователю о той или иной сущности. Это критически важно для управления представлением бренда или персоны в поиске.
Патент имеет критическое значение (9/10) для стратегий, связанных с Entity SEO и оптимизацией под Knowledge Graph. Он раскрывает механизм, с помощью которого Google определяет, какие атрибуты сущности являются наиболее важными с точки зрения пользовательского спроса. Понимание этого механизма позволяет SEO-специалистам сфокусироваться на создании и структурировании контента, который отвечает на эти ключевые фактические запросы, и оптимизировать данные для попадания в информационные панели.
Probability Scores) этой связи.Entity-level count и Type-level count.Entity-descriptive portion.Claim 1 (Независимый пункт): Описывает основной метод анализа запросов для ранжирования атрибутов.
Query Data.Entity-descriptive portion и Suffix.Query Counts) для каждого запроса.Partial Query Count (оценка того, сколько раз запрос относился именно к этой сущности).Partial Query Counts оценивается Entity-level count — сколько раз конкретный суффикс использовался с конкретной (первой) сущностью.Type-level count — сколько раз этот суффикс использовался с любой сущностью данного типа.Score для первой сущности на основе комбинации Entity-level count и Type-level count.Claim 4 (Зависимый от 3, который зависит от 2 и 1): Описывает применение результатов анализа для ответов на запросы.
Factual Attributes, которые были ранее обозначены как часто запрашиваемые факты об этой сущности (на основе высокого ранга соответствующих суффиксов).Claim 8 (Зависимый от 1): Детализирует механизм распределения частоты запроса (шаг 4 из Claim 1).
Распределение Query Count между несколькими сущностями происходит путем получения Probability Score для каждой сущности, указывающего на вероятность того, что запрос относится именно к ней. Partial Query Counts назначаются на основе этих вероятностных оценок.
Claim 10 (Зависимый от 1): Детализирует механизм расчета итоговой оценки (шаг 8 из Claim 1).
Итоговая Score определяется как комбинация значения, основанного на Entity-level count, и значения, основанного на Type-level count, причем вклад последнего ограничен максимальным значением (константой).
Claim 15 (Зависимый от 14, который зависит от 1): Описывает использование доминантного типа.
Если сущность принадлежит к нескольким типам, определяется их ранг и выбирается доминантный тип (Dominant Entity Type). Итоговая Score рассчитывается на основе Entity-level count и Type-level count именно для этого доминантного типа.
Изобретение охватывает процессы, происходящие преимущественно офлайн (анализ логов и генерация данных), и процессы, происходящие в реальном времени (ответ на запрос).
INDEXING – Индексирование и извлечение признаков / QUNDERSTANDING – Понимание Запросов (Офлайн-процессы)
Основная часть работы алгоритма происходит здесь. Это не стандартное индексирование контента, а скорее индексирование и анализ поведения пользователей (логов запросов) для построения базы знаний о сущностях.
Query Data для извлечения паттернов.Query-to-Entity Map и классификация сущностей по типам (Type Map).Entity-level counts и Type-level counts.Scores и определение наиболее важных атрибутов для каждой сущности.QUNDERSTANDING – Понимание Запросов (Онлайн)
Во время обработки запроса система должна определить, к какой сущности он относится.
Query-to-Entity Map для определения вероятности того, что запрос относится к конкретной сущности.METASEARCH – Метапоиск и Смешивание / RANKING – Ранжирование
На этапе формирования выдачи система использует предварительно рассчитанные данные о важных атрибутах.
frequently requested facts).Входные данные:
Query Data (логи запросов).Query-to-Entity Map (связи запросов и сущностей, вероятности).Type Map (типы сущностей).Выходные данные:
Scores.frequently requested facts для сущностей.Офлайн-процесс (Анализ и Ранжирование Атрибутов):
Query Data.Онлайн-процесс (Предоставление Фактов):
likelihood) того, что запрос относится к конкретной сущности, превышает установленный порог (например, 60%, 70%, 80%).frequently requested facts.Процесс анализа логов запросов и ранжирования атрибутов.
Query Data (логам запросов).Query Counts).Entity-descriptive portion (используя Query-to-Entity Map) и Suffix (оставшаяся часть запроса).Query-to-Entity Map извлекаются идентификаторы возможных сущностей и вероятностные оценки (Probability Scores) того, что запрос относится к ним.Query Count) распределяется между этими сущностями пропорционально вероятностям, формируя Partial Query Counts.Partial Query Counts для всех запросов, содержащих определенный суффикс.Type Map). Может быть выбран доминантный тип (Notable Type).Entity-level counts определенного суффикса по всем сущностям, принадлежащим к этому типу.Type-level counts (например, Топ-1000).human raters), которые оценивают, представляет ли суффикс запрос на объективный, общепринятый факт для данного типа сущности.Entity-level count и Type-level count. Вклад Type-level count масштабируется и ограничивается константой.Factual Attributes), и эти атрибуты обозначаются как frequently requested facts для данной сущности.Query Data) являются основным источником данных. Анализируется частота запросов (Query Counts) и состав запросов (термины).Query-to-Entity Map: Данные для распознавания сущностей в запросах и оценки вероятностей (Probability Scores).Type Map: Данные о классификации сущностей по типам.human raters, используемые для оценки того, являются ли атрибуты объективными фактами.Partial Query Counts (Query Count * Probability Score) для данного суффикса и сущности.Entity-level counts (Ce) для данного суффикса по всем сущностям данного типа.Type-level count. Может рассчитываться на основе максимального Type-level count (CMAX) для данного типа и константы (b). Probability Scores), что позволяет точно определить востребованность атрибутов для каждой из них.Entity-level) и данных её типа (Type-level). Это позволяет системе определять важные атрибуты даже для «длинного хвоста» сущностей, по которым мало статистики. Если о маленьком городе мало ищут, система предположит, что пользователям интересны те же атрибуты, что и для всех городов (население, погода).Type-level count в итоговую оценку математически ограничивается константой (b).frequently requested facts, чтобы показывать их пользователю (например, в Knowledge Panel), даже если его запрос не содержал прямого указания на эти атрибуты.frequently requested facts).Type-level data при ранжировании ваших атрибутов.Этот патент подчеркивает переход Google от простого ранжирования веб-страниц к предоставлению прямых ответов и структурированной информации о сущностях. Стратегическое значение заключается в понимании того, что представление сущности в поиске (особенно в Knowledge Panel) напрямую управляется пользовательским спросом. SEO-стратегия должна включать управление фактической информацией о сущности, гарантируя, что наиболее востребованные атрибуты точно представлены в Knowledge Graph.
Сценарий: Оптимизация представления нового жилого комплекса (Сущность типа «Здание»/«Жилой комплекс»)
Type-level data.Entity-level data.Score за счет данных по типу. «Срок сдачи» получит высокий Score за счет прямых запросов.frequently requested facts.Как система определяет тип сущности?
Система использует Type Map — базу данных, которая хранит информацию о классификации сущностей. Эта информация, вероятно, является частью Knowledge Graph. Если сущность имеет несколько типов, патент описывает возможность определения доминантного или значимого типа (Notable Type/Dominant Entity Type), который будет использоваться для расчета Type-level count.
Что такое суффикс (Suffix) в контексте этого патента?
Суффикс — это часть поискового запроса, которая указывает на интересующий пользователя атрибут сущности. Например, в запросе «высота Эйфелевой башни», «высота» является суффиксом. Важно понимать, что суффикс не обязательно находится в конце запроса; это любая часть запроса, не являющаяся идентификатором самой сущности (Entity-descriptive portion).
Как система обрабатывает неоднозначные запросы, например, «Ягуар» (машина или животное)?
Система использует Query-to-Entity Map для получения вероятностных оценок (Probability Scores) для каждой возможной сущности. Например, запрос «скорость ягуара» может иметь вероятность 80% для машины и 20% для животного. Общая частота этого запроса будет распределена пропорционально: 80% частоты добавится к Entity-level count суффикса «скорость» для сущности «Ягуар (автомобиль)», а 20% — для сущности «Ягуар (животное)».
Почему система смешивает данные по сущности и по типу? Разве не достаточно данных по самой сущности?
Смешивание необходимо для сглаживания данных и обеспечения качественных результатов для сущностей «длинного хвоста», по которым мало статистики. Если о конкретной сущности ищут редко, система не сможет надежно определить важные атрибуты, опираясь только на Entity-level count. В этом случае система использует Type-level count, чтобы предположить, что пользователям интересны те же атрибуты, что и для других сущностей этого типа.
Как именно ограничивается влияние данных по типу (Type-level count)?
Влияние ограничивается с помощью формулы расчета итоговой оценки: Se=Ce+min(a⋅Ct,b). Здесь 'b' — это эмпирически подобранная константа (например, 100), которая является максимально допустимым вкладом от Type-level count. Это гарантирует, что для популярных сущностей ранжирование будет определяться в основном их собственными данными (Ce).
Какова роль асессоров (human raters) в этом процессе?
Асессоры используются для фильтрации атрибутов и обеспечения того, чтобы система фокусировалась на объективных фактах. Система отбирает наиболее популярные суффиксы для определенного типа сущности и просит асессоров оценить, являются ли они фактическими (например, «альбомы» для музыканта — факт, а «лучшая песня» — мнение). Суффиксы, не прошедшие этот фильтр, исключаются из списка frequently requested facts.
Как этот патент связан с Knowledge Panel (Сеть знаний/Панель знаний)?
Этот патент описывает механизм, который определяет, какое содержимое должно быть в Knowledge Panel. Анализ логов позволяет выявить наиболее важные атрибуты для сущности, и именно эти атрибуты затем отображаются в панели. Патент напрямую объясняет, почему для одних сущностей показывается один набор фактов, а для других — другой.
Могу ли я повлиять на то, какие атрибуты Google считает важными для моей сущности (бренда)?
Да, косвенно. Поскольку система опирается на логи запросов, PR и маркетинговые активности, которые стимулируют пользователей искать определенные атрибуты вашего бренда (например, если вы активно продвигаете экологичность, и пользователи начинают искать «[Ваш бренд] экологический рейтинг»), могут повысить Entity-level count для этих атрибутов. Также важно обеспечить четкое присутствие этих фактов на вашем сайте и в структурированных данных.
Что делать, если Google неправильно определил тип моей сущности?
Это критическая проблема в контексте данного патента. Если тип определен неверно, система будет использовать нерелевантные Type-level data для ранжирования атрибутов, что приведет к неправильному набору frequently requested facts. Необходимо работать над исправлением типа в Knowledge Graph, предоставляя четкие сигналы о природе вашей деятельности через официальный сайт, микроразметку и авторитетные внешние источники (например, Википедия, отраслевые каталоги).
Влияет ли этот механизм на ранжирование органических результатов (синих ссылок)?
Патент не описывает прямого влияния на ранжирование органических результатов. Он фокусируется на идентификации важных атрибутов для формирования блоков с фактами (Knowledge Panel). Однако понимание того, какие атрибуты система считает ключевыми для сущности, позволяет лучше оптимизировать контент страниц под эти интенты, что может косвенно улучшить органическое ранжирование по соответствующим запросам.


Local SEO
Поведенческие сигналы

Семантика и интент
Knowledge Graph
EEAT и качество

Knowledge Graph
Семантика и интент
SERP

Knowledge Graph
Семантика и интент

Семантика и интент
Поведенческие сигналы

Ссылки
SERP
Индексация

Семантика и интент
Техническое SEO
EEAT и качество

Персонализация
Ссылки

Поведенческие сигналы
EEAT и качество
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Knowledge Graph
Семантика и интент
EEAT и качество

EEAT и качество
Ссылки

Ссылки
Поведенческие сигналы
Антиспам

Поведенческие сигналы
Семантика и интент
SERP
