Google анализирует сущности (entities), распознанные в поисковом запросе, и определяет, к каким «коллекциям» (группам связанных сущностей) они принадлежат. Оценивая характеристики этих коллекций, система вычисляет вероятность коммерческого намерения пользователя. Этот механизм используется для разрешения неоднозначностей и принятия решения о показе релевантного коммерческого контента.
Описание
Какую задачу решает
Патент решает проблему точной классификации интента пользователя, в частности, определения наличия коммерческого намерения (commercial intent) в поисковом запросе. Это необходимо для разрешения неоднозначности терминов (например, «Jaguar» как автомобиль или животное) и повышения релевантности предоставляемого контента, особенно дополнительного коммерческого контента (например, рекламы). Система направлена на улучшение понимания запросов за пределами простого сопоставления ключевых слов.
Что запатентовано
Запатентован метод и система для определения коммерческого намерения путем анализа сущностей (entities) в запросе и их принадлежности к «коллекциям» (collections) — группам сущностей с общими характеристиками. Система идентифицирует сущности, находит коллекции, к которым они относятся, и оценивает эти коллекции для вывода о коммерческом интенте. Если интент коммерческий, система может принять решение о доставке дополнительного контента.
Как это работает
Система работает в несколько этапов:
- Аннотирование запроса: Annotator распознает сущности в запросе и присваивает им оценки уверенности.
- Идентификация коллекций: Система определяет, в какие коллекции входят распознанные сущности.
- Оценка коммерческого интента: Commercial Intent Identifier использует несколько специализированных движков (Entity Engines) для оценки сущностей и их коллекций. Движки анализируют связанные сущности, характеристики коллекций (например, «Производители автомобилей» vs «Млекопитающие»), данные о поведении пользователей и географические данные.
- Скоринг и Фильтрация: Оценки от разных движков объединяются и фильтруются. Учитывается принадлежность к blacklist collections (явно некоммерческим).
- Принятие решения: На основе итогового интента система решает, предоставлять ли дополнительный коммерческий контент.
Актуальность для SEO
Высокая. Понимание интента запроса и переход от ключевых слов к сущностям (entities) являются фундаментальными для современного поиска Google (BERT, MUM). Точная классификация коммерческого намерения критически важна как для органической выдачи, так и для монетизации. Описанные механизмы использования коллекций для контекстуализации сущностей актуальны для работы Knowledge Graph и систем понимания запросов.
Важность для SEO
Влияние на SEO значительно (85/100). Хотя патент напрямую описывает применение в рекламной системе (решение о показе рекламы), он раскрывает критически важные механизмы того, как Google понимает и классифицирует запросы (Query Understanding). Понимание того, как Google использует «коллекции» для определения контекста и интента сущностей, необходимо для разработки эффективной SEO-стратегии, особенно в E-commerce и коммерческих нишах.
Детальный разбор
Термины и определения
- Annotator (Аннотатор)
- Компонент системы, который анализирует запрос, идентифицирует термины, относящиеся к сущностям, и связывает их с конкретными идентификаторами сущностей, часто с оценкой уверенности (confidence score).
- Collection (Коллекция)
- Группа сущностей, которые имеют общую характеристику. Например, коллекция «Фильмы» или «Производители автомобилей». Сущность может принадлежать к нескольким коллекциям.
- Commercial Intent (Коммерческое намерение)
- Намерение пользователя совершить покупку товара или услуги.
- Commercial Intent Identifier (Идентификатор коммерческого намерения)
- Компонент системы, который анализирует аннотированные сущности и их коллекции для генерации оценки, отражающей вероятность коммерческого намерения пользователя.
- Entity (Сущность)
- Человек, место, продукт, услуга, вертикаль, концепция или абстрактная идея. Идентифицируемый объект в базе знаний.
- Entity Engines (Движки сущностей)
- Набор специализированных алгоритмов (например, Generic, Collection-Based, Product, Local Store, Flight Trip Entity Engine), которые оценивают вероятность коммерческого интента на основе различных данных (связанные сущности, коллекции, география, поведение пользователей).
- Blacklist Collection (Черный список коллекций)
- Коллекция, принадлежность к которой указывает на отсутствие коммерческого намерения.
- Human Evaluation Data (Данные человеческой оценки)
- Данные о поведенческих паттернах пользователей, которые используются для определения коммерческого интента (например, клики на рекламу, связанную с сущностью).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт, Метод): Описывает основной метод определения коммерческого интента.
- Система получает запрос, состоящий из терминов или фраз.
- Идентифицируются сущности (entities), связанные с этими терминами.
- Для каждой идентифицированной сущности определяются одна или несколько коллекций (collections of entities), членом которых она является.
- Определяется коммерческое намерение (commercial intent) пользователя. Ключевой шаг: это определение включает оценку (evaluating) выявленных коллекций.
- На основе определенного коммерческого намерения принимается решение о том, когда доставлять дополнительные единицы контента (additional content items, например, рекламу) вместе с результатами поиска.
Claim 2 (Зависимый от 1): Уточняет процесс определения коллекций.
Система может определить коллекцию, которая включает в себя *все* идентифицированные в запросе сущности. Это помогает установить общий контекст и разрешить неоднозначность.
Claim 3 (Зависимый от 1): Уточняет механизм определения интента.
Определение коммерческого намерения включает оценку критериев включения в коллекцию и использование этих критериев для вывода о коммерческом намерении. Это означает, что система анализирует, почему сущность находится в коллекции, и является ли эта причина коммерческой.
Claim 8 (Зависимый от 1): Вводит понятие черного списка.
Если одна из коллекций идентифицирована как blacklist collection, система делает вывод, что намерение пользователя не является коммерческим (не направлено на покупку товара или услуги).
Claim 19 (Независимый пункт, Система): Описывает архитектуру системы.
Система включает Annotator, Commercial intent identifier для генерации оценок коммерческого интента и Content item matcher для использования этих данных при предоставлении контента.
Где и как применяется
Изобретение является ключевой частью этапа понимания запросов и напрямую влияет на формирование выдачи.
QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента.
- Аннотирование (Entity Recognition): Annotator работает на этом этапе, распознавая сущности в запросе.
- Классификация Интента (Intent Classification): Commercial Intent Identifier анализирует сущности и их коллекции для определения контекста и классификации интента как коммерческого или некоммерческого. Это помогает разрешить неоднозначности.
- Режимы работы: Патент описывает два режима. Offline Process используется для предварительного анализа логов и построения карты соответствий (Query-to-Entity Targeting Data Mappings). Real-time Process используется для обработки запроса пользователя на лету.
METASEARCH – Метапоиск и Смешивание
Результаты работы системы используются на этом этапе для триггеринга (Triggering) вертикалей. Если определен коммерческий интент, система принимает решение активировать вертикаль коммерческого контента (например, Реклама или Товарные блоки) и доставить additional content items.
Входные данные:
- Поисковый запрос (текст).
- База данных сущностей и коллекций (Knowledge Graph).
- Данные для Entity Engines: связанные сущности (Related Entities), данные о поведении пользователей (Human Evaluation Data), географические данные (Geographic Data).
Выходные данные:
- Аннотированный запрос (термины, связанные с сущностями).
- Оценка коммерческого интента запроса.
- Решение о доставке дополнительного контента.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, где один и тот же термин может относиться как к коммерческим, так и к некоммерческим сущностям (например, «Apple», «Jaguar»). Также влияет на все явно коммерческие запросы.
- Конкретные ниши или тематики: Критически важно для E-commerce, локального бизнеса (Local SEO, за счет Local Store Entity Engine) и путешествий (за счет Flight Trip Entity Engine).
- Разрешение неоднозначности: Помогает системе выбрать правильную интерпретацию запроса, основываясь на контексте, заданном коллекциями.
Когда применяется
Алгоритм применяется при обработке большинства поисковых запросов в рамках этапа Query Understanding.
- Триггеры активации: Активируется, когда Annotator идентифицирует одну или несколько сущностей в запросе.
- Условия работы: Система ищет контекст для этих сущностей, проверяя их принадлежность к различным коллекциям.
- Исключения: Если сущности принадлежат к blacklist collection, система делает вывод об отсутствии коммерческого интента.
Пошаговый алгоритм
Процесс обработки запроса и определения коммерческого интента
- Получение запроса: Система получает запрос, состоящий из терминов или фраз.
- Аннотирование и идентификация сущностей: Annotator анализирует термины запроса. Он определяет, какие термины относятся к сущностям, и связывает их с идентификаторами сущностей, присваивая confidence scores.
- Определение коллекций: Для каждой идентифицированной сущности система определяет одну или несколько коллекций, членом которых является эта сущность. Может также искаться коллекция, включающая все идентифицированные сущности запроса (для определения контекста).
- Анализ коммерческого интента (Commercial Intent Identifier):
- Параллельная обработка движками: Различные Entity Engines (Product, Local Store, Collection-Based и т.д.) параллельно обрабатывают сущности, используя специализированные источники данных.
- Генерация оценок: Каждый движок генерирует пары «сущность-оценка» (entity-score pairs), где оценка отражает вероятность коммерческого интента, вычисленную этим движком.
- Объединение и взвешивание оценок: Модуль Merge and Entity Scorer собирает и взвешивает оценки от разных движков (например, оценка от Product Engine может иметь больший вес, чем от Generic Engine).
- Фильтрация и вывод интента: Система оценивает критерии включения в коллекции. Если сущности принадлежат к коммерческим коллекциям, интент признается коммерческим. Если сущности принадлежат к blacklist collection, интент признается некоммерческим.
- Принятие решения о контенте: На основе определенного интента система решает, следует ли доставлять additional content items (рекламу).
- Выбор контента: Если решение положительное, Content Item Matcher использует идентифицированные коммерческие сущности и коллекции для выбора релевантного контента для показа.
Какие данные и как использует
Данные на входе
Патент описывает использование следующих ключевых данных для определения коммерческого интента:
- Данные о Сущностях (Entity Data): Идентификаторы сущностей, распознанных в запросе.
- Структурные данные (Collections): Данные о коллекциях, к которым принадлежат сущности, и критерии включения в эти коллекции. Включает whitelist и blacklist коллекции.
- Данные о связях (Related Entities): Информация об ассоциациях между сущностями (например, связь между брендами-конкурентами).
- Поведенческие факторы (Human Evaluation Data): Данные о поведении пользователей, связанные с сущностями. Например, если пользователи часто кликают на рекламу, связанную с сущностью, это повышает вероятность ее коммерческого интента.
- Географические факторы (Geographic Data): Информация о местоположении сущностей. Типы локаций (например, торговый центр, ресторан) могут указывать на коммерческий интент, в отличие от других (например, общественный парк).
Какие метрики используются и как они считаются
- Confidence Score (Оценка уверенности): Метрика, генерируемая Annotator, указывающая на вероятность того, что данный термин в запросе действительно относится к данной сущности.
- Entity-Score Pairs (Пары Сущность-Оценка): Оценки, генерируемые каждым Entity Engine. Они отражают вероятность коммерческого интента с точки зрения специфики движка.
- Engine Independent Score (Агрегированная оценка): Итоговая оценка, вычисляемая Merge and Entity Scorer. Она объединяет оценки от разных движков, возможно, с применением весовых коэффициентов для разных движков.
- Критерии включения в коллекцию: Качественные характеристики коллекций, которые оцениваются системой для вывода об интенте.
Выводы
- Коллекции сущностей определяют контекст и интент: Ключевой вывод — Google не просто идентифицирует сущности, но и активно анализирует, к каким группам (collections) они принадлежат. Именно характеристики этих коллекций позволяют системе классифицировать интент как коммерческий или некоммерческий.
- Разрешение неоднозначности через коммерческий интент: Система использует вероятность коммерческого интента для выбора правильной сущности при неоднозначности. Если контекст запроса указывает на коммерцию, будет выбрана коммерческая сущность (Jaguar автомобиль), а не некоммерческая (Jaguar животное).
- Многофакторная оценка коммерциализации: Определение коммерческого интента — это сложный процесс, использующий несколько движков (Entity Engines). Учитываются связи между сущностями, категоризация, поведение пользователей (Human Evaluation Data) и география (Geographic Data).
- Черные списки коллекций для подавления коммерции: Система активно использует blacklist collections для идентификации некоммерческого интента. Принадлежность к такой коллекции может подавить показ коммерческого контента.
- Фундамент для Query Understanding: Механизмы, описанные в патенте, дают глубокое понимание того, как работает базовое понимание запросов в Google. SEO-специалистам необходимо работать над тем, чтобы их контент и сайты были четко ассоциированы с правильными сущностями и коммерческими коллекциями.
Практика
Best practices (это мы делаем)
- Укрепление ассоциации сайта с коммерческими коллекциями: Необходимо обеспечить, чтобы Google четко понимал, к каким коммерческим категориям (коллекциям) относятся ваши продукты или услуги. Используйте структурированные данные (Schema.org Product, Service, Organization), четкую таксономию сайта и контент, который явно связывает ваши сущности с соответствующими коммерческими вертикалями.
- Построение связей с релевантными сущностями: Создавайте контент, который связывает ваши основные сущности (продукты, бренд) с другими сущностями в той же коллекции (например, сравнения с конкурентами, упоминание связанных аксессуаров). Патент показывает, что Related Entities используются для определения коммерческого контекста.
- Оптимизация под локальный коммерческий интент: Для локального бизнеса критически важно укреплять связь между брендом, услугой и географической сущностью. Убедитесь, что Google классифицирует вашу локацию как коммерческую (используя данные из Google Business Profile), так как Local Store Entity Engine использует эти данные для подтверждения коммерческого интента.
- Создание контента для разрешения неоднозначности: Если ваш бренд или продукт имеет название, которое может быть неоднозначным, создавайте контент, который явно задает коммерческий контекст. Используйте в контенте термины, которые помогут системе поместить вашу сущность в правильную коммерческую коллекцию, а не в blacklist collection.
Worst practices (это делать не надо)
- Изолированная оптимизация под ключевые слова: Фокус только на вхождении ключевых слов без учета того, как они связываются с сущностями и коллекциями, неэффективен. Система ищет контекст через коллекции, а не просто совпадения текста.
- Игнорирование таксономии и структуры сайта: Хаотичная структура сайта затрудняет для Google определение основных коллекций, к которым относится ваш бизнес. Это может привести к неверной классификации интента при запросах, связанных с вашим сайтом.
- Смешивание коммерческого и некоммерческого контента без четкого разделения: Если на сайте смешивается контент, относящийся к разным типам коллекций, это может запутать систему при определении основного интента, особенно если некоммерческий контент (потенциально связанный с blacklist collections) доминирует.
Стратегическое значение
Патент подтверждает стратегическую важность Entity-First подхода и использования Knowledge Graph для понимания запросов. Для SEO это означает, что стратегия должна строиться вокруг оптимизации сущностей и их контекста (коллекций). Долгосрочный успех зависит от того, насколько точно Google ассоциирует ваш сайт с релевантными коммерческими коллекциями. Понимание интента является первым и главным шагом в обработке запроса, определяющим дальнейшую логику ранжирования и формирования SERP.
Практические примеры
Сценарий: Оптимизация неоднозначного названия продукта «Puma»
Задача: Убедиться, что запросы, связанные с брендом спортивной одежды Puma, классифицируются как коммерческие и не путаются с животным.
- Анализ коллекций: Определить целевые коммерческие коллекции («Бренды спортивной одежды», «Кроссовки») и нежелательные blacklist collections («Семейство кошачьих»).
- Укрепление связей (Related Entities): Активно упоминать в контенте и метаданных связанные сущности из коммерческих коллекций: конкурентов (Nike, Adidas), типы продуктов (Suede, RS-X), спортсменов-амбассадоров.
- Структурированные данные: Внедрить разметку Organization и Product, используя category и brand для явного указания на коммерческий контекст. Использовать sameAs для связи с узлом в Knowledge Graph, относящимся именно к бренду.
- Ожидаемый результат: Система распознает сущность «Puma» (бренд). Анализируя ее принадлежность к коллекции «Бренды спортивной одежды» и связи с Nike/Adidas, Commercial Intent Identifier уверенно классифицирует интент как коммерческий, триггерит показ товарных блоков и ранжирует релевантные страницы интернет-магазинов.
Вопросы и ответы
Что такое «коллекция» (Collection) в контексте этого патента и почему это важно для SEO?
Коллекция — это группа сущностей, объединенных общим признаком, например, «Производители автомобилей» или «Фильмы Marvel». Для SEO это критически важно, потому что Google использует характеристики коллекции для определения контекста и интента запроса. Если ваш продукт попадает в правильную коммерческую коллекцию, Google с большей вероятностью классифицирует связанные запросы как коммерческие, что влияет на ранжирование и тип выдачи.
Как этот патент помогает Google различать неоднозначные запросы, например, «Ягуар»?
Система анализирует, к каким коллекциям принадлежат разные сущности «Ягуар». «Ягуар (автомобиль)» принадлежит к коммерческой коллекции «Производители автомобилей», а «Ягуар (животное)» — к некоммерческой «Млекопитающие». Анализируя другие слова в запросе (например, «купить» или «ареал») и проверяя, в какую общую коллекцию они лучше вписываются, система определяет правильный контекст и интент.
Что такое «Entity Engines» и какие данные они используют?
Entity Engines — это специализированные алгоритмы, оценивающие вероятность коммерческого интента с разных сторон. Патент упоминает Product Engine, Local Store Engine, Collection-Based Engine и другие. Они используют разнообразные данные: связанные сущности (конкуренты, бренды), характеристики коллекций, данные о поведении пользователей (Human Evaluation Data) и географические данные (Geographic Data).
Что означает «blacklist collection» и как это может повлиять на мой сайт?
Blacklist collection — это коллекция, которая явно указывает на отсутствие коммерческого намерения (например, «Хобби» или «Виды животных»). Если система ассоциирует запрос с такой коллекцией, она сделает вывод, что интент некоммерческий. Это может привести к тому, что коммерческий контент сайта будет считаться менее релевантным для данного запроса, и система предпочтет информационные результаты.
Патент фокусируется на рекламе. Насколько это применимо к органическому поиску?
Это крайне применимо. Механизмы понимания запросов (Query Understanding) — идентификация сущностей, их контекстуализация через коллекции и классификация интента — являются общими как для органического поиска, так и для рекламы. Патент раскрывает фундаментальные принципы того, как Google интерпретирует запросы, что напрямую влияет на органическое ранжирование.
Как я могу помочь Google ассоциировать мой сайт с правильной коммерческой коллекцией?
Используйте четкую таксономию сайта, которая отражает вашу коммерческую вертикаль. Внедряйте релевантные структурированные данные (Schema.org), чтобы явно указать категории ваших предложений. Также создавайте контент, который устанавливает связи с другими известными сущностями внутри вашей коммерческой коллекции (бренды, конкуренты, типы продуктов).
Учитывает ли система поведение пользователей при определении коммерческого интента?
Да, патент явно упоминает использование Human Evaluation Data. Если пользователи часто взаимодействуют с коммерческим контентом (например, кликают на рекламу или товарные блоки) при поиске определенной сущности или коллекции, система с большей вероятностью будет считать эту сущность коммерческой в будущих запросах.
Как этот механизм влияет на локальный поиск (Local SEO)?
Влияние значительно. Патент описывает Local Store Entity Engine, который использует Geographic Data для определения коммерческого интента. Система анализирует тип местоположения (например, магазин vs парк). Для успеха в Local SEO необходимо убедиться, что Google правильно классифицирует вашу локацию как коммерческую точку интереса.
Может ли система определить коммерческий интент, если в запросе нет явных коммерческих слов типа «купить»?
Да, это одна из основных целей патента. Система может определить коммерческий интент, основываясь исключительно на самих сущностях и их коллекциях. Например, запрос, содержащий сущности из коллекции «Производители смартфонов», может быть классифицирован как коммерческий даже без явных транзакционных модификаторов.
Что происходит, если в запросе несколько сущностей из разных коллекций?
Система пытается найти коллекцию, которая включает все идентифицированные сущности (согласно Claim 2), чтобы установить общий контекст. Если такой коллекции нет, система агрегирует оценки коммерческого интента от разных сущностей и их коллекций с помощью Merge and Entity Scorer, чтобы определить доминирующий интент.