Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Яндекс

    Как Яндекс формирует блоки знаний (Wizards/Knowledge Panels), объединяя связанные сущности из разных категорий

    СПОСОБ ОБРАБОТКИ ПОИСКОВОГО ЗАПРОСА И СЕРВЕР (Method of processing a search query and server)
    • RU2014125471A
    • Yandex LLC
    • 2015-12-27
    • 2014-06-24
    2015 SERP Колдунщики Патенты Яндекс Структурированные данные

    Яндекс патентует метод обогащения поисковой выдачи для запросов о конкретных сущностях. Система идентифицирует главную сущность запроса, определяет связанные с ней тематические категории («домены объекта») и находит другие семантически связанные сущности внутри этих категорий. Результаты из разных категорий отображаются в структурированном блоке на SERP (например, в Графе Знаний или Колдунщике), который может включать интерактивные фильтры.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу предоставления структурированного, комплексного и интерактивного ответа на запросы, связанные с конкретными объектами (сущностями). Он направлен на улучшение пользовательского опыта за счет агрегации информации о связанных аспектах сущности прямо на странице результатов поиска (SERP). Это позволяет пользователю исследовать разные грани объекта (например, актеров фильма, محصولات компании, книги автора), не переходя по множеству ссылок, повышая информативность выдачи и способствуя развитию Entity-Oriented Search.

    Что запатентовано

    Запатентован способ генерации составного блока (компонента) для SERP, который агрегирует информацию о главном объекте поиска и семантически связанных с ним объектах, извлеченных из нескольких различных категорий (доменов объектов). Изобретение описывает механизм идентификации этих категорий, извлечения связанных объектов, верификации их связи и формирования интерактивного представления на выдаче. Это является технологической основой для функционирования Графа Знаний (Knowledge Graph) и генерации обогащенных ответов, таких как «Колдунщики» (Wizards) или Блоки Знаний (Knowledge Panels).

    Как это работает

    Система работает на основе предварительно сформированной базы знаний (Графа Знаний). При получении запроса идентифицируется основная сущность (поисковый объект). Система обращается к базе данных, чтобы найти предустановленные тематические категории (домены объекта) для этой сущности. Затем система выбирает связанные объекты внутри как минимум двух разных категорий. Эти связи верифицируются офлайн с помощью анализа свойств объектов и истории поисковых запросов пользователей (совместной встречаемости). Наконец, генерируется структурированный блок, отображающий эти связанные объекты, который может включать интерактивные фильтры по категориям.

    Актуальность для SEO

    Высокая. Поиск, основанный на сущностях (Entity-based search), Граф Знаний и формирование структурированных обогащенных ответов являются фундаментальными элементами современных поисковых систем. Яндекс активно развивает и использует эти механизмы (Колдунщики, объектные ответы) для структурирования информации и повышения интерактивности выдачи.

    Важность для SEO

    Влияние на SEO значительно (7.5/10). Патент описывает механизмы, лежащие в основе формирования Панелей Знаний и Колдунщиков. Понимание того, как Яндекс идентифицирует сущности, определяет тематические категории (домены объекта) и валидирует связи, критически важно для стратегий оптимизации под Граф Знаний (Knowledge Graph Optimization). Это напрямую влияет на видимость в структурированных блоках, которые часто занимают приоритетные позиции на SERP и могут влиять на распределение трафика (Zero-click searches).

    Детальный разбор

    Термины и определения

    Поисковый объект (Search Object)
    Основная сущность (Entity), идентифицированная в поисковом запросе (например, человек, место, фильм, продукт).
    Домен объекта (Object Domain)
    Тематическая категория или концептуальная область, связанная с поисковым объектом. Важно: это не домен веб-сайта. Например, если поисковый объект — «Леонардо Ди Каприо», доменами объекта могут быть «Фильмы», «Награды», «Личная жизнь».
    Связанный объект (Related Object)
    Другая сущность, семантически связанная с поисковым объектом и принадлежащая к определенному домену объекта (например, «Титаник» связан с «Ди Каприо» в домене «Фильмы»).
    Компонент объекта (Object Component)
    Блок на странице результатов поиска (SERP), содержащий информацию о поисковом объекте.
    Компонент связанного объекта (Related Object Component)
    Блок на SERP (например, карусель, Панель Знаний, Колдунщик), содержащий указания на связанные объекты, сгруппированные или фильтруемые по доменам объекта.
    Фильтр домена объекта (Object Domain Filter)
    Интерактивный элемент интерфейса в компоненте связанного объекта, позволяющий пользователю выполнять действия, связанные с конкретным доменом объекта (например, фильтровать отображаемые связанные объекты) (Claim 14, 15).
    Степень уверенности (Confidence Score)
    Метрика, указывающая на надежность или силу связи между поисковым объектом и связанным объектом (Claim 11).
    Процедура объединения (Merging procedure)
    Процесс (Entity Reconciliation/Resolution), используемый для определения того, что информация, извлеченная из разных источников, относится к одному и тому же поисковому объекту (Claim 7).

    Ключевые утверждения (Анализ Claims)

    Патент фокусируется на методе генерации обогащенных блоков на выдаче, которые показывают связанные сущности, категоризированные по разным тематикам.

    Claim 1 (Независимый пункт): Описывает основной процесс обработки запроса и генерации выдачи.

    1. Получение поискового запроса и определение поискового объекта.
    2. Создание компонента объекта для SERP.
    3. Ключевой этап: Создание компонента связанного объекта. Это требует:
      • Определения как минимум двух разных доменов объекта (тематических категорий), связанных с основной сущностью.
      • Определения как минимум одного связанного объекта для каждого из этих доменов, которые семантически связаны с поисковым объектом.
      • Составления компонента, включающего указания на эти связанные объекты.
    4. Отображение SERP, включающей оба компонента.

    Ядром изобретения является обязательное включение связанных сущностей из разных тематических категорий, что обеспечивает разнообразие (Diversity) представленной информации.

    Claims 2-7 (Офлайн-процессы: Извлечение и Консолидация): Описывают процесс сбора и обработки данных для определения доменов объекта.

    • Связи устанавливаются заранее (офлайн) и хранятся в базе данных (Claims 2, 3).
    • Система посещает ресурсы (веб-страницы) для извлечения указаний на домены объекта (Claims 4, 5).
    • Выполняется процедура объединения (Entity Reconciliation) для консолидации информации из разных источников и определения того, что извлеченные домены действительно связаны с одним и тем же поисковым объектом (Claim 7).

    Claims 8-13 (Офлайн-процессы: Валидация связей): Описывают процесс установления и верификации связей между объектами.

    • Связи между связанными объектами и доменами также устанавливаются заранее (Claim 8).
    • Система определяет, действительно ли связанный объект связан с поисковым объектом (валидация связи) (Claim 9).
    • Методы валидации включают:
      • Метод 1 (Онтологический): Анализ набора свойств (set of properties), связанных с обоими объектами. На основе этого рассчитывается степень уверенности в связи (Claims 10, 11).
      • Метод 2 (Поведенческий): Анализ логов поисковой системы для выявления запросов, в которых поисковый объект и связанный объект ищутся вместе (co-occurrence) (Claim 12).

    Это подчеркивает гибридный подход Яндекса к подтверждению семантических связей, использующий как структурированные данные, так и поведение пользователей.

    Claims 14-15 (Интерактивность): Описывают элементы интерфейса.

    • Компонент связанного объекта может включать фильтры домена объекта.
    • Активация фильтра пользователем инициирует действие над компонентом (например, обновление отображаемых данных).

    Где и как применяется

    Изобретение затрагивает несколько слоев поисковой архитектуры, сочетая офлайн-процессы построения Графа Знаний и онлайн-обработку запросов.

    CRAWLING, INDEXING (Офлайн-процессы – Построение Графа Знаний)

    • Сбор данных (Crawling): Система посещает ресурсы для извлечения информации о сущностях, их свойствах и категориях (доменах объекта).
    • Консолидация (Indexing): Происходит анализ извлеченных данных, выполнение процедуры объединения (Entity Reconciliation) для консолидации данных о сущностях.
    • Валидация (Indexing): Верификация связей с использованием свойств и анализа логов поисковых запросов. Рассчитывается степень уверенности. Данные сохраняются в Графе Знаний.

    QUERY PROCESSING – Понимание Запросов (Онлайн)

    • На этом этапе происходит распознавание сущностей в запросе (Entity Recognition) и определение основного Поискового объекта.

    METASEARCH & BLENDING (Wizards/Колдунщики) (Онлайн)

    • Основное применение патента. Система Колдунщиков (Wizards) или система объектных ответов активируется при обнаружении значимого Поискового объекта.
    • Система отправляет запрос в Граф Знаний для получения связанных Доменов и Объектов.
    • Происходит генерация Компонента связанного объекта (Колдунщика, панели знаний), включая интерактивные фильтры.
    • Blender интегрирует этот компонент в финальную страницу выдачи (SERP).

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на запросы о сущностях (Entity-based queries) — персоны, организации, места, фильмы, книги, продукты и т.д.
    • Форматы контента: Влияет на формирование структурированных элементов выдачи — Панелей Знаний (Knowledge Panels), Колдунщиков, каруселей связанных объектов.
    • Конкретные ниши: Сильное влияние в тематиках с большим количеством четко определенных сущностей и связей (Кино, Музыка, E-commerce, Локальный поиск, YMYL).

    Когда применяется

    • Триггеры активации: Алгоритм активируется, когда система с высокой степенью уверенности идентифицирует в запросе конкретный Поисковый объект.
    • Условия применения: Необходимо, чтобы в Графе Знаний для данного объекта было определено как минимум два разных Домена объекта и соответствующие им Связанные объекты с достаточной степенью уверенности в связях.

    Пошаговый алгоритм

    Процесс А: Офлайн-подготовка данных (Построение Графа Знаний)

    1. Сбор данных: Посещение веб-ресурсов для извлечения указаний на сущности и их тематические категории (Домены объекта).
    2. Консолидация: Выполнение процедуры объединения для связывания извлеченной информации из разных источников с конкретными Поисковыми объектами.
    3. Валидация связей: Определение силы связи между Поисковым объектом и потенциальными Связанными объектами. Это включает:
      • Сравнение наборов свойств объектов.
      • Анализ логов поисковых запросов на предмет совместного упоминания (co-occurrence).
    4. Расчет метрик: Определение степени уверенности для каждой связи.
    5. Сохранение: Запись в базу данных (Граф Знаний) ассоциаций: Поисковый объект ↔ Домены объекта ↔ Связанные объекты.

    Процесс Б: Онлайн-обработка запроса

    1. Получение запроса: Система получает запрос от пользователя.
    2. Идентификация сущности: Определение Поискового объекта в запросе.
    3. Извлечение данных из Графа Знаний: Запрос к базе данных для получения связанных данных.
    4. Выбор Доменов и Объектов: Определение как минимум двух Доменов объекта и соответствующих им Связанных объектов.
    5. Генерация Компонентов: Создание Компонента объекта и Компонента связанного объекта. В последний могут быть вставлены Фильтры домена объекта.
    6. Отображение: Инициирование отображения SERP с включенными компонентами.

    Какие данные и как использует

    Данные на входе

    • Контентные и Структурные факторы: Текст и структура веб-страниц (ресурсов), включая микроразметку. Используются для идентификации сущностей, их свойств (набор свойств) и тематических категорий (Доменов объекта). (Claims 5, 10).
    • Поведенческие факторы (Логи запросов): История поисковых запросов пользователей. Используется для анализа совместного упоминания (co-occurrence) двух объектов в запросах, что служит сигналом для валидации связи (Claim 12).

    Какие метрики используются и как они считаются

    • Степень уверенности (Confidence Score): Метрика, указывающая на вероятность или силу семантической связи между двумя объектами. Рассчитывается на основе анализа свойств объектов (Claim 11) и, вероятно, дополняется данными о совместном упоминании.
    • Частота совместного упоминания (Co-occurrence Frequency): Метрика, основанная на анализе логов запросов. Указывает, насколько часто два объекта ищутся вместе пользователями (Claim 12).

    Выводы

    1. Фундамент Entity-Based Search в Яндексе: Патент описывает ключевые механизмы работы Графа Знаний Яндекса и генерации обогащенных ответов (Wizards/Knowledge Panels). Он демонстрирует переход от анализа ключевых слов к оперированию объектами и их связями.
    2. Важность разнообразия (Diversity) и кросс-доменных связей: Ключевая особенность изобретения — требование агрегации связанных объектов из как минимум двух разных категорий (доменов) в едином блоке. Это направлено на предоставление комплексного обзора сущности.
    3. Гибридный подход к верификации данных: Яндекс использует комбинацию онтологических данных (анализ свойств сущностей для расчета Confidence Score) и поведенческих сигналов (анализ совместного упоминания в логах поиска) для подтверждения семантических связей.
    4. Критическая роль Entity Reconciliation: Процедура объединения (Claim 7) необходима для консолидации данных из разных источников в единый профиль сущности, что подчеркивает важность консистентности данных в вебе.
    5. Интерактивность и Zero-Click: Включение фильтров доменов в компонент указывает на стратегию повышения вовлеченности пользователя на SERP, что может вести к увеличению числа Zero-click searches.

    Практика

    Best practices (это мы делаем)

    • Внедрение комплексной микроразметки (Schema.org): Максимально подробно размечайте все сущности на сайте (организации, продукты, персоны, события) и их свойства. Это напрямую предоставляет системе набор свойств для анализа и расчета степени уверенности (Claim 10, 11).
    • Явное указание связей между сущностями: Используйте свойства Schema.org для указания связей между объектами (например, brand, actor, author, relatedTo). Это помогает системе корректно идентифицировать связанные объекты и их домены.
    • Структурирование контента по категориям (Доменам): Организуйте контент на сайте таким образом, чтобы четко прослеживались категории связанных объектов. Используйте структурированные списки, таблицы и четкие заголовки (например, раздел «Сотрудники» на странице компании, «Аксессуары» на странице продукта).
    • Развитие Entity Presence и Консистентности: Убедитесь, что информация о ваших сущностях представлена консистентно на вашем сайте и в авторитетных источниках (Яндекс Бизнес, Википедия, Wikidata). Используйте идентификаторы (например, sameAs), чтобы помочь Яндексу в процедуре объединения (Claim 7).
    • Стимулирование ассоциативных связей в поиске: Работайте над PR и маркетингом для формирования устойчивых ассоциаций (например, «Бренд + Продукт»). Если пользователи часто будут искать их вместе, это усилит семантическую связь за счет механизма анализа совместных запросов (Claim 12).

    Worst practices (это делать не надо)

    • Игнорирование микроразметки: Отсутствие структурированных данных затрудняет для Яндекса извлечение и верификацию информации об объектах и их связях, снижая вероятность попадания в обогащенные блоки.
    • Предоставление неоднозначной или противоречивой информации: Публикация неточных данных или использование разных названий для одной сущности может привести к ошибкам в процедуре объединения и снижению доверия к данным с вашего сайта.
    • Фокус только на ключевых словах в отрыве от сущностей: Стратегии, не учитывающие семантические связи между объектами, будут проигрывать в борьбе за видимость в обогащенных элементах выдачи.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Яндекса на развитие семантического поиска и переход от модели «десяти синих ссылок» к модели предоставления прямых, структурированных ответов. Для SEO это означает необходимость смещения фокуса с оптимизации под ключевые слова на оптимизацию сущностей (Entity Optimization). Долгосрочная стратегия должна включать управление представлением бренда как сущности в Графе Знаний Яндекса, так как видимость в обогащенных блоках становится критически важной для охвата аудитории.

    Практические примеры

    Сценарий 1: Оптимизация сайта кинотеатра/стримингового сервиса

    1. Задача: Увеличить видимость в блоках знаний по запросам о фильмах.
    2. Действия: На странице фильма (Поисковый объект) внедряется разметка Movie. Внутри нее четко структурируются и размечаются связанные объекты по доменам:
      • Домен «Актеры»: Список актеров с разметкой actor (тип Person).
      • Домен «Съемочная группа»: Режиссер (director), сценаристы (author).
      • Домен «Саундтрек»: Список треков с разметкой MusicRecording.
    3. Ожидаемый результат: Яндекс использует эти структурированные данные для верификации связей (через анализ свойств). На SERP по запросу названия фильма может сформироваться Компонент связанного объекта, включающий данные из доменов «Актеры» и «Саундтрек», возможно, с интерактивными фильтрами.

    Сценарий 2: Оптимизация корпоративного сайта производителя

    1. Задача: Обеспечить показ ключевых продуктов компании в блоке знаний по брендовому запросу.
    2. Действия: Компания (Поисковый объект) размечается как Organization. Создаются разделы для линеек продуктов (Домены объектов: «Смартфоны», «Ноутбуки»). Конкретные модели (Связанные объекты) размечаются как Product со свойством brand, указывающим на компанию. Проводится PR-кампания, стимулирующая запросы вида «[Бренд] +».
    3. Ожидаемый результат: Яндекс верифицирует связь через микроразметку (анализ свойств) и анализ логов запросов (co-occurrence). При запросе названия бренда система генерирует Компонент связанного объекта, отображающий популярные модели смартфонов и ноутбуков этой компании.

    Вопросы и ответы

    Что такое «Домен объекта» в контексте этого патента и как его определить для моего сайта?

    «Домен объекта» — это тематическая категория или тип сущностей, связанных с главным объектом поиска. Например, для компании доменами могут быть «Продукты», «Услуги», «Руководители». Это не домен веб-сайта. Чтобы определить их для вашего сайта, проанализируйте, какие аспекты вашего бизнеса важны для пользователей, и структурируйте эту информацию с помощью четких разделов и соответствующей микроразметки для связи сущностей.

    Как Яндекс проверяет, что связанный объект действительно относится к главному объекту?

    Патент описывает два основных метода верификации. Первый — анализ и сравнение свойств обоих объектов, на основе чего вычисляется «степень уверенности». Это подчеркивает важность полной и точной микроразметки. Второй метод — анализ исторических логов поисковых запросов: если пользователи часто ищут два объекта вместе (co-occurrence), система считает их связанными.

    Что такое «Процедура объединения» (Claim 7) и почему она важна для SEO?

    Это процесс (Entity Reconciliation), который позволяет Яндексу понять, что информация из разных источников (например, вашего сайта и Википедии) относится к одной и той же сущности, даже если названия отличаются. Для SEO это критически важно: чтобы построить полный профиль вашей сущности, вы должны использовать консистентные данные и идентификаторы (например, через свойство sameAs в Schema.org, ссылки на Wikidata), чтобы помочь Яндексу корректно объединить данные о вас.

    Как можно повлиять на то, какие именно связанные объекты попадут в блок знаний?

    Прямого управления нет, но можно повысить вероятность. Во-первых, обеспечьте высокую «степень уверенности» связи через качественную микроразметку и консистентные данные. Во-вторых, повышайте популярность связанных объектов. Поскольку система использует анализ логов запросов, более популярные и часто запрашиваемые вместе с главным объектом сущности имеют больше шансов попасть в блок.

    Означает ли этот патент, что Zero-click выдача будет расти?

    Да, это весьма вероятно. Цель патента — предоставить комплексный и интерактивный ответ прямо на SERP, агрегируя информацию из разных категорий. Наличие структурированного блока с фильтрами позволяет пользователю решить свою задачу без необходимости переходить на внешние сайты, что способствует росту Zero-click взаимодействий.

    Какую роль играет микроразметка Schema.org в контексте этого патента?

    Микроразметка играет центральную роль. Она является основным источником структурированных данных, которые система использует для идентификации объектов, определения их доменов (категорий) и, что самое важное, для анализа свойств объектов (Claim 10). Качественная разметка напрямую влияет на расчет «степени уверенности» и формирование обогащенных блоков.

    Как анализ совместного упоминания в запросах (Claim 12) влияет на SEO-стратегию?

    Это подчеркивает важность интеграции SEO и PR/Маркетинга. Необходимо формировать устойчивые ассоциации в сознании пользователей между вашим брендом и вашими продуктами или услугами. Если пользователи естественно ищут «[Бренд] +», это укрепляет семантическую связь в модели Яндекса, даже если структурированные данные на сайте не идеальны.

    Какие элементы поисковой выдачи формируются с помощью этого патента?

    Этот патент описывает технологию, лежащую в основе формирования структурированных блоков на SERP. Это включает Панели Знаний (Knowledge Panels), объектные ответы, различные Колдунщики (Wizards), карусели связанных объектов и обогащенные сниппеты, содержащие информацию о связанных сущностях.

    Патент довольно старый (подача 2014 год). Актуален ли он сейчас?

    Да, он абсолютно актуален концептуально. Технологии, связанные с Графом Знаний и семантическим поиском, являются фундаментом современного поиска. Описанные в патенте механизмы — идентификация сущностей, верификация связей через свойства и поведение пользователей, генерация составных блоков — активно используются. Хотя конкретные алгоритмы могли эволюционировать (например, с применением нейросетей), архитектура и цели остались прежними.

    Что делать, если в блоке знаний отображается неверная информация о моей компании?

    Необходимо действовать проактивно. Во-первых, проверьте и исправьте микроразметку на вашем собственном сайте. Во-вторых, обновите информацию в справочниках Яндекса (Яндекс Бизнес, Вебмастер). В-третьих, проверьте авторитетные внешние источники, на которые может полагаться Яндекс (Википедия, отраслевые каталоги), и при необходимости инициируйте исправление данных там. Это поможет системе при следующей итерации процедуры объединения.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.