SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

TRIGGERING KNOWLEDGE PANELS (Активация Панелей Знаний)
  • US10922326B2
  • Google LLC
  • 2013-03-14
  • 2021-02-16
  • Knowledge Graph
  • SERP
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

Описание

Какую проблему решает

Патент решает две ключевые проблемы при отображении Панелей Знаний (Knowledge Panels):

  1. Неоднозначность сущностей (Disambiguation): Определение того, какая именно сущность имеется в виду, когда запрос может относиться к нескольким (например, "Ягуар" – животное или автомобиль).
  2. Условия активации (Triggering Conditions): Определение того, следует ли вообще показывать Панель Знаний для данного запроса, основываясь на качестве существующих результатов поиска и полезности самой панели.

Цель – улучшить пользовательский опыт, показывая панель только тогда, когда она полезна (например, если стандартные результаты не удовлетворяют пользователя), и гарантируя, что она показывает наиболее релевантную сущность.

Что запатентовано

Запатентована система для выборочной активации Панелей Знаний. Она включает механизм выбора конкретной factual entity из нескольких кандидатов путем анализа тематической релевантности (topicality) между сущностями и контентом, найденным в результатах поиска. После выбора сущности система определяет, следует ли активировать панель, основываясь на характеристиках результатов поиска (например, Click-Through Rates) и содержании самой панели (например, достаточности контента).

Как это работает

Процесс состоит из двух основных фаз:

Фаза 1: Выбор сущности (Disambiguation)

  • Система идентифицирует сущности, соответствующие тексту запроса (Набор 1), и сущности, тематически связанные с контентом топовых результатов поиска (Набор 2).
  • Для сущностей вычисляются Topicality Scores, отражающие их связь с контентом выдачи.
  • Выбирается доминирующая сущность, обычно из пересечения Набора 1 и Набора 2, на основе этих оценок. Патент также описывает альтернативный метод выбора сущности, наиболее релевантной ТОП-1 результату.

Фаза 2: Решение об активации (Triggering)

  • Система анализирует характеристики SERP. Например, если CTR топовых результатов низкий (не удовлетворяет порогу), это сигнал к показу панели.
  • Система проверяет доступность контента для выбранной сущности. Если контента достаточно или он содержит полезные уточнения запроса (query refinements), это также сигнал к показу.

Актуальность для SEO

Высокая. Панели Знаний являются центральным элементом современной выдачи Google и стратегии перехода к сущностно-ориентированному поиску (Entity-first search). Механизмы разрешения неоднозначностей и определения условий показа критически важны для обеспечения качества SERP и пользовательского опыта.

Важность для SEO

Патент имеет высокое стратегическое значение (85/100). Он раскрывает конкретные механизмы, которые Google использует для выбора сущностей и активации Панелей Знаний. Понимание того, что Topicality к контенту SERP, а не только к запросу, определяет выбор сущности, критически важно для SEO в конкурентных или неоднозначных нишах. Также важно понимание, что низкий CTR органической выдачи может спровоцировать появление панели, что меняет распределение трафика.

Детальный разбор

Термины и определения

Factual Entity (Фактическая сущность)
Человек, место, организация, произведение искусства, концепция или любой другой объект, о котором система хранит информацию.
Knowledge Panel (Панель Знаний)
Элемент пользовательского интерфейса, который предоставляет сводку информации о конкретной сущности. Собирает контент из нескольких различных источников (ресурсов).
Entity Index (Индекс сущностей)
База данных известных сущностей. Может содержать идентификаторы, псевдонимы (aliases) и индекс связанных элементов контента.
Topicality Score (Оценка топикальности/тематичности)
Метрика, измеряющая степень тематической связанности между сущностью и ресурсом (или результатом поиска).
Partial Topicality Score (Частичная оценка топикальности)
Метрика, измеряющая тематическую связь между конкретной сущностью и конкретным результатом поиска (ресурсом). Основывается на количестве, расположении и типе упоминаний сущности в ресурсе.
Overall Topicality Score (Общая оценка топикальности)
Агрегированная метрика, определяющая общую тематическую релевантность сущности по отношению к набору результатов поиска. Может рассчитываться как взвешенная сумма (weighted sum) Partial Topicality Scores.
Click-Through Rate (CTR)
Показатель кликабельности результатов поиска. Используется как характеристика SERP ("performance"). Низкий CTR может указывать на неудовлетворенность пользователей и служить триггером для показа панели.
Disambiguation Knowledge Panel (Панель разрешения неоднозначности)
Тип Панели Знаний, который отображает контент для двух или более различных сущностей, когда неясно, какая из них интересует пользователя. (Упоминается в Description).
Dominant Entity Knowledge Panel (Панель доминирующей сущности)
Тип Панели Знаний, который выделяет больше места и контента для одной, наиболее релевантной сущности, но может включать ссылки на другие связанные сущности. (Упоминается в Description).
Query Refinements (Уточнения запроса)
Ссылки на связанные или уточненные поисковые запросы, которые могут быть включены в Панель Знаний.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выбора сущности и активации Панели Знаний.

  1. Система получает запрос и результаты поиска.
  2. Идентифицируются две различные factual entities, которые соответствуют запросу и используют одно и то же слово (условие неоднозначности).
  3. Для каждой сущности определяется Topicality Score, который измеряет тематическую связь между сущностью и контентом ресурсов в результатах поиска.
  4. На основе этих Topicality Scores выбирается конкретная сущность.
  5. Принимается решение о показе Панели Знаний. Это решение основано на (а) содержании панели и (б) характеристиках результатов поиска. Характеристики включают "производительность" (performance) ресурсов (т.е. CTR), когда они показывались в ответ на этот запрос.
  6. Предоставляются данные для отображения Панели Знаний.

Claim 2, 3, 4, 5 (Зависимые): Детализируют метод выбора сущности (Disambiguation) через пересечение множеств (Метод 1).

Система идентифицирует Первый набор сущностей (Set 1), соответствующих запросу, и Второй набор сущностей (Set 2), которые тематически связаны (topical) с результатами поиска. Set 2 формируется путем анализа сущностей в топовых результатах, расчета Partial Topicality Scores и их агрегации в Overall Topicality Score (взвешенная сумма). Выбор конкретной сущности происходит только из пересечения Set 1 и Set 2.

Claim 6 (Зависимый от 1): Описывает альтернативный метод выбора сущности (Метод 2).

Система определяет, какая сущность имеет наилучший Topicality Score с самым высокоранжируемым результатом поиска, и выбирает эту сущность. (Сущность, которая наиболее релевантна ТОП-1 результату, побеждает).

Claim 7 и 8 (Зависимые от 1): Детализируют условие активации на основе CTR.

Система идентифицирует CTR для результатов поиска (или только для топового результата). Если этот CTR НЕ удовлетворяет пороговому значению (т.е. он слишком низкий), принимается решение показать Панель Знаний.

Claim 9 и 10 (Зависимые от 1): Детализируют условия активации на основе содержания панели.

  • Claim 9: Если контента для панели достаточно (превышает пороговый объем), это является основанием для показа.
  • Claim 10: Если панель включает ссылки на query refinements, это является основанием для показа.

Claim 11 (Зависимый от 1): Описывает выбор типа панели.

Если Topicality Score выбранной сущности превышает оценку другой сущности на пороговую величину, система предоставляет панель для доминирующей сущности, а не Disambiguation Knowledge Panel.

Где и как применяется

Изобретение интегрировано в несколько ключевых этапов поисковой архитектуры.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно анализировать ресурсы, идентифицировать упомянутые сущности и индексировать данные для последующего расчета Topicality Scores между документами и сущностями.

QUNDERSTANDING – Понимание Запросов
Система сопоставляет запрос с Entity Index для идентификации Первого набора сущностей-кандидатов (Set 1). Если обнаружена неоднозначность, активируется механизм выбора.

RANKING – Ранжирование
Система генерирует стандартные результаты поиска. Контент и ранги этих результатов используются как контекст для расчета Topicality Scores.

METASEARCH – Метапоиск и Смешивание
Основное место применения патента. Здесь принимаются два ключевых решения:

  1. Выбор сущности (Disambiguation): Система использует Topicality Scores (для формирования Второго набора сущностей или для анализа ТОП-1 результата) и выбирает доминирующую сущность.
  2. Решение об активации (Triggering): Система оценивает условия активации (CTR из Historical Data, достаточность контента) и решает, включать ли Панель Знаний в финальную выдачу.

Входные данные:

  • Поисковый запрос.
  • Набор результатов поиска (SERP) и ссылки на ресурсы.
  • Entity Index и псевдонимы сущностей.
  • Данные о топикальности (Topicality Scores).
  • Исторические данные (CTR результатов поиска по данному запросу).
  • База данных элементов контента (Content Items) для сущностей.

Выходные данные:

  • Решение об активации Панели Знаний (Да/Нет).
  • Идентификатор выбранной сущности (или сущностей) и тип панели.
  • Сформированная Панель Знаний.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы, где одно слово может относиться к разным сущностям (имена собственные, бренды). Также влияет на широкие или исследовательские запросы, где стандартные результаты могут иметь низкий CTR.
  • Качество SERP: Влияет на состав выдачи по запросам, где наблюдается низкая удовлетворенность пользователей органическими результатами.

Когда применяется

Алгоритм выбора сущности применяется, когда:

  • Запрос соответствует псевдонимам двух или более известных factual entities (обнаружена неоднозначность).

Алгоритм активации панели применяется, когда выполнено одно или несколько условий:

  • Низкая производительность SERP: CTR топовых результатов поиска не достигает порогового значения.
  • Достаточность контента: Для выбранной сущности доступно пороговое количество элементов контента для заполнения панели.
  • Наличие уточнений: Панель содержит ссылки на полезные query refinements.

Пошаговый алгоритм

Этап 1: Инициализация и сбор данных

  1. Получение данных: Система получает запрос, генерирует SERP и получает исторические данные (CTR).
  2. Идентификация кандидатов по запросу (Set 1): Определяются сущности, чьи имена или псевдонимы соответствуют терминам запроса.

Этап 2: Анализ топикальности и выбор сущности (Disambiguation)

(Применяется, если в Set 1 более одной сущности. Система может использовать Вариант А или Б).

Вариант А (Пересечение множеств - Claims 2-5)

  1. Идентификация тематических сущностей (Set 2):
    a. Анализируется контент топовых результатов поиска.
    b. Рассчитываются Partial Topicality Scores и агрегируются в Overall Topicality Score для упомянутых сущностей.
    c. Формируется Set 2 из сущностей с высокими общими оценками.
  2. Пересечение и выбор: Выбирается сущность с наивысшим Overall Topicality Score из тех, что присутствуют и в Set 1, и в Set 2.
  3. Определение типа панели (Claim 11): Сравнение разницы между оценками лидеров. Если разница велика – стандартная панель; если мала – Disambiguation Panel.

Вариант Б (Топикальность ТОП-результата - Claim 6)

  1. Расчет топикальности для кандидатов: Для каждой сущности из Set 1 рассчитываются Partial Topicality Scores относительно каждого результата поиска.
  2. Фильтрация и выбор: Выбирается сущность, соответствующая оценке, связанной с самым высокоранжируемым результатом поиска (при условии превышения порога топикальности).

Этап 3: Решение об активации (Triggering)

  1. Проверка характеристик SERP (CTR): Анализируются исторические CTR. Если CTR ниже порогового значения, условие выполнено (Claims 7, 8).
  2. Проверка содержания панели: Проверяется достаточность контента (Claim 9) и наличие query refinements (Claim 10). Если условие выполнено.
  3. Принятие решения: Если одно или несколько условий активации выполнены, система решает показать Панель Знаний.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Текст, заголовки, мета-информация ресурсов в результатах поиска. Используются для расчета Topicality Scores. Учитывается расположение упоминаний сущности (например, в заголовке вес выше, чем в основном тексте; начало документа может иметь больший вес, чем конец).
  • Поведенческие факторы: Click-through rates (CTR) результатов поиска по отношению к конкретному запросу. Используются как ключевой триггер для активации панели (индикатор удовлетворенности). Данные о часто используемых уточнениях запроса.
  • Структурные данные (Knowledge Graph): Entity Index, содержащий известные сущности и их псевдонимы (Aliases). База данных доступных элементов контента (Content Items) для заполнения панелей.

Какие метрики используются и как они считаются

  • Partial Topicality Score: Измеряет связь между сущностью E и результатом R. Рассчитывается на основе анализа контента ресурса R: количества упоминаний E, их расположения и веса.
  • Overall Topicality Score: Агрегированная оценка для сущности E по отношению к SERP. Рассчитывается как взвешенная сумма Partial Topicality Scores топовых результатов.
  • Порог CTR (Click-Through Rate Threshold): Пороговое значение CTR. Если фактический CTR результатов поиска ниже этого порога, это может активировать показ Панели Знаний.
  • Порог достаточности контента (Threshold Amount of Content): Минимальный объем или набор типов контента, необходимый для отображения Панели Знаний.

Выводы

  1. Топикальность относительно SERP определяет выбор сущности: При неоднозначных запросах Google полагается на то, насколько сущность релевантна контенту уже ранжирующихся результатов (Topicality Score), а не только на текст запроса или общую популярность сущности. Контекст выдачи определяет интерпретацию запроса.
  2. Два метода разрешения неоднозначности: Патент описывает метод, основанный на общей топикальности всей выдачи (Метод 1), и альтернативный метод, основанный на топикальности самого высокоранжированного результата (Метод 2). Это предоставляет две разные стратегии для SEO.
  3. Панели Знаний как компенсация при низком CTR: Низкий CTR стандартных результатов поиска является явным триггером для активации Панели Знаний. Google использует панели для улучшения выдачи, когда пользователи не находят то, что ищут, кликая по органическим ссылкам.
  4. Требования к контенту для активации: Панель не будет показана, если у Google нет достаточного объема данных для ее заполнения (Threshold Amount of Content). Это подчеркивает важность полноты данных в Knowledge Graph.
  5. Функциональность как триггер: Наличие в панели ссылок на query refinements (уточнения запроса) также является триггером для ее активации, подтверждая роль панелей как инструмента для навигации по теме.

Практика

Best practices (это мы делаем)

  • Усиление тематической связи с сущностью (Максимизация Topicality Score): Необходимо гарантировать, что контент на сайте четко и недвусмысленно фокусируется на целевой сущности. Используйте идентификатор сущности в ключевых элементах страницы (Title, H1, начало основного контента), так как патент указывает, что расположение упоминаний влияет на вес при расчете Partial Topicality Score.
  • Стремление к ТОП-1 для неоднозначных запросов: Если ваш бренд имеет название, совпадающее с другими сущностями, критически важно занять ТОП-1. Согласно Методу 2 (Claim 6), сущность, которая наиболее топикальна для самого высокоранжированного результата, будет выбрана для Панели Знаний.
  • Построение Topical Authority: Работайте над тем, чтобы авторитетные ресурсы в ТОПе по целевому запросу часто упоминали вашу сущность. Это повысит Overall Topicality Score вашей сущности по отношению к выдаче в целом (Метод 1).
  • Обеспечение полноты данных о сущности (Knowledge Graph Optimization): Убедитесь, что информация о вашей сущности полна и доступна в источниках, которые использует Google (официальный сайт с разметкой Schema.org, Wikidata). Недостаток контента может блокировать активацию панели (Claim 9).
  • Оптимизация под уточнения запросов (Query Refinements): Создавайте контент, отвечающий на последующие запросы пользователей. Если Google увидит, что панель может содержать полезные query refinements, вероятность ее показа возрастет (Claim 10).

Worst practices (это делать не надо)

  • Создание размытого контента: Страницы, которые пытаются охватить слишком много разных сущностей или тем одновременно, получат низкие Partial Topicality Scores для целевой сущности, уменьшая вероятность ее выбора для Панели Знаний.
  • Игнорирование низкого CTR и интента: Фокус только на позициях без учета удовлетворенности пользователя может привести к низкому CTR. Низкий CTR является триггером для активации Панели Знаний (Claims 7, 8), что может изменить распределение трафика в SERP.
  • Создание неоднозначности бренда: Выбор названия для нового бренда, которое уже занято сильной сущностью, создает серьезные препятствия. Придется конкурировать за Topicality Score с уже устоявшейся сущностью в рамках существующей органической выдачи.

Стратегическое значение

Патент подтверждает стратегический переход Google к сущностно-ориентированному поиску. Он демонстрирует, что интерпретация запроса (выбор сущности) напрямую зависит от контекста результатов ранжирования. Также он показывает, что SERP динамически адаптируется на основе поведения пользователей (CTR): если органика неэффективна, Google активирует альтернативные блоки. Для SEO это означает, что управление сущностями (Entity Optimization) и построение тематического авторитета критически важны для видимости в Панелях Знаний.

Практические примеры

Сценарий 1: Разрешение неоднозначности (Disambiguation - Метод 2)

  1. Запрос: "Аврора".
  2. Кандидаты: Крейсер, Кинотеатр, Природное явление.
  3. Анализ SERP: ТОП-1 занимает статья Википедии о крейсере.
  4. Оценка Топикальности: Статья в ТОП-1 имеет высокий Topicality Score для сущности "Крейсер Аврора".
  5. Применение механизма (Claim 6): Google выбирает сущность по самому высокоранжированному результату.
  6. Результат: Показывается Панель Знаний для Крейсера.
  7. Действие SEO для Кинотеатра: Необходимо занять ТОП-1 по запросу "Аврора". Если сайт кинотеатра займет ТОП-1, система переключит Панель Знаний на сущность "Кинотеатр Аврора".

Сценарий 2: Активация из-за низкого CTR

  1. Запрос: "Что такое импрессионизм".
  2. Выбор сущности: Система определяет сущность "Импрессионизм".
  3. Анализ SERP и CTR: Топ-10 результатов – это длинные академические статьи. Исторические данные показывают, что CTR всех топовых результатов низкий.
  4. Проверка триггера CTR (Claims 7, 8): Низкий CTR не удовлетворяет порогу. Триггер активирован.
  5. Результат: Система показывает Панель Знаний по импрессионизму (с определением, изображениями картин), чтобы лучше удовлетворить интент пользователя, с которым не справилась органика.

Вопросы и ответы

Как рассчитывается Topicality Score (Оценка топикальности), упомянутый в патенте?

Патент разделяет его на Partial Topicality Score (связь сущности с одним документом) и Overall Topicality Score (связь с SERP в целом). Частичная оценка зависит от количества, расположения (заголовок, основной текст) и веса упоминаний сущности в документе. Упоминания в начале документа или в заголовках имеют больший вес. Общая оценка обычно является взвешенной суммой частичных оценок по топовым результатам.

Как Google решает, какую сущность выбрать, если запрос неоднозначен (например, "Ягуар")?

Google анализирует Топ результатов поиска по этому запросу. Если большинство авторитетных сайтов в выдаче тематически связаны с автомобилями (имеют высокий Topicality Score для сущности "Ягуар (автомобиль)"), Google покажет панель об автомобиле. Выбор зависит от тематического контекста, формируемого самой выдачей, а не только от текста запроса.

Какое влияние CTR органической выдачи оказывает на показ Панели Знаний?

Низкий CTR органических результатов является сильным триггером для показа Панели Знаний (Claims 7, 8). Google интерпретирует низкий CTR как признак того, что пользователи не удовлетворены выдачей. В этом случае система пытается улучшить SERP, предлагая Панель Знаний с фактами и сводной информацией.

Что важнее для получения Панели Знаний: занять ТОП-1 или иметь много упоминаний на разных сайтах в ТОП-10?

Оба варианта важны, так как патент описывает два метода. Метод 1 использует Overall Topicality Score, который выигрывает от множества упоминаний в ТОП-10. Метод 2 (Claim 6) выбирает сущность, которая наиболее топикальна для самого высокоранжированного результата (ТОП-1). Стратегически безопаснее всего стремиться к обоим целям, но занятие ТОП-1 дает прямое преимущество по Методу 2.

Почему иногда Панель Знаний не показывается, даже если запрос явно относится к известной сущности?

Патент описывает несколько фильтров. Во-первых, если органическая выдача имеет очень высокий CTR (особенно ТОП-1 результат), система может решить, что пользователи удовлетворены (навигационный интент) и панель не нужна. Во-вторых, фильтр достаточности контента (Claim 9): если у Google недостаточно информации для заполнения панели по этой сущности, она будет подавлена.

Как SEO-специалист может повлиять на Topicality Score своего сайта?

Необходимо создавать контент, четко сфокусированный на целевой сущности. Упоминайте сущность в ключевых зонах документа (заголовок, начало текста), используйте релевантные атрибуты и внедряйте микроразметку Schema.org. Чем более авторитетным источником информации о сущности является ваш ресурс, тем выше будет его Partial Topicality Score.

Что такое Query Refinements в Панели Знаний и почему они важны?

Это ссылки на связанные или уточняющие запросы (например, "фильмы актера"). Патент (Claim 10) указывает, что наличие таких уточнений само по себе является триггером для показа панели, так как они помогают пользователю в дальнейшем исследовании темы и улучшают навигацию.

Как работает механизм пересечения множеств (Set 1 и Set 2)?

Set 1 – это сущности, соответствующие тексту запроса (по имени/псевдониму). Set 2 – это сущности, тематически связанные с контентом результатов поиска (имеющие высокий Overall Topicality Score). Система выбирает сущность только из тех, которые входят в оба набора. Это гарантирует точность и релевантность выбранной сущности контексту поиска.

В чем разница между Disambiguation Panel и Dominant Entity Panel?

Disambiguation Panel предоставляет примерно одинаковый объем контента для нескольких сущностей, когда выбор не очевиден (оценки топикальности близки). Dominant Entity Panel показывает одну сущность более подробно, но также включает ссылки на другие, менее релевантные сущности, если одна из них явно доминирует, но неоднозначность все еще существует.

Использует ли Google данные о кликах для ранжирования сущностей?

Да, в описании патента (Description, не Claims) упоминается возможность расчета Entity Score, который может учитывать как Overall Topicality Score, так и общий CTR для сущности (агрегированный CTR результатов, ссылающихся на сущность). Это может использоваться для ранжирования сущностей-кандидатов при выборе.

Похожие патенты

Как Google адаптирует содержимое Панели Знаний под контекст поискового запроса пользователя
Google использует механизм для динамической настройки Панели Знаний. Система анализирует не только главную сущность в запросе, но и дополнительные контекстные термины. На основе этого контекста система переранжировывает факты и контент внутри панели, выделяет наиболее релевантную информацию и меняет порядок блоков, чтобы точнее ответить на интент пользователя.
  • US10402410B2
  • 2019-09-03
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google динамически выбирает, форматирует и приоритизирует контент внутри Панели Знаний
Google использует систему для динамической генерации Панелей Знаний. Для сущности определяются релевантные элементы контента (факты, изображения, события), которые классифицируются и оцениваются по популярности/релевантности (Rank Score). Система выбирает, какие категории контента показать и в каком формате (модуле), основываясь на этих оценках и строгих ограничениях по верстке (Panel Constraints), гарантируя приоритет наиболее важной информации.
  • US9477711B2
  • 2016-10-25
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google выбирает главное изображение для сущности, анализируя тематичность веб-страниц и визуальные характеристики картинки
Google использует многоэтапный процесс для выбора наиболее репрезентативного (evocative) изображения для сущности (например, для Knowledge Panel). Система оценивает, насколько тематически связаны с сущностью как само изображение, так и веб-страницы, на которых оно размещено. Изображения с нерелевантных страниц отфильтровываются. Финальный выбор делается на основе визуальных характеристик, таких как распознавание лиц, логотипов или флагов.
  • US9110943B2
  • 2015-08-18
  • Knowledge Graph

  • Мультимедиа

  • Семантика и интент

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Популярные патенты

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
  • US8145636B1
  • 2012-03-27
  • Семантика и интент

  • Поведенческие сигналы

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google выявляет ссылочный спам (Link Farms и Web Rings), анализируя чувствительность PageRank к изменениям в структуре ссылок
Google использует математический метод для обнаружения искусственного завышения PageRank. Система анализирует, насколько резко меняется ранг страницы при изменении «коэффициента связи» (coupling factor/damping factor). Если ранг страницы слишком чувствителен к этим изменениям (имеет высокую производную), это сигнализирует о наличии манипулятивных структур, таких как ссылочные фермы или веб-кольца.
  • US7509344B1
  • 2009-03-24
  • Антиспам

  • Ссылки

  • Техническое SEO

seohardcore