SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически выбирает и показывает сравнительный контекст для фактов о сущностях в Knowledge Panel

PROVIDING CONTEXT FACTS (Предоставление контекстных фактов)
  • US10289625B2
  • Google LLC
  • 2016-09-15
  • 2019-05-14
  • Knowledge Graph
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует популярность различных списков (например, "Самые высокие горы"). Когда пользователь спрашивает о факте (например, "высота К2"), система находит место этой сущности в самом популярном релевантном списке и добавляет контекст (например, "2-я по высоте гора в мире") в Knowledge Panel или голосовой ответ.

Описание

Какую проблему решает

Патент решает задачу обогащения "сырых" фактов, предоставляемых поисковой системой, полезным сравнительным контекстом. Вместо того чтобы просто сообщить факт (например, "Рост Барака Обамы — 6 футов 1 дюйм"), система стремится предоставить контекст, который делает этот факт более информативным (например, "9-й самый высокий президент США"). Это улучшает пользовательский опыт, предоставляя более глубокое понимание значимости факта в рамках определенной категории.

Что запатентовано

Запатентована система для автоматического определения и предоставления контекстных фактов (Context Facts) для сущностей. Система заранее генерирует ранжированные списки сущностей по различным атрибутам и оценивает популярность этих списков (List Score). Для каждой сущности в каждом списке создается структура данных (Data Structure), хранящая её ранг и оценку списка. При получении запроса система выбирает контекстный факт из наиболее популярного релевантного списка и отображает его пользователю.

Как это работает

Система работает в два этапа: офлайн и онлайн.

  • Офлайн (Подготовка): Система генерирует ранжированные списки сущностей (например, "Самые высокие горы"). Каждому списку присваивается List Score, основанный на частоте запросов, связанных с этим списком. Для каждой сущности в списке создается Data Structure, связывающая сущность, её ранг в списке и List Score.
  • Онлайн (Обработка запроса): Когда поступает запрос о факте (сущность + атрибут, например, "Высота К2"), система находит все релевантные Data Structures. Если сущность фигурирует в нескольких списках, система выбирает тот, у которого наивысший List Score. Затем система использует синтез естественного языка (Natural Language Synthesis) для формирования контекстного ответа (например, "К2 — 2-я по высоте гора в мире") и отображает его, часто в Knowledge Panel.

Актуальность для SEO

Высокая. Автоматическое предоставление сравнительного контекста является стандартной функцией в современных Knowledge Panels, прямых ответах и ответах голосовых ассистентов. Механизмы, описанные в патенте, напрямую связаны с тем, как Google обрабатывает и представляет информацию о сущностях, делая акцент на наиболее интересных для пользователей сравнениях.

Важность для SEO

Влияние на SEO значительно (65/100), особенно в области продвижения сущностей (Entity SEO) и оптимизации под Knowledge Panels и голосовой поиск. Патент не описывает ранжирование органических "синих ссылок", но определяет, как именно Google будет представлять факты о сущности. Понимание механизма List Score подчеркивает важность не только наличия точных данных о сущности, но и понимания того, какие атрибуты и сравнения наиболее востребованы пользователями в конкретной нише.

Детальный разбор

Термины и определения

Context Fact (Контекстный факт)
Информация, которая помещает основной факт о сущности в сравнительный контекст. В патенте это часто относится к атрибуту, по которому ранжируется список (например, "Высота"), и к самому рангу сущности в этом списке.
Context Fact Engine (Движок контекстных фактов)
Основной компонент системы, отвечающий за генерацию списков, создание структур данных, выбор релевантного факта и его обработку на естественном языке.
Data Structure (Структура данных)
Предварительно сгенерированная запись для конкретной сущности в конкретном списке. Содержит ссылку на сущность, контекстный факт (атрибут), ранг сущности и List Score.
Fact Ranking Engine (Движок ранжирования фактов)
Компонент, который ранжирует сущности на основе значений их атрибутов для создания упорядоченных списков.
Knowledge Panel (Панель знаний)
Информационный блок в результатах поиска, предоставляющий сводку информации о сущности. Место, где часто отображаются контекстные факты.
List Score (Оценка списка)
Метрика, присваиваемая ранжированному списку и отражающая его популярность или интерес для пользователей. Часто базируется на частоте связанных поисковых запросов.
Natural Language Synthesis (Синтез естественного языка, NLG)
Процесс преобразования структурированных данных (сущность, ранг, список) в человекочитаемое предложение (текст или речь).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления контекстных фактов.

  1. Система получает один или несколько списков сущностей. Каждый список имеет: (i) связанную оценку (List Score), (ii) связан с контекстным фактом (атрибутом), и (iii) ранжирует подмножество сущностей на основе значений этого атрибута.
  2. (Офлайн-процесс) Для каждой сущности в каждом списке генерируется Data Structure, которая ссылается на: (i) сущность, (ii) контекстный факт, (iii) ранг сущности, и (iv) List Score списка.
  3. (Онлайн-процесс) Система получает данные, идентифицирующие конкретную сущность и атрибут (который соответствует значению контекстного факта).
  4. Система выбирает конкретную Data Structure, ссылающуюся на эту сущность и атрибут.
  5. Система предоставляет для вывода данные, указывающие на контекстный факт и ранг сущности из выбранной Data Structure.

Claim 2 (Зависимый от 1): Уточняет, как определяется List Score.

Оценка каждого списка основана на частоте недавних поисковых запросов (frequency of recent search queries), включающих этот список. Это подтверждает, что List Score является мерой популярности.

Claim 3 (Зависимый от 1): Уточняет критерий выбора Data Structure.

Конкретная Data Structure выбирается на основе List Score списка, на который она ссылается. Это означает, что если сущность присутствует в нескольких списках, система предпочтет контекст из списка с наивысшей оценкой (наиболее популярного).

Claim 4 и 5 (Зависимые от 1): Описывают вывод связанной информации.

Система может также предоставлять данные о подмножестве сущностей из списка (связанные сущности) и их ранги. Для ограничения количества отображаемых сущностей может применяться пороговое значение ранжирования (ranking threshold) (например, Топ-5).

Claim 6 и 7 (Зависимые от 1): Описывают формат вывода.

Система генерирует текст на естественном языке (Natural Language Text), соответствующий контекстному факту и рангу. Этот текст может быть предоставлен в виде аудиовыхода через синтез речи (text-to-speech, TTS) или голосовой ответ.

Claim 8 (Зависимый от 1): Уточняет идентификацию сущности.

Идентификация конкретной сущности может происходить через получение синонима (synonym), соответствующего этой сущности.

Где и как применяется

Изобретение применяется на нескольких этапах поисковой архитектуры, в основном связанных с обработкой сущностей и формированием специальных элементов выдачи.

INDEXING – Индексирование и извлечение признаков (Офлайн-обработка)
На этом этапе происходит основная предварительная обработка. Система использует данные из индекса (вероятно, Knowledge Graph) для:

  1. Извлечения фактов и атрибутов сущностей.
  2. Ранжирования сущностей по атрибутам (Fact Ranking Engine).
  3. Генерации списков (List Generator).
  4. Генерации и сохранения Data Structures для быстрого доступа.

QUNDERSTANDING – Понимание Запросов
Офлайн: Анализ журналов запросов используется для расчета List Scores. Система определяет, какие списки и сравнения наиболее популярны у пользователей.
Онлайн: При обработке запроса система должна идентифицировать сущность (включая синонимы, Claim 8) и атрибут, упомянутые в запросе (например, в запросе "высота Эвереста" идентифицировать сущность "Эверест" и атрибут "высота").

METASEARCH – Метапоиск и Смешивание (Формирование SERP Features)
Основное применение патента происходит на этапе формирования выдачи, конкретно при создании Knowledge Panel или Прямых Ответов (Direct Answers).

  1. Context Fact Engine получает идентифицированную сущность и атрибут.
  2. Fact Selector запрашивает соответствующие Data Structures и выбирает наилучший контекст на основе List Score.
  3. Natural Language Processor генерирует текстовое или аудио представление.
  4. Результат встраивается в SERP.

Входные данные:

  • (Офлайн): База знаний о сущностях и их атрибутах.
  • (Офлайн): Журналы поисковых запросов.
  • (Онлайн): Запрос пользователя, идентифицированная сущность и атрибут.
  • (Онлайн): Предварительно рассчитанные Data Structures и List Rankings.

Выходные данные:

  • Контекстный факт (ранг и описание списка) в текстовом или аудиоформате, часто отображаемый в Knowledge Panel.
  • Опционально: связанные сущности из того же списка.

На что влияет

  • Конкретные типы контента: Влияет на представление информации о любых сущностях, которые могут быть ранжированы по какому-либо атрибуту (люди, места, продукты, компании, медиа).
  • Специфические запросы: Наиболее сильно влияет на фактоидные запросы, где пользователь ищет конкретное значение атрибута сущности (например, "сколько лет X", "насколько быстр Y", "цена Z").
  • Определенные форматы контента: Напрямую влияет на содержание Knowledge Panels, Прямых Ответов и ответов голосовых ассистентов (патент упоминает TTS и голосовые ответы).

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда поисковая система идентифицирует запрос, нацеленный на получение факта о конкретной сущности (Entity + Attribute).
  • Условия применения: Применяется, если для данной сущности и атрибута существуют предварительно сгенерированные Data Structures, то есть если сущность включена в один или несколько ранжированных списков, известных системе.
  • Выбор контекста: Если существует несколько контекстов (списков), применяется тот, который имеет наибольший List Score.

Пошаговый алгоритм

Процесс разделен на две фазы: офлайн-подготовка и онлайн-обработка.

Фаза 1: Офлайн-подготовка контекстных данных

  1. Генерация списков: Fact Ranking Engine и List Generator идентифицируют наборы сущностей с общими атрибутами и создают ранжированные списки на основе значений этих атрибутов (например, ранжирование гор по высоте).
  2. Расчет оценок списков (List Scoring): Система анализирует частоту недавних поисковых запросов, связанных с каждым списком, и присваивает каждому списку List Score, отражающий его популярность.
  3. Генерация структур данных: Data Structure Generator обрабатывает каждый список. Для каждой сущности в списке создается отдельная Data Structure, которая хранит идентификатор сущности, контекстный факт (атрибут списка), ранг сущности в этом списке и List Score этого списка.
  4. Индексирование и сохранение: Сгенерированные Data Structures и List Rankings сохраняются для быстрого доступа во время обработки запросов.

Фаза 2: Обработка запроса в реальном времени

  1. Получение и анализ запроса: Search Engine получает запрос. Система идентифицирует конкретную сущность (с учетом синонимов) и атрибут, интересующие пользователя.
  2. Поиск контекстных данных: Fact Selector ищет все Data Structures, которые соответствуют идентифицированной сущности и атрибуту.
  3. Выбор наилучшего контекста: Если найдено несколько Data Structures (т.е. сущность входит в несколько релевантных списков), система выбирает ту, у которой наивысший List Score.
  4. Синтез ответа: Natural Language Processor использует данные из выбранной Data Structure (сущность, ранг, список) для генерации ответа на естественном языке (Natural Language Synthesis).
  5. (Опционально) Извлечение связанных сущностей: Система может извлечь другие сущности из того же списка, используя ranking threshold для ограничения количества.
  6. Вывод результата: Search Engine предоставляет сгенерированный контекстный факт для вывода (текст или аудио).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных о сущностях и поведении пользователей для генерации контекста.

  • Данные о сущностях (Entity Data): Структурированные данные об атрибутах сущностей (например, высота горы, дата рождения человека, скорость автомобиля). Это основа для ранжирования фактов. (Предположительно из Knowledge Graph).
  • Поведенческие факторы (Query Logs): Журналы поисковых запросов критически важны для определения популярности списков. Система анализирует, как часто пользователи ищут информацию, связанную с конкретным списком или сравнением.

Какие метрики используются и как они считаются

  • Rank (Ранг): Порядковый номер сущности в упорядоченном списке, основанный на значении её атрибута. Рассчитывается путем сортировки сущностей.
  • List Score (Оценка списка): Метрика популярности списка. В патенте (Claim 2) указано, что она рассчитывается на основе частоты недавних поисковых запросов (frequency of recent search queries), включающих этот список.
  • Ranking Threshold (Порог ранжирования): Упоминается (Claim 5) как механизм для фильтрации связанных сущностей при выводе. Система может показывать только Топ-N связанных сущностей из списка.

Выводы

  1. Приоритет контекста на основе интереса пользователя: Ключевым механизмом является List Score. Google не просто показывает ранг сущности в любом доступном списке, а активно выбирает тот список, который наиболее популярен среди пользователей (на основе частоты запросов). Если список "Самые высокие здания в мире" популярнее списка "Самые высокие здания в Азии", система предпочтет первый.
  2. Эффективность за счет предварительных вычислений: Чтобы обеспечить быстрый ответ, весь контекст (ранги, оценки списков) рассчитывается заранее (офлайн) и сохраняется в виде Data Structures. Во время запроса система только извлекает и сравнивает List Scores.
  3. Важность для голосового поиска (Voice Search): Патент явно подчеркивает использование Natural Language Synthesis и возможность вывода через Text-to-Speech (TTS). Этот механизм критичен для предоставления информативных и естественно звучащих ответов голосовыми ассистентами.
  4. Ориентация на сущности и атрибуты (Entity SEO): Система полностью зависит от способности Google распознавать сущности (включая синонимы) и точно извлекать значения их атрибутов. Это основа для работы Fact Ranking Engine и подчеркивает важность работы со структурированными данными.

Практика

Best practices (это мы делаем)

  • Обеспечение точности и доступности данных о сущностях (Entity SEO): Убедитесь, что все ключевые атрибуты сущностей (продуктов, людей, локаций компании) представлены на сайте точно, в структурированном виде и легко извлекаются. Используйте таблицы, списки определений и микроразметку (Schema.org) для четкой передачи фактов. Это необходимо для того, чтобы Fact Ranking Engine мог корректно обработать данные и включить их в Knowledge Graph.
  • Анализ востребованных сравнений (List Intent): Изучайте, какие сравнения и списки популярны в вашей нише (например, "самые быстрые CPU", "самые безопасные автомобили"). Понимание этого поможет предсказать, какой контекст Google может выбрать (на основе высокого List Score) для ваших сущностей.
  • Создание контента на основе популярных списков: Создавайте высококачественный контент, который соответствует популярным сравнительным запросам (например, статьи типа "Топ-10 X по параметру Y"). Если ваш сайт является авторитетным источником, эта информация может быть использована Google для формирования Context Facts.
  • Оптимизация под голосовой поиск: Поскольку механизм активно используется для генерации голосовых ответов (NLG и TTS), оптимизация контента под естественные вопросительные запросы об атрибутах сущностей повышает шансы на то, что ваш контент будет использован в качестве источника для этих фактов.

Worst practices (это делать не надо)

  • Предоставление неточных или устаревших фактов: Если ваши данные неверны, Fact Ranking Engine неправильно определит ранг вашей сущности. Это может привести к некорректному отображению контекста или полному исключению из списков.
  • Игнорирование структурированных данных: Полагаться только на неструктурированный текст для передачи ключевых атрибутов. Это затрудняет извлечение фактов и их использование в ранжированных списках.
  • Манипуляция популярностью списков: Попытки искусственно завысить частоту запросов для определенных списков (чтобы повлиять на List Score) скорее всего будут неэффективны и могут быть расценены как спам.

Стратегическое значение

Патент подтверждает стратегический фокус Google на понимании мира через призму сущностей, их атрибутов и взаимосвязей (Knowledge Graph). Для SEO это означает, что работа над представлением сущностей становится все более критичной. Патент также показывает механизм, с помощью которого Google определяет "интересность" информации (через List Score), что подчеркивает необходимость анализа реального спроса пользователей не только на темы, но и на конкретные типы сравнений и контекста.

Практические примеры

Сценарий: Выбор контекста для продукта на основе популярности списка (List Score)

  1. Сущность и Атрибут: Смартфон "Phone X", время работы батареи (25 часов).
  2. Офлайн-обработка: Google сгенерировал два списка:
    Список A: "Смартфоны с лучшей батареей" (List Score = 90). Phone X занимает 5-е место.
    Список B: "Лучшие смартфоны бренда Y" (List Score = 40). Phone X занимает 1-е место.
  3. Запрос пользователя: "время работы батареи Phone X".
  4. Онлайн-обработка: Система идентифицирует сущность и атрибут. Она находит две Data Structures, соответствующие Спискам A и B.
  5. Выбор контекста: Система выбирает Список A, так как его List Score (90) выше, чем у Списка B (40).
  6. Результат (в Knowledge Panel):
    Время работы батареи: 25 часов.
    (Контекстный факт): 5-й среди смартфонов с лучшей батареей.
  7. Вывод для SEO: Пользователи больше заинтересованы в сравнении батареи с рынком в целом, а не внутри бренда. Необходимо фокусироваться на улучшении позиций именно в глобальном, более популярном списке.

Вопросы и ответы

Что такое List Score и почему он важен?

List Score — это оценка популярности или важности ранжированного списка, основанная на частоте связанных с ним поисковых запросов. Это ключевая метрика в данном патенте. Если сущность фигурирует в нескольких списках, Google использует List Score, чтобы определить, какой из этих контекстных фактов показать пользователю в первую очередь. Приоритет отдается наиболее популярному контексту.

Как этот патент влияет на стандартное ранжирование (10 синих ссылок)?

Патент не описывает механизмы ранжирования веб-страниц. Он полностью сосредоточен на улучшении представления информации о сущностях в SERP-функциях, таких как Knowledge Panel, Featured Snippets или в ответах голосовых ассистентов. Он не затрагивает алгоритмы ранжирования веб-документов в основном индексе.

Как я могу повлиять на то, какие контекстные факты Google показывает о моей компании или продукте?

Вы можете повлиять на это двумя способами. Во-первых, обеспечив точность и полноту данных о ваших сущностях (через структурированные данные и авторитетные источники), чтобы Fact Ranking Engine мог корректно их ранжировать. Во-вторых, фокусируясь на достижении высоких позиций в тех рейтингах и списках, которые популярны среди вашей целевой аудитории (имеют высокий List Score).

Что произойдет, если сущность принадлежит к нескольким спискам?

Система выберет контекст из того списка, у которого наивысший List Score. Например, если человек является одновременно 10-м самым богатым человеком в мире (очень популярный список) и 2-м самым богатым человеком в своей стране (менее популярный список), Google предпочтет показать контекст из мирового списка.

Как этот патент связан с использованием Schema.org?

Патент не упоминает Schema.org напрямую, но он полагается на точные структурированные данные об атрибутах сущностей для работы Fact Ranking Engine. Использование Schema.org является лучшей практикой для предоставления этих данных поисковым системам в понятном формате, что критически важно для корректного ранжирования сущностей в списках.

Используется ли этот механизм в голосовом поиске?

Да, и это одно из его основных применений. Патент явно упоминает Natural Language Synthesis и генерацию аудиоответов (TTS). Система идеально подходит для голосовых ассистентов, так как позволяет дать не просто сухой факт, а развернутый ответ с контекстом (например, «Рост X составляет Y, это делает его 5-м самым высоким Z»).

Откуда Google берет данные для генерации этих ранжированных списков?

Патент не детализирует источники данных, но упоминает Fact Ranking Engine, который генерирует эти списки. На практике источниками являются Knowledge Graph, данные извлеченные из авторитетных веб-страниц (например, таблиц и списков), Wikidata, а также данные, предоставленные напрямую через структурированную разметку на сайтах.

Может ли система распознать сущность, если я использую её неофициальное название?

Да. В патенте (Claim 8) указано, что система способна идентифицировать сущность по её синониму. Это стандартная функция этапа Query Understanding, которая обеспечивает корректное срабатывание механизма даже при использовании разных вариантов названия сущности.

Что такое Ranking Threshold и как он используется?

Ranking Threshold — это пороговое значение, используемое для ограничения количества связанных сущностей, отображаемых в Knowledge Panel. Например, если система показывает контекстный факт о 9-м самом высоком президенте, она может использовать порог, чтобы показать только Топ-4 самых высоких президентов в карусели рядом, а не весь список.

Стоит ли мне создавать много ранжированных списков на моем сайте, чтобы воспользоваться этим патентом?

Создание качественных, полезных и основанных на точных данных ранжированных списков, которые отвечают на популярные запросы пользователей, является хорошей стратегией. Если ваш сайт авторитетен, Google может использовать эти данные. Однако создание большого количества низкокачественных списков не принесет пользы, так как они вряд ли будут использованы Fact Ranking Engine.

Похожие патенты

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи
Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.
  • US9477759B2
  • 2016-10-25
  • Семантика и интент

  • Индексация

  • Knowledge Graph

Как Google использует Knowledge Graph для выбора формата отображения и ранжирования ответов на запросы с модификаторами (например, «лучший», «самый высокий»)
Google использует этот механизм для ответов на запросы, содержащие сущности и модификаторы (например, «самые высокие здания» или «лучшие фильмы»). Система анализирует запрос, извлекает данные из Knowledge Graph и автоматически определяет, как ранжировать результаты (например, по высоте или рейтингу) и в каком формате их представить (например, в виде списка, карты, временной шкалы или диаграммы) на основе свойств сущностей.
  • US9390174B2
  • 2016-07-12
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google адаптирует содержимое Панели Знаний под контекст поискового запроса пользователя
Google использует механизм для динамической настройки Панели Знаний. Система анализирует не только главную сущность в запросе, но и дополнительные контекстные термины. На основе этого контекста система переранжировывает факты и контент внутри панели, выделяет наиболее релевантную информацию и меняет порядок блоков, чтобы точнее ответить на интент пользователя.
  • US10402410B2
  • 2019-09-03
  • Семантика и интент

  • Knowledge Graph

  • SERP

Как Google динамически выбирает, форматирует и приоритизирует контент внутри Панели Знаний
Google использует систему для динамической генерации Панелей Знаний. Для сущности определяются релевантные элементы контента (факты, изображения, события), которые классифицируются и оцениваются по популярности/релевантности (Rank Score). Система выбирает, какие категории контента показать и в каком формате (модуле), основываясь на этих оценках и строгих ограничениях по верстке (Panel Constraints), гарантируя приоритет наиболее важной информации.
  • US9477711B2
  • 2016-10-25
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует результаты веб-поиска для выбора правильного ответа на неоднозначные фактические запросы
Google использует этот механизм для разрешения неоднозначности в запросах (например, «возраст Вашингтона»). Система генерирует несколько потенциальных ответов из Knowledge Graph, а затем проверяет, какой из них лучше всего подтверждается топовыми результатами органического поиска. Оценка кандидата зависит от того, насколько часто и уверенно Сущность (Topic) и Ответ (Answer) упоминаются (аннотируются) на страницах в топе выдачи.
  • US9336269B1
  • 2016-05-10
  • Семантика и интент

  • Knowledge Graph

  • SERP

Популярные патенты

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
  • US8375073B1
  • 2013-02-12
  • EEAT и качество

  • SERP

  • Ссылки

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга
Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.
  • US11409812B1
  • 2022-08-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

seohardcore