SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google находит ответы на фактологические вопросы, анализируя консенсус сущностей в топе поисковой выдачи

QUESTION ANSWERING USING ENTITY REFERENCES IN UNSTRUCTURED DATA (Ответы на вопросы с использованием ссылок на сущности в неструктурированных данных)
  • US9477759B2
  • Google LLC
  • 2013-03-15
  • 2016-10-25
  • Семантика и интент
  • Индексация
  • Knowledge Graph
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует этот механизм для автоматического ответа на фактологические вопросы путем анализа неструктурированного текста топовых результатов поиска. Система определяет, какая сущность (например, человек, место) чаще всего упоминается на авторитетных страницах. Эта наиболее часто упоминаемая сущность, с учетом нормализации частоты и веса источника, выбирается в качестве ответа.

Описание

Какую проблему решает

Патент решает проблему масштабируемого и актуального ответа на фактологические вопросы (например, «Кто», «Что», «Где»). Вместо того чтобы полагаться на вручную курируемые базы данных, которые медленно обновляются, изобретение позволяет автоматически извлекать ответы из unstructured data (неструктурированного контента) веб-страниц, обеспечивая актуальность и широкий охват.

Что запатентовано

Запатентована система автоматического ответа на вопросы, использующая подход «коллективного согласования» (collective reconciliation). Она агрегирует и ранжирует сущности (Entity References), извлеченные из неструктурированного текста топовых результатов поиска. Система определяет, какая сущность нужного типа чаще всего упоминается на релевантных и авторитетных веб-страницах (консенсус), и выбирает ее в качестве ответа.

Как это работает

Система работает в два этапа: офлайн (индексирование) и онлайн (ответ на запрос).

  • Офлайн: Во время индексирования система извлекает Entity References из неструктурированного текста документов и сохраняет их как previously generated data.
  • Онлайн: При получении запроса система определяет ожидаемый тип ответа (например, «Кто» -> Человек). Она генерирует стандартные результаты поиска и извлекает списки сущностей нужного типа из топовых результатов. Эти сущности агрегируются и ранжируются с использованием Weighted Sum (взвешенной суммы). Эта сумма учитывает частоту упоминаний (Frequency of Occurrence), нормализованную по длине документа, и авторитетность источника (Topicality Score). Сущность с наивысшим рейтингом выбирается как ответ.

Актуальность для SEO

Критически высокая. Описанный механизм является фундаментальным для систем генерации ответов, таких как Featured Snippets и Direct Answers. Способность Google извлекать факты из неструктурированного текста и полагаться на консенсус авторитетных источников для верификации ответа остается центральной частью современных поисковых технологий (NLP, Information Retrieval).

Важность для SEO

Патент имеет критическое значение (9/10) для SEO, особенно для стратегий, направленных на завоевание нулевой позиции (Featured Snippets). Он раскрывает механизм, как Google выбирает ответ из контента. Для оптимизации необходимо не только ранжироваться в топе, но и гарантировать, что нужная сущность четко присутствует в неструктурированном тексте и что страница обладает достаточной авторитетностью (Topicality Score), чтобы ее «голос» был учтен при подсчете консенсуса.

Детальный разбор

Термины и определения

Entity (Сущность)
Вещь или концепция, которая является сингулярной, уникальной, четко определенной и различимой (например, человек, место, предмет, идея).
Entity Reference (Ссылка на сущность)
Текстовая строка или другое упоминание в документе, которое ссылается на конкретную сущность.
Entity Type (Тип сущности)
Категоризация сущности (например, Человек, Локация). Используется для определения ожидаемого типа ответа на вопрос (например, «Кто» ожидает тип «Человек»).
Frequency of Occurrence (Частота встречаемости)
Количество раз, когда Entity Reference появляется в документе или наборе документов. Является ключевым сигналом ранжирования сущностей.
Normalization (Нормализация)
Процесс корректировки частоты встречаемости. В патенте (Claim 5) используется нормализация по длине документа (length of the respective previously generated data), чтобы предотвратить доминирование длинных текстов.
Previously Generated Data (Предварительно сгенерированные данные)
Данные (списки сущностей и их частоты), извлеченные из документов офлайн (во время индексирования) для быстрого доступа во время запроса.
Topicality Score (Оценка тематичности/авторитетности)
Метрика, используемая как сигнал ранжирования сущностей. Включает оценку авторитетности источника, в частности, количество ссылок на документ и с него (Claim 6), а также может включать свежесть и поведенческие сигналы.
Unstructured Data (Неструктурированные данные)
Контент веб-страниц (например, основной текст статьи), из которого извлекаются ответы.
Weighted Sum (Взвешенная сумма)
Метод агрегации нормализованных частот встречаемости сущностей из разных источников, где каждому упоминанию присваивается вес (например, на основе Topicality Score).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод ответа на вопрос путем анализа консенсуса в топовых результатах.

  1. Система получает запрос, связанный с типом сущности.
  2. Генерируются и ранжируются результаты поиска на основе релевантности.
  3. Извлекаются previously generated data, содержащие Entity References нужного типа.
  4. Определяется подмножество результатов поиска, рейтинг которых выше первого порогового значения (first predetermined ranking threshold).
  5. Для каждой сущности вычисляется Weighted Sum (взвешенная сумма) частот ее встречаемости в этом подмножестве.
  6. Критически важно: Взвешенная сумма нормализует (normalizes) частоту встречаемости.
  7. Сущности ранжируются на основе их взвешенных сумм.
  8. Выбирается сущность с наивысшим рангом и предоставляется как ответ.

Claim 4 (Зависимый от 1): Описывает механизм разрешения ничьих (tie-breaking).

Если ранжирование сущностей приводит к ничьей (tie), система анализирует дополнительные результаты поиска, находящиеся ниже первого порога, но выше второго порога (second predetermined threshold). Она переранжирует (reranking) сущности на основе взвешенной суммы сигналов из этих дополнительных результатов. Это итеративный процесс для повышения уверенности.

Claim 5 (Зависимый от 1): Уточняет механизм нормализации.

Нормализация частоты встречаемости основывается на длине соответствующих данных (length of the respective previously generated data). Это означает, что учитывается плотность упоминаний сущности, а не только абсолютное количество.

Claim 6 (Зависимый от 1): Уточняет один из факторов ранжирования.

Упоминается использование Topicality Score, основанного на количестве ссылок на соответствующие данные и с них (number of links to and from). Это подтверждает использование ссылочной авторитетности источника при выборе ответа.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая индексирование с генерацией ответа.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит ключевая предварительная обработка. Система анализирует unstructured data, идентифицирует Entity References и рассчитывает сигналы для Topicality Score (например, ссылочный анализ). Эта информация сохраняется как previously generated data.

QUNDERSTANDING – Понимание Запросов
Система должна классифицировать запрос как фактологический вопрос и определить ожидаемый Entity Type ответа (например, запрос «Кто президент Франции?» требует тип «Человек»).

RANKING – Ранжирование
Генерируется и ранжируется стандартный набор результатов поиска по запросу.

METASEARCH – Метапоиск и Смешивание (Генерация Ответа)
Основное применение патента. Специализированный модуль активируется для генерации ответа:

  1. Определяется подмножество топовых результатов (выше первого порога).
  2. Извлекаются предварительно рассчитанные Entity References нужного типа для этого подмножества.
  3. Вычисляется Weighted Sum частот с учетом нормализации и весов.
  4. Сущности ранжируются. При необходимости активируется механизм разрешения ничьих (расширение до второго порога).
  5. Выбирается ответ и смешивается с основной выдачей (например, как Featured Snippet).

На что влияет

  • Специфические запросы: Наибольшее влияние на фактологические запросы («Кто», «Что», «Где», «Когда»), требующие конкретного ответа в виде сущности.
  • Форматы контента: Влияет на генерацию Featured Snippets, Direct Answers и, возможно, на верификацию данных в Knowledge Panels через веб-контент.
  • Типы контента: Влияет на все типы контента, содержащие неструктурированный текст (статьи, новости, обзоры).

Когда применяется

  • Триггеры активации: Когда система идентифицирует запрос как вопрос, требующий ответа определенного Entity Type.
  • Условия применения: Когда в топовых результатах поиска (выше первого порога) присутствует достаточное количество Entity References нужного типа для расчета консенсуса.
  • Разрешение неопределенности (Tie-breaking): Механизм расширяет анализ на большее количество результатов (до второго порога), если среди топовых результатов нет явного консенсуса или возникла ничья (Claim 4).

Пошаговый алгоритм

Процесс А: Офлайн (Индексирование)

  1. Сканирование и парсинг: Получение неструктурированного контента документа.
  2. Извлечение сущностей: Идентификация Entity References в тексте и определение их типов.
  3. Расчет метрик документа: Определение длины документа (для нормализации) и расчет сигналов для Topicality Score (например, ссылочный анализ).
  4. Сохранение данных: Сохранение списка извлеченных сущностей, их частот и метрик документа как previously generated data.

Процесс Б: Онлайн (Ответ на запрос)

  1. Получение запроса и определение типа: Система получает запрос и определяет ожидаемый Entity Type.
  2. Генерация и ранжирование результатов: Получение стандартной поисковой выдачи.
  3. Выбор подмножества (Top N): Определение результатов выше первого порога ранжирования.
  4. Извлечение данных о сущностях: Получение previously generated data для выбранного подмножества.
  5. Нормализация частот: Корректировка частоты встречаемости каждой сущности на основе длины документа-источника (Claim 5).
  6. Расчет взвешенной суммы: Вычисление Weighted Sum для каждой уникальной сущности. Веса основываются на Topicality Score документа (включая ссылки, Claim 6) и/или его ранге.
  7. Ранжирование сущностей: Сортировка сущностей по их Weighted Sum.
  8. Проверка на ничью (Tie-breaking): Если есть ничья или низкая уверенность (Claim 4):
    1. Расширение подмножества результатами между первым и вторым порогами.
    2. Перерасчет рангов сущностей с учетом новых данных.
  9. Выбор и предоставление ответа: Выбор сущности с наивысшим итоговым рангом и отображение ответа пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных, извлеченных из контента и связанных с авторитетностью источников.

  • Контентные факторы (Неструктурированные): Основной текст документов используется для извлечения Entity References и подсчета их частоты.
  • Технические факторы: Длина документа используется для нормализации частоты встречаемости (Claim 5).
  • Ссылочные факторы: Количество ссылок на документ и с него (number of links to and from) используется как часть Topicality Score для взвешивания упоминаний сущностей (Claim 6).
  • Поведенческие факторы: Topicality Score может также включать (согласно описанию в патенте) количество выборов документа в предыдущих результатах поиска (number of selections of that document in previous search results).

Какие метрики используются и как они считаются

  • Frequency of Occurrence (Частота встречаемости): Подсчет упоминаний сущности в документе.
  • Normalized Frequency (Нормализованная частота): Частота встречаемости, скорректированная по длине документа (Claim 5).

Выводы

  1. Ответы основаны на консенсусе (Wisdom of the Crowds): Google определяет правильный ответ, агрегируя упоминания сущностей из множества высокоранжирующихся источников. Система ищет консенсус среди авторитетных сайтов.
  2. Неструктурированные данные как источник фактов: Система напрямую извлекает ответы из основного текста (unstructured data) веб-страниц. Присутствие сущности в тексте критично; нельзя полагаться только на структурированные данные.
  3. Авторитетность источника влияет на вес ответа: Упоминания сущностей взвешиваются. Topicality Score, который явно включает ссылочные факторы (Claim 6), определяет вес «голоса» каждого сайта. Упоминание на авторитетном сайте весит больше.
  4. Плотность сущностей важнее абсолютного числа упоминаний: Система использует нормализацию по длине документа (Claim 5). Это означает, что плотность упоминания сущности (Normalized Frequency) важнее, чем общее количество, что снижает эффективность спама сущностями в длинных текстах.
  5. Ранжирование в ТОПе необходимо, но не достаточно: Чтобы сайт стал источником ответа, он должен попасть в первичное подмножество (выше первого порога). Однако финальный ответ выбирается на основе агрегированного ранжирования сущностей (Weighted Sum), а не только по рангу страницы.
  6. Механизм разрешения споров (Tie-breaking): Если консенсус не ясен среди самых топовых результатов, Google расширяет анализ на большее количество страниц (ниже по выдаче), чтобы найти более уверенный ответ (Claim 4).

Практика

Best practices (это мы делаем)

  • Четкое и недвусмысленное упоминание сущностей: Убедитесь, что ключевые сущности (потенциальные ответы на вопросы) явно присутствуют в неструктурированном тексте. Используйте полные и канонические наименования, чтобы система могла корректно их извлечь и агрегировать.
  • Соответствие консенсусу авторитетных источников: Проверяйте, что факты на вашей странице соответствуют информации на других высокоавторитетных сайтах. Поскольку система ищет консенсус, предоставление не подтвержденных другими источниками фактов может помешать выбору вашего ответа.
  • Повышение авторитетности страницы (Topicality Score): Активно работайте над получением качественных обратных ссылок. Патент прямо указывает (Claim 6), что ссылки используются для расчета Topicality Score, который влияет на вес упоминаний сущностей с вашей страницы.
  • Оптимизация плотности сущностей: Вместо многократного повторения сущности в длинном тексте, фокусируйтесь на естественном и информативном изложении фактов. Нормализация по длине документа (Claim 5) ценит плотность, а не сырое количество.
  • Ранжирование в ТОП-10: Обеспечьте высокое ранжирование страниц по целевым фактологическим запросам. Только страницы, попавшие в верхнюю часть выдачи (выше пороговых значений), участвуют в генерации ответа.

Worst practices (это делать не надо)

  • Спам сущностями (Entity Stuffing): Многократное повторение сущности в попытке искусственно увеличить Frequency of Occurrence. Это неэффективно из-за нормализации по длине документа (Claim 5) и может негативно сказаться на общем ранжировании.
  • Использование только структурированных данных: Полагаться исключительно на разметку Schema.org для предоставления фактов. Патент подчеркивает извлечение ответов из unstructured data (основного текста).
  • Создание длинного контента без повышения информативности: Увеличение длины текста без добавления ценности снизит нормализованную частоту ключевых сущностей, уменьшая шансы на выбор ответа с этой страницы.
  • Неоднозначные упоминания: Использование местоимений или сокращенных названий без четкого контекста может помешать системе правильно идентифицировать entity reference.

Стратегическое значение

Этот патент подтверждает стратегию Google по использованию веба как распределенной базы знаний. Он демонстрирует, как алгоритмы ранжирования (оценка авторитетности) напрямую интегрированы с системами ответов на вопросы. Стратегически, это подчеркивает синергию между традиционным SEO (ссылки, ранжирование в ТОП) и семантическим SEO (оптимизация под сущности). Для долгосрочного успеха необходимо строить авторитетные ресурсы, которые предоставляют четкие, основанные на консенсусе факты в легко извлекаемом формате.

Практические примеры

Сценарий: Оптимизация статьи для получения Featured Snippet на вопрос «Какова столица Австралии?»

  1. Анализ конкурентов (Консенсус): Проверить ТОП-10. Убедиться, что все авторитетные источники указывают «Канберра».
  2. Оптимизация контента (Unstructured Data): В тексте статьи четко указать: «Столицей Австралии является Канберра». Убедиться, что сущность «Канберра» присутствует в тексте несколько раз в релевантном контексте.
  3. Оптимизация плотности (Normalization): Не раздувать статью искусственно. Если статья короткая и по существу, плотность упоминания «Канберра» будет высокой, что выгодно из-за нормализации.
  4. Повышение авторитетности (Topicality Score): Получить ссылки с других релевантных страниц (например, статей о географии) на эту страницу. Это увеличит вес упоминаний «Канберра» с вашей страницы (Claim 6).
  5. Ожидаемый результат: Система анализирует ТОП-10. Она видит, что «Канберра» часто упоминается. Благодаря высокому Topicality Score вашей страницы, упоминания на ней вносят значительный вклад в Weighted Sum для «Канберры». Система выбирает «Канберра» как ответ и может использовать вашу страницу как источник для Featured Snippet.

Вопросы и ответы

Означает ли этот патент, что нужно чаще повторять ключевую сущность на странице?

Не совсем. Патент явно указывает (Claim 5), что частота встречаемости нормализуется по длине документа. Это означает, что система учитывает плотность упоминаний, а не их абсолютное количество. Искусственное повторение сущности (Entity Stuffing), особенно при увеличении общего объема текста, не даст преимущества. Важнее естественное и информативное присутствие сущности в контексте.

Как Google определяет авторитетность источника при выборе ответа?

Патент использует метрику Topicality Score для взвешивания упоминаний. В Claim 6 прямо указано, что эта оценка основывается на количестве ссылок на документ и с него. Также в описании патента упоминаются другие факторы, такие как свежесть и история кликов. Это означает, что стандартные SEO-сигналы авторитетности напрямую влияют на вероятность выбора ответа с вашей страницы.

Работает ли эта система только для вопросов типа «Кто»?

Нет. Хотя в примерах патента часто используются вопросы «Кто» и сущности типа «Человек», механизм универсален. Система определяет ожидаемый Entity Type на основе запроса. Это могут быть локации («Где»), даты («Когда»), определения («Что такое») или любые другие типы сущностей, которые система способна распознавать в неструктурированном тексте.

Что происходит, если топовые сайты не согласны друг с другом по поводу ответа или есть ничья?

Патент описывает механизм разрешения ничьих (Claim 4). Если среди самых топовых результатов (выше первого порога) нет явного консенсуса или несколько сущностей имеют одинаковый Weighted Sum, система расширяет анализ на большее количество результатов (ниже первого порога, но выше второго). Это позволяет найти более уверенный ответ, анализируя более широкий набор данных.

Извлекает ли система ответы из структурированных данных (Schema.org)?

Патент сфокусирован исключительно на извлечении ответов из unstructured data (основного текста страницы). Он был разработан для того, чтобы не зависеть от структурированных или курируемых баз данных. Хотя Google использует структурированные данные в других системах, этот конкретный механизм полагается на анализ обычного текста.

Как быстро обновляются ответы, если информация на сайтах изменилась?

Система полагается на данные (previously generated data), извлеченные во время индексирования (офлайн-процесс). Ответы обновятся после того, как Google переиндексирует достаточное количество авторитетных страниц в ТОПе, и новый консенсус будет рассчитан. Это обеспечивает актуальность ответов по мере обновления веба.

Как обеспечить, чтобы Google правильно идентифицировал сущность на моей странице?

Используйте канонические и полные наименования сущностей (например, «Джордж Вашингтон» вместо просто «Вашингтон»). Предоставляйте достаточный контекст вокруг упоминания сущности, чтобы помочь системам disambiguation (разрешения неоднозначности) связать ваше упоминание с правильной сущностью в Графе Знаний.

Может ли сайт с низким авторитетом стать источником ответа согласно этому патенту?

Это маловероятно. Во-первых, сайт должен попасть в ТОП выдачи (выше пороговых значений). Во-вторых, упоминания сущностей взвешиваются с помощью Topicality Score (включая ссылки). Упоминания на сайте с низким авторитетом будут иметь малый вес и вряд ли смогут повлиять на итоговый Weighted Sum по сравнению с авторитетными источниками.

Как этот патент связан с Featured Snippets?

Этот патент описывает один из вероятных механизмов, который Google использует для выбора ответа, отображаемого в Featured Snippet. Система ищет консенсус среди топовых результатов. Если ваш контент находится в топе и содержит четкое упоминание сущности, которая достигла консенсуса, он может быть выбран в качестве источника для сниппета.

Как этот патент связан с E-E-A-T?

Связь прямая и сильная. Механизм Topicality Score, используемый для взвешивания упоминаний сущностей, по сути, является алгоритмическим выражением авторитетности и надежности источника (Authority и Trustworthiness из E-E-A-T). Включение ссылочных факторов (Claim 6) в расчет этого скора подтверждает, что Google предпочитает ответы от авторитетных источников.

Похожие патенты

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует базу данных сущностей (Knowledge Graph) для формирования прямых ответов на вопросы о фактах
Google использует систему для идентификации запросов, направленных на получение фактов о конкретной сущности (Entity-Triggering Questions). Система анализирует топовые результаты поиска, определяет, какие сущности чаще всего ассоциируются с этими документами, и выбирает наиболее релевантную сущность. Затем система извлекает запрошенный атрибут (например, адрес, дату рождения) из своей базы данных сущностей или находит лучший сниппет, содержащий этот факт, чтобы предоставить прямой ответ пользователю.
  • US9081814B1
  • 2015-07-14
  • Knowledge Graph

  • Семантика и интент

  • SERP

Как Google извлекает и ранжирует прямые ответы (Featured Snippets) из веб-страниц
Google использует систему для ответов на вопросы пользователей путем извлечения конкретных предложений из результатов поиска. Система оценивает предложения-кандидаты по трем критериям: насколько часто похожие фразы встречаются в других результатах (консенсус), насколько предложение соответствует запросу (релевантность) и насколько авторитетен источник (ранг документа). Лучшие ответы отображаются над стандартными результатами поиска.
  • US8682647B1
  • 2014-03-25
  • SERP

  • Семантика и интент

Популярные патенты

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google идентифицирует, оценивает и ранжирует «Глубокие статьи» (In-Depth Articles) и «Вечнозеленый контент»
Google использует систему для идентификации и ранжирования высококачественного лонгрид-контента (In-Depth Articles). Система определяет авторитетные сайты на основе внешних наград и ссылочных паттернов. Контент оценивается по критериям «вечнозелености» (Evergreen Score), структуры (Article Score), отсутствия коммерческого интента и авторитетности автора (Author Score). Ранжирование основано на комбинации качества (IDA Score) и релевантности запросу (Topicality Score).
  • US9996624B2
  • 2018-06-12
  • EEAT и качество

  • Индексация

  • Семантика и интент

Как Google использует контекст пользователя для генерации неявных поисковых запросов и проактивного показа результатов
Система Google отслеживает контекст пользователя в реальном времени (набираемый текст, открытые документы, письма). На основе этого контекста автоматически генерируются множественные неявные запросы. Система объединяет результаты из разных источников (локальных и глобальных) и проактивно показывает их пользователю, используя поведенческие данные (клики) для улучшения релевантности.
  • US7664734B2
  • 2010-02-16
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google выбирает, сортирует и форматирует динамические Sitelinks на основе типа контента и свежести страниц
Патент Google описывает систему генерации Sitelinks (саб-ссылок), которые ведут непосредственно на конечный контент (статьи, видео, товары), а не на разделы сайта. Система определяет категорию контента и применяет специфические правила сортировки (например, по свежести для новостей), которые отличаются от стандартного ранжирования. Также используется специальное форматирование для улучшения навигации в SERP.
  • US9081832B2
  • 2015-07-14
  • Ссылки

  • SERP

  • Свежесть контента

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя и интерактивное уточнение для обучения моделей поиска
Google может инициировать поиск пассивно, основываясь на контексте действий пользователя (например, чтении статьи или телефонном звонке). Система позволяет пользователю уточнить этот поиск, выбрав один из использованных критериев (например, тапнув на сущность в тексте), чтобы повысить его значимость. Реакция пользователя на уточненные результаты используется для машинного обучения и улучшения взвешивания критериев в будущих поисковых запросах.
  • US11568003B2
  • 2023-01-31
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

seohardcore