SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google генерирует связанные запросы (Related Searches), используя сущности из топовых результатов и сохраняя структуру исходного запроса

REFINING SEARCH QUERIES (Уточнение поисковых запросов)
  • US8392443B1
  • Google LLC
  • 2010-03-17
  • 2013-03-05
  • Семантика и интент
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для автоматической генерации уточнений запросов (например, «Связанные запросы»). Система анализирует топовые документы в выдаче и извлекает из них ключевые сущности. Затем эти сущности комбинируются с важными терминами исходного запроса, при этом строго сохраняется исходный порядок слов, чтобы создать релевантные и естественно звучащие предложения для дальнейшего поиска.

Описание

Какую проблему решает

Патент решает задачу автоматизации процесса уточнения поисковых запросов. Он направлен на сокращение усилий пользователя, необходимых для поиска альтернативных формулировок и изучения смежных тем. Система призвана повысить точность и охват поиска, предлагая релевантные альтернативы (Refined Search Queries), которые помогают пользователям лучше понять контекст исходного запроса и разрешить возможные двусмысленности.

Что запатентовано

Запатентована система автоматической генерации уточненных поисковых запросов. Механизм основан на анализе документов, ранжирующихся по исходному запросу, и извлечении связанных с ними сущностей (entities). Ключевой особенностью является метод комбинирования этих сущностей с терминами исходного запроса (или их синонимами), при котором сохраняется относительный порядок исходных терминов для генерации естественных и релевантных предложений.

Как это работает

Система (Refinement Server) работает после получения результатов поиска по исходному запросу:

  • Выбор документов и сущностей: Отбираются топовые документы из результатов поиска, и из них извлекаются значимые сущности.
  • Идентификация важных терминов: В исходном запросе определяются ключевые термины (например, на основе IDF) и фиксируется их порядок.
  • Генерация кандидатов: Сущности комбинируются с этими терминами или их синонимами. Применяется строгое правило: относительный порядок терминов из исходного запроса должен сохраняться в кандидате.
  • Оценка и выбор: Кандидаты оцениваются по популярности в логах запросов (Search Logs) и поведенческим метрикам (CTR, long clicks), и лучшие выбираются для показа пользователю.

Актуальность для SEO

Высокая. Генерация связанных запросов («Related Searches», «People Also Ask») является стандартной и критически важной функцией современных поисковых систем. Описанные механизмы, такие как использование сущностей из топовых документов, анализ логов запросов и учет структуры языка для определения релевантных уточнений, остаются фундаментальными для понимания того, как Google направляет поисковые сессии пользователей и определяет смежные интенты.

Важность для SEO

Патент имеет высокое значение для SEO (8/10). Он раскрывает механизм, лежащий в основе генерации связанных запросов, и подчеркивает, что контент топовых страниц напрямую влияет на то, как Google понимает тематическое пространство вокруг запроса. Для SEO-специалистов это подтверждает необходимость интеграции релевантных сущностей в контент и улучшения поведенческих факторов для достижения тематического авторитета и влияния на предлагаемые поисковой системой уточнения.

Детальный разбор

Термины и определения

Entity (Сущность)
Слово или фраза, представляющая значимую, самодостаточную концепцию, найденную в документе. Часто определяется как последовательность символов, частота использования которой в качестве ранее поданного поискового запроса (previously-submitted search query) превышает пороговое значение.
Refined Search Query (Уточненный поисковый запрос)
Альтернативный запрос, сгенерированный системой и предложенный пользователю для уточнения или расширения исходного поиска (например, блок «Related Searches»).
Candidate (Кандидат)
Потенциальный уточненный запрос, сгенерированный путем комбинирования сущности и терминов исходного запроса (или их синонимов).
Search Log(s) (Логи запросов)
База данных ранее поданных поисковых запросов и связанной с ними информации (частота, даты, язык, данные о кликах).
IDF (Inverse Document Frequency, Обратная частота документа)
Метрика, используемая для оценки важности термина или сущности. Используется для идентификации ключевых терминов в запросе (Term Score) и для ранжирования сущностей.
Term Score (Оценка термина)
Метрика (часто IDF), используемая для определения важности отдельных терминов в исходном запросе.
Long Click / Short Click (Длинный / Короткий клик)
Метрики, основанные на времени пребывания пользователя (dwell time) на документе после клика. Используются для оценки релевантности документа и могут влиять на оценку связанных с ним сущностей.
Refinement Server (Сервер уточнений)
Компонент системы, отвечающий за получение исходных запросов, документов и генерацию уточненных запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод генерации уточненных запросов с акцентом на сохранение структуры исходного запроса.

  1. Система получает поисковый запрос.
  2. Получает результаты поиска.
  3. Выбирает документ из результатов.
  4. Генерирует кандидатов для уточненных запросов из entity text strings (текстовых строк сущностей), связанных с документом. Этот процесс включает:
    • Идентификацию трех или более терминов в исходном запросе, чья оценка (term score) удовлетворяет порогу.
    • Эти термины имеют определенный порядок (particular order) в запросе.
    • Комбинирование этих терминов с текстовой строкой сущности для генерации кандидата.
    • Ключевое условие: В сгенерированном кандидате эти три или более терминов должны сохранять тот же относительный порядок (particular order), что и в исходном запросе.
  5. Идентифицирует один или более кандидатов как уточненные поисковые запросы.

Примечание: Основной запатентованный механизм фокусируется на уточнении более длинных запросов (3+ важных термина), гарантируя сохранение их структуры.

Claim 2 (Зависимый): Уточняет процесс генерации кандидатов, позволяя заменять идентифицированный термин его синонимом при комбинировании с сущностью.

Claim 3 (Зависимый): Указывает, что выбор документа может основываться на его ранжировании (т.е. используются топовые документы).

Claim 4 (Зависимый): Описывает метод выбора сущностей. Сущности ранжируются на основе их частоты использования в качестве ранее поданных поисковых запросов. Используются только сущности с рангом выше порогового.

Claim 5 (Зависимый): Описывает альтернативный метод выбора сущностей. Сущности ранжируются на основе меры их частоты встречаемости в группе документов (результатах поиска).

Claim 7 (Зависимый): Указывает, что term scores (используемые в Claim 1 для идентификации важных терминов) могут быть значениями IDF.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, связывая данные индекса с процессом понимания запросов и формированием финальной выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит идентификация и индексация сущностей, связанных с документами. Рассчитываются и сохраняются оценки (scores) для сущностей, такие как IDF, частота использования в качестве запросов, данные о кликах (Long Clicks).

QUNDERSTANDING – Понимание Запросов
Система анализирует исходный запрос для выявления важных терминов (используя IDF) и использует Search Log(s) для валидации кандидатов.

RANKING – Ранжирование
Генерируется первичный набор результатов поиска, который определяет, какие документы будут использованы для извлечения сущностей.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента. После этапа RANKING, Refinement Server анализирует топовые документы и их сущности. Затем он генерирует блок уточненных запросов (например, «Related Searches»), который смешивается с основными результатами для формирования итоговой SERP.

Входные данные:

  • Исходный поисковый запрос.
  • Результаты поиска (документы и их ранги).
  • Индексные файлы: сущности, связанные с документами, и их оценки (IDF, click data).
  • Search Log(s): логи предыдущих запросов, CTR.
  • Данные о синонимах.

Выходные данные:

  • Набор уточненных поисковых запросов (Refined Search Queries).

На что влияет

  • Специфические запросы: Механизм, описанный в Claim 1, явно нацелен на запросы, состоящие из трех или более важных терминов. Он влияет на то, как уточняются длинные и сложные запросы, гарантируя сохранение их структуры.
  • Контент топовых страниц: Страницы, богатые релевантными сущностями и генерирующие положительные поведенческие сигналы, будут способствовать генерации более точных связанных запросов.

Когда применяется

  • Триггер активации: Алгоритм активируется в ответ на получение поискового запроса, после генерации основных результатов поиска.
  • Условия применения: Применяется, когда исходный запрос содержит достаточно важных терминов (3 или более с IDF выше порога) и когда в топовых документах можно идентифицировать значимые сущности (с оценкой выше порога).

Пошаговый алгоритм

Процесс генерации уточненных поисковых запросов:

  1. Получение запроса и результатов: Система получает запрос и генерирует результаты поиска.
  2. Выбор документов: Отбирается группа документов из результатов поиска (например, на основе ранга выше порогового).
  3. Ранжирование и выбор сущностей: Идентифицируются сущности, связанные с выбранными документами. Они ранжируются на основе Entity Score (см. раздел Метрики) и выбирается подмножество лучших.
  4. Идентификация важных терминов запроса: В исходном запросе определяются важные термины (чей IDF выше порога). Проверяется наличие трех или более таких терминов и фиксируется их порядок.
  5. Генерация кандидатов: Для каждой выбранной сущности генерируются кандидаты путем комбинирования с важными терминами:
    1. Применение правил: Строго соблюдается правило сохранения относительного порядка исходных терминов.
    2. Использование синонимов: Термины могут заменяться синонимами для генерации вариантов.
  6. Оценка и идентификация (Candidate Score): Кандидаты оцениваются на основе их популярности в Search Log(s), CTR, суммы IDF терминов и других критериев.
  7. Предоставление результатов: Выбранные уточненные запросы предоставляются вместе с результатами поиска.

Какие данные и как использует

Данные на входе

Патент описывает использование следующих типов данных:

  • Контентные и Структурные факторы: Используются сущности (entities), извлеченные из содержания документов. Оценка сущности может быть повышена, если она найдена в заголовке (title) документа.
  • Поведенческие факторы: Критически важные данные. Используются Search Log(s) для определения популярности сущностей и валидации кандидатов. Также используются данные о кликах (click data), включая CTR и время пребывания на документе (dwell time), для различения Long Clicks и Short Clicks.
  • Лингвистические факторы: Используются базы данных синонимов для генерации вариантов кандидатов.

Какие метрики используются и как они считаются

Система вычисляет несколько ключевых метрик для ранжирования:

  • IDF (Inverse Document Frequency): Ключевая метрика. Рассчитывается как log⁡(N/df(t))\log(N/df(t)).
  • Term Score (Оценка Термина): Используется для идентификации важных терминов в исходном запросе. В патенте указано использование IDF.
  • Entity Score (Оценка Сущности): Агрегированная метрика для ранжирования сущностей. Может рассчитываться на основе:
    • IDF: Сумма IDF каждого слова в сущности.
    • Частота в логах: Как часто сущность встречается в качестве ранее поданного запроса.
    • Co-occurrence (Совместная встречаемость): Как часто сущность и запрос встречаются вместе в документе.
    • Click Data: Вероятность того, что запрос, содержащий сущность, приведет к Long Click. Оценка увеличивается с ростом отношения Long Clicks к общему числу кликов.
    • Присутствие в заголовке: Повышение оценки, если сущность найдена в заголовке документа.
  • Candidate Score (Оценка Кандидата): Используется для выбора финальных уточненных запросов. Может основываться на частоте в Search Log(s), CTR, и сумме IDF терминов в кандидате.

Выводы

  1. Топовые результаты формируют контекст запроса: Патент подтверждает, что Google активно использует контент страниц, занимающих лидирующие позиции, для понимания контекста запроса и генерации связанных поисковых предложений. Сущности, присутствующие на этих страницах, определяют, какие уточнения будут предложены пользователю.
  2. Сущности и логи запросов – основа уточнений: Уточненные запросы генерируются из entities, которые часто сами являются популярными поисковыми запросами (подтверждено Search Log(s)). Это связывает контентную оптимизацию с реальным поисковым поведением.
  3. Важность структуры запроса (Order Maintenance): Ключевым элементом является правило сохранения относительного порядка терминов из исходного запроса. Это гарантирует, что уточнения будут грамматически и логически связными, особенно для длинных запросов (3+ слова).
  4. IDF как мера важности и специфичности: IDF используется для оценки важности как отдельных терминов в запросе, так и целых сущностей. Это подчеркивает важность использования в контенте терминов, которые являются отличительными и значимыми в рамках тематики.
  5. Поведенческие сигналы влияют на выбор сущностей: Оценка сущностей зависит от поведенческих данных, таких как Long Clicks. Сущности, связанные с контентом, который хорошо удовлетворяет интент пользователя, получают более высокий приоритет при генерации уточнений.
  6. Использование синонимов расширяет охват: Система может заменять термины исходного запроса синонимами при генерации кандидатов, что позволяет связывать семантически близкие, но текстуально различные запросы.

Практика

Best practices (это мы делаем)

  • Оптимизация под сущности (Entity Optimization): Необходимо идентифицировать ключевые сущности, релевантные для целевой тематики, и стратегически интегрировать их в контент. Патент упоминает, что наличие сущности в заголовке (title) повышает ее оценку. Это увеличивает вероятность использования этих сущностей для генерации связанных запросов.
  • Фокус на Topical Authority и попадание в Топ: Создавайте контент, который всесторонне охватывает тему. Поскольку сущности извлекаются преимущественно из топовых результатов, критически важно ранжироваться высоко, чтобы влиять на формирование понимания Google о данном тематическом пространстве.
  • Стимулирование Long Clicks: Поскольку Long Clicks повышают оценку связанных сущностей (Entity Score), критически важно создавать контент, который полностью удовлетворяет интент пользователя, удерживает его внимание и предоставляет исчерпывающую информацию.
  • Анализ Related Searches как источник интентов: Регулярно анализируйте блок «Related Searches». Это дает прямое понимание того, какие сущности и комбинации Google считает наиболее релевантными, основываясь на анализе топовых конкурентов и логов запросов. Покрывайте эти направления в своем контенте.
  • Использование значимых терминов (High IDF) и естественного языка: Используйте термины с высокой значимостью (потенциально высокий IDF). Пишите естественно, так как система учитывает порядок слов для генерации корректных предложений.

Worst practices (это делать не надо)

  • Создание контента без учета сущностей: Фокусировка исключительно на ключевых словах без понимания связанных сущностей приведет к созданию контента, который не будет способствовать тематическому авторитету и не будет эффективно участвовать в процессе генерации уточнений.
  • Манипуляции для получения Short Clicks (например, кликбейт): Контент, который разочаровывает пользователей и приводит к быстрым возвратам в выдачу (Short Clicks), будет снижать Entity Score связанных с ним сущностей.
  • Фокус только на коротких запросах: Согласно Claim 1, описанный механизм сохранения порядка активируется для запросов, содержащих три или более важных термина. Игнорирование оптимизации под средне- и длиннохвостые запросы снижает взаимодействие с этим алгоритмом.

Стратегическое значение

Этот патент подчеркивает переход от простого сопоставления ключевых слов к более сложному механизму, объединяющему анализ контента (сущности), анализ поведения пользователей (логи запросов, Long Clicks) и лингвистический анализ (сохранение порядка слов, синонимы). Стратегическое значение для SEO заключается в необходимости построения семантически богатого, авторитетного контента, который соответствует реальным поисковым паттернам пользователей. Влияние на «Related Searches» — это не только источник трафика, но и индикатор того, насколько хорошо Google понимает ваш контент в контексте общей темы.

Практические примеры

Сценарий 1: Сохранение порядка слов (Пример из патента)

  1. Исходный запрос (Q): "what to do after surgery" (что делать после операции). Важные термины сохраняют порядок: [after] -> [surgery].
  2. Анализ топа и сущность (E): В топовом документе найдена сущность "pain medications" (обезболивающие препараты).
  3. Генерация: Система комбинирует Q и E, сохраняя порядок слов.
  4. Результат: "pain medications after surgery". Порядок [after] -> [surgery] сохранен.

Сценарий 2: Использование синонимов (Пример из патента)

  1. Исходный запрос (Q): "paris accommodation" (жилье в Париже).
  2. Анализ топа и сущность (E): В топовом результате найдена сущность "eiffel tower" (Эйфелева башня).
  3. Генерация: Система заменяет термин "accommodation" на популярный синоним "hotels".
  4. Результат: "paris hotels eiffel tower".

SEO-действие: При оптимизации контента необходимо убедиться, что ключевые сущности естественно интегрированы в текст и связаны с основными интентами, а также использовать релевантные синонимы для расширения охвата.

Вопросы и ответы

Что такое «сущность» (Entity) в контексте этого патента?

Сущность определяется как значимая, самодостаточная концепция (слово или фраза), найденная в документе. Важно, что патент часто определяет сущность как строку символов, которая часто используется в качестве реального поискового запроса пользователями (т.е. популярна в Search Log(s)). Это не просто ключевое слово, а концепция, связанная с поисковым поведением.

Как Google определяет, какие сущности использовать для генерации связанных запросов?

Система выбирает сущности из документов, которые ранжируются в топе по исходному запросу. Затем эти сущности ранжируются на основе Entity Score. Эта оценка учитывает множество факторов: IDF сущности, как часто она встречается в логах запросов, присутствует ли она в заголовках документов, и связана ли она с Long Clicks (удовлетворенностью пользователей).

Что означает правило «сохранения порядка слов» и почему оно важно?

Это правило гарантирует, что при комбинировании сущности с терминами из исходного запроса относительный порядок этих терминов сохраняется. Например, если запрос "ремонт iphone после воды", а сущность "цена", Google может сгенерировать "ремонт iphone после воды цена", но не "ремонт после воды iphone цена". Это критично для создания естественных и логичных предложений.

Как этот патент связан с Topical Authority (Тематическим авторитетом)?

Он напрямую связан. Чтобы влиять на генерацию связанных запросов, ваш сайт должен ранжироваться в топе и содержать релевантные сущности, которые Google высоко оценивает. Сайт с высоким тематическим авторитетом естественным образом покрывает множество сущностей в рамках темы и удовлетворяет интент пользователя (Long Clicks), тем самым определяя, как Google видит взаимосвязи в этой тематике.

Какую роль играет IDF в этом патенте?

IDF (Обратная частота документа) играет центральную роль. Она используется для трех целей: 1) Идентификация важных терминов в исходном запросе (Term Score). 2) Оценка важности сущности (Entity Score). 3) Оценка качества финальных кандидатов (Candidate Score). Это подчеркивает важность использования значимых и отличительных терминов в контенте.

Может ли Google использовать синонимы при генерации связанных запросов?

Да, патент явно предусматривает (Claim 2) возможность замены термина из исходного запроса его синонимом при комбинировании с сущностью. Это позволяет системе генерировать семантически близкие, но текстуально отличающиеся варианты уточненных запросов.

Как поведенческие факторы (клики) влияют на этот процесс?

Поведенческие факторы критичны для оценки сущностей. Патент упоминает использование Long Clicks (длительное пребывание на странице) как индикатора релевантности. Сущности, связанные с контентом, который генерирует Long Clicks, получают более высокий Entity Score и с большей вероятностью будут использованы для генерации уточнений.

Влияет ли этот механизм на все типы запросов?

Хотя базовый принцип использования сущностей применим широко, основной механизм, описанный в Claim 1 (сохранение порядка слов), специфически нацелен на запросы, содержащие три или более важных термина. Для более коротких запросов могут применяться другие методы.

Как использовать знания из этого патента для улучшения SEO-стратегии?

Необходимо сместить фокус с отдельных ключевых слов на комплексное покрытие сущностей в рамках темы. Анализируйте топовых конкурентов на предмет используемых ими сущностей, интегрируйте эти сущности в свой контент (особенно в заголовки) и убедитесь, что контент максимально полно отвечает на запрос пользователя, чтобы стимулировать Long Clicks.

Откуда Google берет данные для этого алгоритма?

Google использует три основных источника: Индексные файлы, где хранятся связи между документами и сущностями, а также их оценки (например, IDF); Search Log(s), которые содержат информацию о реальных запросах пользователей и их частоте; и данные о поведении пользователей (клики и время пребывания на сайте).

Похожие патенты

Как Google сегментирует сложные запросы на смысловые компоненты для генерации поисковых подсказок и связанных запросов
Google использует механизм для генерации уточнений запроса (поисковых подсказок или связанных запросов) путем разделения исходного запроса на семантические компоненты (устойчивые фразы) с помощью вероятностного анализа. Система находит уточнения для каждого компонента по отдельности, а затем рекомбинирует их, сохраняя исходный порядок. Финальные кандидаты строго фильтруются на основе пользовательских данных (CTR) и синтаксической схожести.
  • US9703871B1
  • 2017-07-11
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google объединяет разные стратегии и поведенческие данные для генерации и выбора лучших альтернативных запросов
Google использует архитектуру, которая одновременно применяет множество стратегий (расширение, уточнение, синтаксис, анализ сессий) для генерации альтернативных запросов. Система оценивает качество этих вариантов с помощью показателей уверенности, основанных на поведении пользователей (например, длительности кликов) и критериях разнообразия. Лучшие альтернативы предлагаются пользователю, часто с превью результатов, чтобы помочь уточнить поиск.
  • US7565345B2
  • 2009-07-21
  • Поведенческие сигналы

  • SERP

Как Google автоматически создает и ранжирует шаблоны запросов с сущностями для улучшения поисковых подсказок (Autocomplete)
Google использует систему для автоматического обнаружения паттернов в поисковых запросах, которые включают фиксированные термины и сущности из определенной категории (например, «рестораны в [городе]»). Система генерирует шаблоны запросов, оценивает их качество на основе частоты использования, разнообразия сущностей и их распределения, а затем использует эти шаблоны для формирования более точных и структурированных поисковых подсказок в реальном времени.
  • US9529856B2
  • 2016-12-27
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Популярные патенты

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google использует историю чтения новостных сайтов для определения географических интересов пользователя и персонализации выдачи
Google может определять географические интересы пользователя, анализируя местоположение издателей новостных сайтов, которые он посещал. Эта информация (Geo Signal) используется для корректировки ранжирования будущих поисковых запросов, повышая результаты, релевантные этим интересам, даже если пользователь физически находится в другом месте.
  • US20130246381A1
  • 2013-09-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

seohardcore