SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google анализирует логи запросов для поиска популярных вопросов и определения их лучшей формулировки

POSTING QUESTIONS FROM SEARCH QUERIES (Публикация вопросов из поисковых запросов)
  • US8135712B1
  • Google LLC
  • 2008-06-27
  • 2012-03-13
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует этот механизм для анализа логов поисковых запросов и автоматического поиска часто задаваемых вопросов. Система группирует разные варианты одного и того же вопроса в «каноническую форму» путем нормализации текста. Затем она выбирает наиболее часто используемую формулировку как «репрезентативный вопрос» для публикации в Q&A сервисах или использования в поиске.

Описание

Какую проблему решает

Патент решает задачу автоматического и масштабируемого наполнения платформ Вопросов и Ответов (Q&A forum) релевантными и хорошо сформулированными вопросами. Цель — алгоритмически извлечь популярные вопросы из шумных логов поисковых запросов (Query logs) без необходимости ручной модерации, гарантируя, что выбранные формулировки являются естественными и часто используемыми.

Что запатентовано

Запатентована система и метод для майнинга, каноникализации и ранжирования вопросов из поисковых логов. Суть изобретения заключается в агрессивной нормализации различных формулировок запросов к единой канонической форме (canonical form) и последующем выборе наиболее популярной формулировки (representative question) на основе частоты использования. Это позволяет идентифицировать ключевые интенты пользователей и их предпочтительный язык.

Как это работает

Система работает в офлайн-режиме в несколько этапов:

  • Идентификация: Анализ Query logs для поиска запросов, содержащих вопросительные слова (question word), например, "how", "why".
  • Фильтрация и Нормализация: Из запросов удаляются стоп-слова (определенные на основе частотного анализа). Оставшиеся слова приводятся к базовой форме (лемматизация/стемминг).
  • Каноникализация: Нормализованные слова сортируются (например, по алфавиту). Результат является canonical form (например, "How boil egg").
  • Группировка: Различные исходные вопросы, которые привели к одной и той же canonical form, кластеризуются.
  • Ранжирование и Выбор: Внутри кластера вопросы ранжируются по частоте использования (frequency of submission). Самый частый вопрос выбирается как representative question.
  • Публикация: Репрезентативный вопрос публикуется на Q&A forum.

Актуальность для SEO

Высокая (в концептуальном плане). Хотя конкретные методы нормализации, описанные в патенте 2008 года (например, алфавитная сортировка слов), устарели по сравнению с современными нейросетевыми подходами (BERT, MUM), сама задача каноникализации запросов и выбора наилучшей формулировки остается критически важной. Эти принципы лежат в основе Понимания Запросов (Query Understanding) и функционирования блоков "People Also Ask" (PAA).

Важность для SEO

Патент имеет среднее прямое влияние на ранжирование (6/10), так как он не описывает алгоритмы ранжирования веб-страниц. Однако он имеет высокое стратегическое значение для контент-стратегии. Он раскрывает, как Google алгоритмически определяет, какие вопросы важны и какая формулировка является предпочтительной. Понимание этого механизма критично для оптимизации под блоки PAA, голосовой поиск и для точного попадания в информационный интент пользователя.

Детальный разбор

Термины и определения

Canonical Form / Canonical Search Query Form (Каноническая форма запроса)
Нормализованное внутреннее представление поискового запроса. Генерируется путем удаления стоп-слов, модификации оставшихся слов (лемматизация/стемминг) и их упорядочивания (например, по алфавиту). Служит ключом для группировки семантически схожих вопросов. Например, "How do I boil an egg" и "How can I boil eggs" могут быть приведены к форме "HOW boil egg".
Evaluation Engine (Механизм оценки)
Компонент системы, отвечающий за определение канонических форм. Использует правила из Evaluation files.
Evaluation Files (Файлы оценки)
Хранилище инструкций и правил для генерации канонических форм. Содержит список стоп-слов для удаления и правила модификации слов (например, правила спряжения, склонения, сортировки).
Q&A Pages / Q&A forum (Страницы/Форум Вопросов и Ответов)
Веб-страницы или сервис, на которых система публикует выбранные репрезентативные вопросы.
Query Logs (Логи запросов)
База данных, содержащая историю ранее выполненных поисковых запросов пользователей.
Question Word (Вопросительное слово)
Слово, указывающее на вопросительный характер запроса (например, who, what, where, why, when, how).
Ranking Engine (Механизм ранжирования)
Компонент, который ранжирует вопросы, соответствующие одной канонической форме, на основе частоты их использования, и выбирает Representative Question.
Representative Question / Representative Search Query (Репрезентативный вопрос)
Конкретная формулировка вопроса из группы схожих запросов, выбранная системой (обычно самая частая) для представления всей группы пользователям.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод работы системы.

  1. Система идентифицирует множество ранее отправленных поисковых запросов.
  2. Запросы фильтруются с использованием evaluation file для удаления определенных слов (стоп-слов), генерируя отфильтрованные запросы.
  3. Оставшиеся слова в отфильтрованных запросах модифицируются (нормализуются) с использованием evaluation file.
  4. Определяется подмножество запросов, которые в результате фильтрации и модификации приводят к определенной canonical search query form.
  5. Запросы внутри этого подмножества ранжируются на основе частоты отправки (frequency of submission).
  6. На основе ранжирования идентифицируется один запрос как representative search query.

Claim 5 и 6 (Зависимые): Детализируют процесс определения слов для удаления (стоп-слов).

  1. Слова во всем множестве исходных запросов ранжируются на основе частоты их встречаемости (Claim 5).
  2. Claim 6 уточняет, что ранжированный список слов может быть представлен пользователю (администратору), и слова для удаления определяются на основе выбора пользователя. Это указывает на потенциальное ручное участие в формировании списка стоп-слов.

Claim 7, 8 и 9 (Зависимые): Детализируют процесс каноникализации (модификации).

  • Claim 7: Включает алфавитную сортировку (alphabetizing) оставшихся слов.
  • Claim 8: Включает приведение глаголов к определенному времени (conjugating verbs).
  • Claim 9: Включает приведение существительных к определенному склонению/числу (updating declensions of nouns).

Claim 10 (Зависимый): Определяет результат работы.

  • Определяется наиболее часто отправляемый запрос.
  • Этот запрос размещается (posting) на веб-странице Вопросов и Ответов (Q&A).

Где и как применяется

Изобретение в первую очередь относится к этапу понимания запросов и анализу данных о поведении пользователей.

QUNDERSTANDING – Понимание Запросов
Система выполняет глубокий офлайн-анализ Query logs для понимания того, как пользователи формулируют свои потребности. Это процесс кластеризации и каноникализации интентов, который улучшает общее понимание пространства запросов поисковой системой.

INDEXING – Индексирование (Косвенно)
Результаты работы системы — Representative questions — публикуются на Q&A pages. Эти страницы затем индексируются и становятся доступными через поиск.

METASEARCH – Метапоиск и Смешивание (Косвенно)
Хотя патент фокусируется на Q&A форумах, описанные механизмы выявления репрезентативных вопросов являются основой для функционирования таких элементов выдачи, как People Also Ask (PAA).

Входные данные:

  • Query logs (история поисковых запросов и их частота).
  • Evaluation files (правила нормализации, списки стоп-слов).

Выходные данные:

  • Canonical files (соответствие между каноническими формами и исходными запросами).
  • Ranking files (отранжированные списки вопросов для каждой канонической формы).
  • Representative questions, опубликованные на Q&A pages.

На что влияет

  • Специфические запросы: Влияет исключительно на информационные запросы, которые содержат Question words (who, what, where, why, when, how и т.д.).
  • Типы контента: Влияет на контент, генерируемый на платформах Вопросов и Ответов (Q&A forums) и, косвенно, на формирование блоков PAA.

Когда применяется

  • Временные рамки и частота: Алгоритм применяется в офлайн-режиме (batch processing) для анализа исторических данных (Query logs). Он не вмешивается в процесс обработки запроса в реальном времени. Выполняется периодически по мере накопления новых данных.

Пошаговый алгоритм

Процесс разделен на три основные фазы: подготовка правил, каноникализация, ранжирование.

Фаза 1: Подготовка и Идентификация Стоп-слов

  1. Идентификация вопросов: Система анализирует Query logs и выбирает запросы, содержащие Question Words.
  2. Предварительная нормализация: Различные формы слов приводятся к единой форме (стемминг/лемматизация).
  3. Ранжирование слов: Все слова во всех идентифицированных вопросах ранжируются по частоте встречаемости.
  4. Определение стоп-слов: Слова, превышающие определенный порог частоты и признанные не влияющими на тему вопроса, помечаются для удаления. Патент указывает, что этот список может формироваться с участием пользователя (администратора).
  5. Сохранение правил: Список стоп-слов и правила нормализации сохраняются в Evaluation files.

Фаза 2: Каноникализация Запросов

  1. Удаление стоп-слов: Из вопросов удаляются слова, определенные в Фазе 1.
  2. Упорядочивание: Оставшиеся слова сортируются, например, по алфавиту. (Вопросительное слово может оставаться первым).
  3. Генерация Канонической Формы: Полученная упорядоченная последовательность слов является Canonical Form запроса.
  4. Группировка: Идентифицируются все исходные вопросы, которые привели к одной и той же Canonical Form.

Фаза 3: Ранжирование и Выбор

  1. Расчет частоты: Для каждого исходного вопроса внутри группы определяется частота его использования (frequency of submission) на основе Query logs.
  2. Ранжирование: Вопросы внутри группы ранжируются по убыванию частоты.
  3. Выбор Репрезентативного Вопроса: Вопрос с наивысшей частотой назначается как Representative Question.
  4. Постобработка: К репрезентативному вопросу применяются грамматические правила (например, знак вопроса в конце).
  5. Публикация: Репрезентативный вопрос публикуется на Q&A форуме.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Query logs являются основным источником данных. Используется частота отправки конкретных запросов (frequency of submission) и частота встречаемости отдельных слов в массиве запросов.
  • Контентные факторы (на уровне запросов): Текст запросов, наличие и тип вопросительных слов (Question Words).
  • Пользовательские факторы (в контексте администрирования): В патенте упоминается участие пользователя (администратора/асессора) в процессе определения списка стоп-слов для удаления.

Какие метрики используются и как они считаются

  • Frequency of Submission (Частота отправки запроса): Ключевая метрика для ранжирования различных формулировок одного и того же вопроса. Считается как общее количество раз, когда данный запрос был введен пользователями.
  • Word Frequency (Частота слова): Метрика для идентификации стоп-слов. Считается как частота встречаемости слова во всем анализируемом наборе поисковых запросов.
  • Методы анализа текста (NLP): Используются базовые NLP-методы: Удаление стоп-слов (Stopword Removal), Стемминг/Лемматизация (описанные как conjugating verbs и updating declensions of nouns), Сортировка слов (Alphabetical Order).

Выводы

  1. Алгоритмический выбор формулировки: Google использует подход, основанный на данных, для определения того, как лучше всего сформулировать вопрос. Это не ручной процесс.
  2. Частота как главный критерий качества: При выборе между несколькими вариантами формулировки одного и того же вопроса главным критерием является частота использования этой формулировки пользователями. Самая популярная версия считается лучшей.
  3. Агрессивная нормализация для кластеризации: Метод каноникализации агрессивен: он включает удаление слов и изменение порядка слов (алфавитная сортировка). Это позволяет надежно кластеризовать схожие интенты, даже если синтаксис сильно различается.
  4. Различие между Интентом и Формулировкой: Важно различать Canonical Form (внутреннее представление интента) и Representative Question (наиболее частая исходная формулировка, используемая для показа пользователям).
  5. Потенциальное ручное вмешательство: Процесс определения стоп-слов (Evaluation files) может включать ручную валидацию администратором, что отличается от полностью автоматизированных систем машинного обучения.

Практика

Best practices (это мы делаем)

Хотя патент не дает прямых указаний по ранжированию, он предоставляет критически важные инсайты для контент-стратегии и понимания запросов.

  • Оптимизация под "People Also Ask" (PAA): Этот патент описывает механизм, лежащий в основе PAA. Анализируйте блоки PAA, чтобы выявить Representative Questions, которые Google определил как наиболее частые в вашей нише.
  • Использование естественных и популярных формулировок: При создании контента (заголовков, H1, FAQ) используйте точные формулировки вопросов, которые система идентифицировала как репрезентативные (наиболее частые). Это повышает вероятность попадания в PAA и Featured Snippets.
  • Фокус на основном интенте (Canonical Form): Создавайте контент, который всесторонне отвечает на основной интент (соответствующий Canonical form), а не фокусируйтесь только на одной узкой формулировке. Это позволяет ранжироваться по всему кластеру связанных запросов.
  • Создание Q&A контента: Структурируйте контент в формате Вопрос-Ответ. Четкий вопрос (идентичный Representative Question) и лаконичный ответ увеличивают релевантность.

Worst practices (это делать не надо)

  • Оптимизация под неестественные или редкие запросы: Попытки оптимизировать контент под сложные или очень редкие формулировки вопросов неэффективны. Система предпочитает наиболее частые и простые варианты.
  • Игнорирование кластера запросов (Каннибализация): Создание отдельных страниц под каждую минимальную вариацию вопроса (например, "как варить яйцо" и "как варятся яйца"). Патент показывает, что Google агрессивно группирует такие запросы в один кластер.
  • "Изобретение" вопросов без данных: Создание разделов FAQ с вопросами, которые не подтверждены данными поиска (Query Logs или анализом PAA). Система фокусируется на том, что уже популярно.

Стратегическое значение

Патент подчеркивает стремление Google понять и каталогизировать пользовательские интенты, выраженные в форме вопросов. Для SEO это означает, что стратегический фокус должен смещаться от отдельных ключевых слов к ответам на конкретные информационные потребности. Понимание того, как Google кластеризует (через Canonical Form) и приоритизирует (через Frequency of Submission) вопросы, является ключом к созданию авторитетного контента.

Практические примеры

Сценарий: Оптимизация статьи для блока PAA

  1. Анализ интента и частотности: SEO-специалист исследует тему варки яиц и выявляет вариации:
    • "How do I boil an egg" (10000/мес)
    • "How can I boil eggs" (1500/мес)
    • "How are eggs boiled" (500/мес)
  2. Каноникализация (Симуляция): Система приводит их к Canonical Form: "HOW boil egg".
  3. Выбор Репрезентативного Вопроса: Система выбирает "How do I boil an egg" как наиболее частую формулировку.
  4. Действие SEO-специалиста: Использовать точную формулировку "How do I boil an egg?" в качестве заголовка H2 в статье и дать четкий ответ сразу под ним.
  5. Ожидаемый результат: Повышение вероятности попадания в блок PAA и Featured Snippet по этому репрезентативному запросу и всему кластеру.

Вопросы и ответы

Влияет ли этот патент напрямую на ранжирование моего сайта в Google Поиске?

Нет, напрямую не влияет. Патент не описывает алгоритмы ранжирования веб-страниц. Он описывает офлайн-процесс анализа логов запросов с целью генерации контента для Q&A платформ. Однако понимание этого процесса критично для оптимизации контента под пользовательские интенты.

Что такое "Каноническая форма" (Canonical Form) запроса в этом патенте?

Это агрессивно нормализованная версия запроса, используемая для группировки. Она создается путем удаления стоп-слов, приведения оставшихся слов к базовой форме (стемминг/лемматизация) и их сортировки (например, по алфавиту). Это внутреннее представление интента, а не то, что видит пользователь.

Как система выбирает "Репрезентативный вопрос" (Representative Question)?

Система группирует все вопросы, которые приводят к одной канонической форме. Затем она подсчитывает, как часто пользователи вводили каждую конкретную формулировку. Та формулировка, которая использовалась чаще всего (имеет наивысшую Frequency of Submission), выбирается как репрезентативная.

Патент упоминает алфавитную сортировку слов для каноникализации. Неужели Google до сих пор это использует?

Методы, описанные в патенте (подан в 2008 году), выглядят упрощенными. Современные системы (BERT, MUM) используют векторные представления для определения семантической близости. Однако алфавитная сортировка была эффективным детерминированным методом для нейтрализации различий в порядке слов на ранних этапах развития NLP.

Как Google определяет, какие слова нужно удалить (стоп-слова)?

Система анализирует частоту всех слов в корпусе вопросов. Наиболее частые слова (например, топ-200) считаются кандидатами. Патент предполагает, что администратор может вручную просмотреть этот список и выбрать слова, которые не влияют на тему вопроса (артикли, местоимения, вспомогательные глаголы).

Какая практическая польза от этого патента для SEO-специалиста?

Основная польза — оптимизация под блоки "People Also Ask" (PAA) и Featured Snippets. Понимая, что Google выбирает наиболее частотную формулировку как репрезентативную, вы можете таргетировать именно эту версию вопроса в своем контенте для повышения релевантности.

Применяется ли этот алгоритм в реальном времени при вводе запроса?

Нет. Это офлайн-процесс (batch processing). Система анализирует исторические логи запросов периодически, а не обрабатывает каждый запрос пользователя в момент его поступления с использованием этого конкретного механизма.

Как мне найти эти "Репрезентативные вопросы" для моей тематики?

Наиболее близким публичным аналогом результатов работы этой системы являются блоки "People Also Ask" (PAA) в поисковой выдаче. Также используйте инструменты анализа ключевых слов для определения наиболее частотных формулировок вопросов.

Стоит ли мне создавать отдельные страницы для каждого варианта вопроса?

Нет, это неэффективно и может привести к каннибализации. Система Google направлена на то, чтобы сгруппировать варианты под одной канонической формой. Лучше создать одну качественную страницу, которая использует репрезентативную формулировку и отвечает на интент, стоящий за всеми вариантами.

Для каких типов запросов работает эта система?

Система фокусируется исключительно на информационных запросах, которые содержат вопросительные слова (Question Words), такие как "как", "что", "где", "почему", "когда". Она не применяется к навигационным или транзакционным запросам.

Похожие патенты

Как Google проверяет и отбирает редкие (long-tail) запросы для поисковых подсказок (Autocomplete)
Google использует механизм для валидации редких поисковых запросов, чтобы определить, стоит ли добавлять их в поисковые подсказки (Autocomplete). Редкие запросы нормализуются (каноникализируются) и сравниваются с популярными запросами. Если редкий запрос семантически эквивалентен популярному, он признается качественным и допускается к показу в подсказках. Это позволяет Google предлагать разнообразные и полезные long-tail подсказки, отсеивая спам и бессмысленные запросы.
  • US20150120773A1
  • 2015-04-30
  • Семантика и интент

  • Антиспам

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google находит и предлагает более эффективные формулировки запросов через каноникализацию и оценку полезности
Google использует механизм для улучшения поисковых подсказок (Autocomplete). Система определяет запросы, которые имеют идентичную каноническую форму (тот же базовый интент после нормализации), но структурно отличаются от вводимого текста. Среди этих альтернатив выбираются те, которые исторически приводили к более высокой удовлетворенности пользователей (Query Utility Score), и предлагаются для повышения качества поиска.
  • US8868591B1
  • 2014-10-21
  • Семантика и интент

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Популярные патенты

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google динамически обновляет выдачу в реальном времени, если пользователь не кликает на результаты
Google отслеживает взаимодействие с поисковой выдачей в реальном времени. Если пользователь просматривает результаты, но не кликает на них в течение определенного времени (определяемого моделью поведения), система интерпретирует это как имплицитную отрицательную обратную связь. На основе анализа этих «отвергнутых» результатов Google автоматически пересматривает запрос (корректируя веса или заменяя термины) и динамически предоставляет новый набор результатов.
  • US20150169576A1
  • 2015-06-18
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

seohardcore