SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google автоматически оценивает и удаляет неэффективные синонимы и правила расширения запросов

REMOVING SUBSTITUTION RULES (Удаление правил подстановки)
  • US8600973B1
  • Google LLC
  • 2012-01-03
  • 2013-12-03
  • Семантика и интент
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для оценки эффективности правил подстановки (синонимов). Если подставленный термин редко встречается в топовых результатах поиска или если пользователи не кликают на результаты, содержащие этот термин, система автоматически удаляет или понижает уверенность в этом правиле. Это позволяет поддерживать качество и точность понимания запросов.

Описание

Какую проблему решает

Патент решает проблему контроля качества в системах автоматического переписывания и расширения запросов (например, с использованием синонимов). Если поисковая система применяет неверное или бесполезное правило подстановки (substitution rule), это может снизить релевантность выдачи за счет добавления шума или нерелевантных концепций. Изобретение предлагает эмпирический метод для автоматического выявления и удаления таких неэффективных правил на основе анализа контента веб-документов и поведения пользователей.

Что запатентовано

Запатентована система для автоматической оценки и удаления правил подстановки. Система отслеживает, насколько часто подставленный термин (substitute term) фактически появляется в документах (ресурсах), найденных по переписанному запросу (revised search query). Также учитывается, как часто пользователи взаимодействуют (кликают) с результатами, содержащими этот термин. На основе этих ключевых метрик (No Match Score и Click Score) система принимает решение о сохранении, удалении или изменении правила.

Как это работает

Механизм работает как петля обратной связи для системы понимания запросов:

  • Применение правила: Система использует правило (A->B) для расширения или изменения запроса.
  • Анализ результатов: Анализируются ресурсы, на которые ссылаются Топ-N результатов поиска (или первая страница SERP).
  • Расчет No Match Score: Если подставленный термин (B) отсутствует во всех этих ресурсах, счетчик No Match Score для правила увеличивается.
  • Расчет Click Score: Если термин (B) присутствует хотя бы в одном ресурсе и пользователь кликнул на этот результат, счетчик Click Score увеличивается.
  • Оценка (Офлайн): Периодически система оценивает правило. Если No-Match Ratio высок (термин редко встречается), а Click Ratio низок (пользователи не заинтересованы), правило признается неэффективным.
  • Действие: Неэффективное правило удаляется из коллекции или его оценка уверенности (confidence score) снижается.

Актуальность для SEO

Высокая. Точное понимание запросов, включая корректное использование синонимов и контекстуальных связей, является фундаментом современных поисковых систем (включая модели типа BERT и MUM). Этот патент описывает критически важный механизм контроля качества, который позволяет системе автоматически валидировать и корректировать свои лингвистические предположения на основе реальных данных и поведения пользователей.

Важность для SEO

Патент имеет высокое значение для SEO (7/10), так как напрямую касается этапа QUNDERSTANDING и того, как Google устанавливает и разрывает связи между ключевыми словами (синонимами). Он подчеркивает, что Google не полагается слепо на словари; связь между терминами должна быть подтверждена их присутствием в релевантных документах (Топ-N) и поведением пользователей (кликами). Это означает, что SEO-стратегии должны основываться на терминологии, которая фактически используется в авторитетных документах по теме.

Детальный разбор

Термины и определения

Click Ratio (Коэффициент кликов)
Отношение Click Score к Match Count. Оценивает полезность правила в тех случаях, когда подставленный термин присутствует в результатах.
Click Score (Счетчик кликов)
Количество случаев, когда пользователь выбрал (кликнул) результат поиска на начальной странице SERP, ресурс которого содержит substitute term.
Confidence Score (Оценка уверенности)
Метрика, связанная с правилом подстановки, отражающая вероятность того, что подстановка улучшит качество поиска. Может быть снижена, если правило неэффективно.
Match Count (Счетчик совпадений)
Количество переписанных запросов, для которых хотя бы один из Топ-N результатов содержал substitute term. Вычисляется как (Query Count - No Match Score).
No Match Score (Счетчик отсутствия совпадений)
Количество переписанных запросов, для которых ни один из ресурсов, на которые ссылаются Топ-N результатов (или результаты на начальной странице SERP), не содержал substitute term.
No-Match Ratio (Коэффициент отсутствия совпадений)
Отношение No Match Score к Query Count. Высокое значение указывает на то, что подставленный термин редко встречается в релевантных документах.
Query Context (Контекст запроса)
Условия, при которых применяется правило подстановки. Правила могут быть общими (general context) или специфичными (specific context), например, зависеть от наличия других слов в запросе.
Query Count (Общий счетчик запросов)
Общее количество переписанных запросов, проанализированных для данного правила подстановки.
Revised Search Query (Переписанный поисковый запрос)
Исходный запрос, модифицированный путем добавления или замены термина на основе substitution rule.
Substitute Term (Подставленный термин)
Термин (например, синоним), который используется для расширения или изменения исходного запроса.
Substitution Rule (Правило подстановки)
Правило (например, A->B), указывающее, что термин B может быть использован вместо или вместе с термином A.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый механизм определения ключевых метрик для оценки правила подстановки.

  1. Система определяет три метрики для правила подстановки (используемого для включения substitute term):
  2. Определение No-match score: Подсчет количества переписанных запросов, которые привели к формированию начальной страницы SERP, где результаты ссылались на ресурсы, текст которых НЕ содержал substitute term.
  3. Определение Click score: Подсчет количества переписанных запросов, которые привели к формированию начальной страницы SERP, где (I) один или несколько результатов содержали substitute term, И (II) пользователь выбрал (кликнул) один из этих результатов.
  4. Определение Query count: Общее количество переписанных запросов, сгенерированных с использованием правила.
  5. На основе этих трех метрик система определяет, следует ли удалить правило подстановки из модели переписывания запросов.

Claim 4 (Зависимый от 3): Детализирует комплексную логику удаления правила.

  1. Определяется Match count (количество запросов, где было совпадение термина - Claim 3).
  2. Определяется, что коэффициент отсутствия совпадений (No-match ratio) не удовлетворяет порогу (т.е. слишком много промахов).
  3. Определяется, что коэффициент кликов (Click ratio: Click score / Match count) не удовлетворяет порогу (т.е. слишком мало кликов на совпадения).
  4. Если ОБА условия выполнены (много промахов И мало кликов), правило удаляется.

Claim 5 (Зависимый от 3): Описывает условие сохранения правила (Исключение для редких, но полезных правил).

  1. Определяется, что No-match ratio не удовлетворяет порогу (слишком много промахов).
  2. Однако определяется, что Click ratio удовлетворяет порогу (высокий процент кликов на совпадения).
  3. В этом случае правило сохраняется. Это означает, что даже если подстановка редко релевантна, она очень ценна в тех случаях, когда она релевантна.

Claim 6 (Зависимый от 3): Описывает логику модификации контекста правила.

  1. Определяется, что No-match ratio не удовлетворяет порогу (в общем контексте).
  2. Определяется, что Click ratio удовлетворяет порогу, но только в специфическом контексте (specific context).
  3. В этом случае общее правило модифицируется, чтобы включать этот специфический контекст (т.е. правило сужается).

Claim 7 (Зависимый от 3): Описывает альтернативное действие.

Если оба коэффициента (No-match ratio и Click ratio) не удовлетворяют порогам, система может модифицировать (понизить) confidence score, связанный с подставленным термином, вместо полного удаления правила.

Где и как применяется

Изобретение является механизмом контроля качества (QA) и обратной связи для системы понимания запросов.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения. Процесс имеет две составляющие:

  • Онлайн (Query Revision): Query Reviser Engine использует существующие Substitution Rules для переписывания запросов пользователя в реальном времени.
  • Офлайн (Rule Evaluation): Substitution Engine периодически анализирует агрегированные данные из Query Log для оценки эффективности правил. По результатам оценки он обновляет коллекцию правил (удаляет, изменяет контекст или confidence score).

INDEXING – Индексирование
Для определения No Match Score система должна иметь доступ к содержимому проиндексированных ресурсов, чтобы проверить наличие substitute term.

RANKING / RERANKING (Сбор данных)
Система использует результаты ранжирования для определения Топ-N документов и собирает данные о поведении пользователей (клики) после отображения SERP.

Входные данные:

  • Агрегированные данные из Query Log для конкретного правила (A->B): множество переписанных запросов, Топ-N результатов для каждого, данные о кликах.
  • Контент ресурсов, на которые ссылаются Топ-N результаты.

Выходные данные:

  • Обновленная коллекция Substitution Rules: удаление правила, снижение его confidence score, или ограничение его контекста.

На что влияет

  • Специфические запросы: Влияет на запросы с неоднозначными терминами, синонимами или терминами, чье значение меняется со временем (семантический дрейф).
  • Контент и Терминология: Влияет на то, какие термины Google считает взаимозаменяемыми. Если связь между терминами ослабевает в контенте авторитетных сайтов или в поведении пользователей, Google перестанет их связывать.

Когда применяется

  • Частота применения: Анализ происходит в офлайн-режиме (batch processing), периодически или по мере накопления достаточного объема данных (Query Count) для статистически значимой оценки правила.
  • Триггеры удаления: Активация удаления или модификации правила происходит при достижении определенных пороговых значений No-Match Ratio и Click Ratio.

Пошаговый алгоритм

Офлайн-процесс оценки правила подстановки (A->B)

  1. Сбор данных: Получение набора переписанных запросов из Query Log, которые были модифицированы с использованием правила A->B.
  2. Инициализация метрик: Установка No Match Score = 0, Click Score = 0. Query Count устанавливается равным количеству запросов в наборе.
  3. Итеративный анализ запросов: Для каждого запроса в наборе:
    1. Идентификация Топ-N результатов: Выбор подмножества топовых результатов (например, результаты первой страницы SERP).
    2. Анализ контента ресурсов: Проверка ресурсов, на которые ссылаются Топ-N результаты, на предмет наличия подставленного термина B.
    3. Обновление No Match Score: Если термин B отсутствует во всех Топ-N ресурсах, No Match Score увеличивается.
    4. Обновление Click Score: Если термин B присутствует хотя бы в одном ресурсе, проверяется, выбрал ли пользователь результат, содержащий B. Если да, Click Score увеличивается.
  4. Оценка по критерию No-Match: Вычисление No-Match Ratio = (No Match Score / Query Count). Проверка, превышает ли коэффициент пороговое значение (No-Match Threshold).
    • Если НЕТ (коэффициент низкий): Правило сохраняется. Процесс завершен.
    • Если ДА (коэффициент высокий): Переход к шагу 6.
  5. Расчет Match Count: Вычисление Match Count = (Query Count - No Match Score).
  6. Оценка по критерию Click Ratio: Вычисление Click Ratio = (Click Score / Match Count). Проверка, ниже ли коэффициент порогового значения (Click Threshold).
    • Если НЕТ (Click Ratio высокий): Правило сохраняется (полезно, хотя и редко срабатывает). Процесс завершен.
    • Если ДА (Click Ratio низкий): Правило признано неэффективным. Переход к шагу 8.
  7. Анализ контекста (Опционально): Проверка, является ли Click Ratio высоким в специфических контекстах (specific contexts).
  8. Корректирующее действие: На основе оценки выполняется действие:
    • Удаление правила (если неэффективно в целом).
    • Снижение Confidence Score правила.
    • Ограничение контекста правила (если оно эффективно только в specific context).

Какие данные и как использует

Данные на входе

  • Контентные факторы: Полный текст ресурсов (веб-страниц), на которые ссылаются Топ-N результатов поиска. Система проверяет наличие буквального вхождения substitute term в этом тексте.
  • Поведенческие факторы: Данные о кликах пользователей (Usage Data) из Query Log. Используются для расчета Click Score и валидации полезности подстановки.
  • Системные данные: Query Logs (источник данных об использовании правил) и Collection of Substitution Rules (объект управления).

Какие метрики используются и как они считаются

Система использует четыре основных счетчика и два ключевых коэффициента:

  • Счетчики: Query Count, No Match Score, Click Score, Match Count.
  • No-Match Ratio: Коэффициент отсутствия совпадений. Оценивает, как часто термин отсутствует в выдаче.

    No-Match Ratio=No Match ScoreQuery Count\text{No-Match Ratio} = \frac{\text{No Match Score}}{\text{Query Count}}

  • Click Ratio: Коэффициент кликов. Оценивает вовлеченность пользователей в те результаты, где термин присутствует.

    Click Ratio=Click ScoreMatch Count\text{Click Ratio} = \frac{\text{Click Score}}{\text{Match Count}}

  • Пороговые значения: Система использует предопределенные пороги (Thresholds) для оценки этих коэффициентов. В патенте приводятся примеры: 95% для No-Match Threshold и 50% для Click Threshold.

Выводы

  1. Эмпирическая валидация лингвистики: Google не полагается на теоретические связи между словами (синонимы). Любое правило подстановки должно быть подтверждено реальными данными: присутствием термина в релевантных документах И поведением пользователей.
  2. Присутствие термина как основной критерий: Если система расширяет запрос термином, который отсутствует в Топ-N результатах (высокий No-Match Ratio), это считается сильным сигналом того, что правило подстановки неверно или бесполезно.
  3. Клики как подтверждение полезности: Поведение пользователей (Click Ratio) является финальным арбитром качества. Если пользователи не кликают на результаты, содержащие подставленный термин, правило будет удалено, даже если термин присутствует в контенте.
  4. Исключение для редких, но полезных правил: Патент защищает правила с высоким No-Match Ratio, если их Click Ratio также высок. Это означает, что правило может срабатывать редко, но когда срабатывает, оно значительно улучшает опыт пользователя.
  5. Важность контекста: Система способна определить, что правило неэффективно в общем случае, но полезно в специфическом контексте (specific context), и соответствующим образом скорректировать его применение, а не удалять полностью.

Практика

Best practices (это мы делаем)

  • Использование валидированного языка ниши: Сосредоточьтесь на использовании терминологии, которая широко распространена в авторитетных источниках вашей тематики (Топ-N). Google эмпирически подтверждает связи между словами на основе их присутствия в этом корпусе документов.
  • Анализ терминологии в SERP: Изучайте, какие термины, синонимы и связанные понятия используются в сниппетах и контенте лидеров выдачи. Это язык, который Google уже валидировал как релевантный для данного интента (низкий No-Match Ratio).
  • Оптимизация под удовлетворенность пользователя (CTR и Вовлеченность): Поскольку клики используются для валидации полезности терминов (Click Ratio), создание привлекательных сниппетов и контента, который точно соответствует ожиданиям пользователя, косвенно подтверждает для Google релевантность используемой вами терминологии.
  • Четкое определение контекста: При работе с неоднозначными терминами убедитесь, что контекст страницы ясен. Это поможет системе правильно применять контекстно-зависимые правила подстановки (context-specific substitution rules), как описано в Claim 6.

Worst practices (это делать не надо)

  • Надежда на "понимание" скрытых синонимов: Не стоит рассчитывать, что Google свяжет ваш контент с запросом через синоним, если этот синоним отсутствует на странице или редко используется в вашей нише. Патент показывает, что Google активно разрывает такие связи, если они не подтверждаются данными (высокий No-Match Ratio).
  • Использование устаревшей или искусственной терминологии: Внедрение редкого жаргона или использование устаревших терминов рискованно. Если эти термины не присутствуют в общем корпусе релевантных документов, Google не будет считать их валидными подстановками.
  • Искусственное внедрение синонимов (Synonym Stuffing): Добавление терминов, которые не имеют естественного отношения к контенту. Если это не улучшает пользовательский опыт и не привлекает клики, это не принесет пользы и может быть воспринято как спам.

Стратегическое значение

Патент подтверждает, что понимание языка Google основано на данных (data-driven) и постоянно самокорректируется. Система тестирует свои предположения о значении слов и корректирует их на основе контента веба и реакции пользователей. Для SEO это означает, что стратегия контента должна основываться на языке, который фактически используется и подтверждается в Топ-выдаче, а не на теоретических семантических связях или данных из словарей синонимов.

Практические примеры

Сценарий 1: Валидация общепринятого синонима

  1. Правило: "Couch" -> "Sofa".
  2. Анализ: Google проверяет Топ-10 результатов по запросам, включающим "Couch". В 98% случаев термин "Sofa" также присутствует в контенте. No-Match Ratio = 2% (ниже порога 95%).
  3. Результат: Правило сохраняется, так как оно подтверждено контентом авторитетных сайтов.
  4. SEO-действие: Использовать оба термина естественно в контенте о диванах.

Сценарий 2: Удаление неэффективного правила

  1. Правило: "Cats" -> "Felines" (Кошачьи).
  2. Анализ No-Match: По общим запросам о кошках ("Cats") термин "Felines" встречается только в 5% случаев в Топ-10. No-Match Ratio = 95% (достигает порога).
  3. Анализ Click Ratio: В тех 5% случаев, когда "Felines" встречается, пользователи кликают на эти результаты только в 10% случаев (Click Ratio = 10%, ниже порога 50%).
  4. Результат: Правило удаляется или его Confidence Score снижается, так как оно редко встречается и не интересует пользователей.
  5. SEO-действие: Не оптимизировать общие страницы о кошках под термин "Felines".

Сценарий 3: Сохранение редкого, но полезного правила

  1. Правило: "Программирование" -> "Кодинг".
  2. Анализ No-Match: Предположим, в академической среде термин "Кодинг" встречается редко. No-Match Ratio = 96% (выше порога).
  3. Анализ Click Ratio: Но в тех 4% случаев, когда он встречается (например, на сайтах онлайн-курсов), пользователи кликают в 80% случаев. Click Ratio = 80% (выше порога 50%).
  4. Результат: Правило сохраняется, так как оно полезно, когда срабатывает (Claim 5).
  5. SEO-действие: Сайты онлайн-курсов могут уверенно использовать термин "Кодинг".

Вопросы и ответы

Что такое правило подстановки (Substitution Rule) в контексте этого патента?

Это правило, которое позволяет поисковой системе переписывать исходный запрос пользователя, добавляя или заменяя термины синонимами или связанными понятиями (например, "Автомобиль" -> "Машина"). Цель — улучшить полноту поисковой выдачи, найдя релевантные документы, которые могут не содержать точной формулировки исходного запроса.

Что является главным критерием для Google при оценке качества синонима?

Основным критерием является фактическое присутствие подставленного термина в контенте топовых результатов поиска (низкий No-Match Ratio). Если Google использует синоним, но он отсутствует на релевантных страницах в выдаче, это сильный сигнал, что подстановка неэффективна. Это подчеркивает важность использования актуальной терминологии в контенте.

Как поведение пользователей (клики) влияет на оценку синонимов?

Клики используются для расчета Click Ratio, который служит подтверждением полезности подстановки. Если термин появляется в выдаче, но пользователи его игнорируют (низкий Click Ratio), это означает, что подстановка не улучшает пользовательский опыт, и правило может быть удалено, даже если термин присутствовал в контенте.

Может ли правило быть сохранено, если подставленный термин редко встречается в Топ-10?

Да. Патент предусматривает исключение (Claim 5): если No-Match Ratio высок (термин редко встречается), но Click Ratio также высок (пользователи активно кликают на результаты с этим термином, когда он появляется), правило сохраняется. Это защищает нишевые или очень точные правила подстановки.

Как этот патент влияет на подбор ключевых слов и использование синонимов в SEO?

Он подчеркивает необходимость использования только тех синонимов, которые естественно вписываются в контент и подтверждены использованием в авторитетных источниках ниши. Нельзя полагаться на то, что синонимы, которые работали ранее, работают и сейчас. Необходимо регулярно анализировать язык лидеров выдачи (Топ-N), так как Google валидирует свои правила, сверяясь именно с их контентом.

Что происходит, если правило эффективно только в определенном контексте?

Система может определить, что правило неэффективно в целом, но полезно в специфическом контексте (specific context), например, при наличии других слов в запросе (Claim 6). В этом случае Google может удалить общее правило и создать или сохранить контекстно-зависимое правило, сужая область его применения.

Система только удаляет правила или есть промежуточные варианты?

Помимо полного удаления правила, патент описывает возможность понижения Confidence Score (оценки уверенности) для этого правила (Claim 7). Понижение уверенности приведет к тому, что правило будет использоваться реже или с меньшим весом при переписывании запросов.

Происходит ли эта оценка в реальном времени?

Нет. Сбор данных происходит онлайн по мере поступления запросов. Однако анализ агрегированных данных (расчет No-Match Ratio и Click Ratio) и принятие решения об удалении или модификации правил происходят в офлайн-режиме (batch processing). Это позволяет провести анализ статистики за определенный период.

Как этот механизм взаимодействует с современными NLP-моделями, такими как BERT?

BERT и другие модели помогают генерировать более качественные кандидаты для подстановки и лучше понимать контекст. Однако описанный в патенте механизм служит финальной эмпирической валидацией. Независимо от того, как было сгенерировано правило (через словарь или нейронную сеть), оно должно быть подтверждено данными о его присутствии в контенте и кликами пользователей.

Влияет ли авторитетность сайта на оценку правила подстановки?

Патент напрямую не использует авторитетность как фактор в этом алгоритме. Однако система анализирует Топ-N результатов. Поскольку авторитетные сайты чаще занимают топовые позиции, их контент и терминология де-факто становятся эталоном для валидации правил подстановки. Если авторитетные сайты не используют термин, он вряд ли будет валидирован как эффективный синоним.

Похожие патенты

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google обучается распознавать синонимы, анализируя текст сниппетов в результатах поиска
Google использует текст сниппетов для улучшения систем понимания запросов. Анализируя, какие слова часто появляются в сниппетах релевантных или кликабельных результатов, система выявляет потенциальные синонимы для исходных ключевых слов. Это позволяет автоматически расширять будущие запросы, включая эти синонимы для повышения полноты выдачи.
  • US20140358904A1
  • 2014-12-04
  • Семантика и интент

  • SERP

Как Google использует анализ контента в топе выдачи для активации "слабых" синонимов и уточнения запроса
Google анализирует термины, которые необычно часто встречаются в первоначальных результатах поиска (сверхпредставленные термины). Если такой термин является потенциальным, но слабым синонимом для слова из запроса, система активирует эту связь и перезапускает поиск с уточненным запросом. Это позволяет контекстуально улучшать запрос на лету, используя специализированную лексику, доминирующую в нише.
  • US9152698B1
  • 2015-10-06
  • Семантика и интент

  • SERP

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует контекст запроса для исправления опечаток и понятийных ошибок, анализируя результаты поиска по оставшимся словам
Google использует механизм для исправления сложных, редких или понятийно ошибочных запросов. Если система идентифицирует потенциально неточный термин (опечатку или перепутанное название), она временно удаляет его и выполняет поиск по оставшимся словам. Затем анализируется контент найденных страниц (заголовки, анкоры, URL), чтобы определить правильный термин для замены, обеспечивая релевантную выдачу даже при ошибках пользователя.
  • US8868587B1
  • 2014-10-21
  • Семантика и интент

Популярные патенты

Как Google использует цитирования на веб-страницах для ранжирования книг в основной выдаче
Google использует механизм для определения релевантных книг по общим информационным запросам, даже если пользователь не искал книгу специально. Система анализирует, какие книги цитируются на топовых веб-страницах в выдаче. Книги получают оценку, основанную на авторитетности цитирующих страниц и контексте цитирования, и затем подмешиваются в результаты поиска.
  • US8392429B1
  • 2013-03-05
  • Ссылки

  • SERP

  • EEAT и качество

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google использует время просмотра (Watch Time) для ранжирования видео и другого контента
Google измеряет, сколько времени пользователи тратят на потребление контента (особенно видео) после клика по результату поиска и во время последующей сессии. Ресурсы, которые удерживают внимание пользователей дольше, получают повышение в ранжировании (Boost), а ресурсы с коротким временем просмотра понижаются. Система учитывает не только клики, но и фактическое вовлечение пользователя в рамках всей сессии просмотра.
  • US9098511B1
  • 2015-08-04
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует исторические данные о поведении пользователей для сохранения эффективных синонимов
Google постоянно обновляет модели, определяющие синонимы для расширения запросов. Этот патент описывает защитный механизм: если новая модель отключает синоним, который исторически давал хорошие результаты (пользователи были довольны выдачей), система автоматически вернет этот синоним в работу, опираясь на накопленные данные о поведении пользователей.
  • US8762363B1
  • 2014-06-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

seohardcore