SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует клики и пропуски (skips) для определения, какие слова в запросе можно игнорировать

CLICK OR SKIP EVALUATION OF QUERY TERM OPTIONALIZATION RULE (Оценка правил опционализации терминов запроса на основе кликов или пропусков)
  • US9141672B1
  • Google LLC
  • 2012-12-27
  • 2015-09-22
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google тестирует правила, которые делают определенные слова в запросе необязательными (опциональными), чтобы найти более релевантные результаты. Патент описывает, как система оценивает эффективность этих правил, анализируя поведение пользователей. Если пользователи кликают на результаты, найденные благодаря игнорированию слова, правило считается успешным. Если пропускают (skip) такие результаты, правило может быть удалено.

Описание

Какую проблему решает

Патент решает проблему оценки качества и эффективности опционализационных правил (Optionalization Rules). Эти правила используются поисковой системой для модификации исходного запроса путем пометки определенных терминов как необязательных (optional). Цель изобретения — создать автоматизированный механизм обратной связи на основе поведения пользователей, чтобы отличать полезные правила (улучшающие релевантность выдачи) от вредных (приводящих к появлению нерелевантных результатов) и удалять последние.

Что запатентовано

Запатентована система для оценки правил опционализации терминов запроса с использованием агрегированных данных о поведении пользователей (clicks и skips) из логов запросов. Система анализирует, выбирают ли пользователи (click) или пропускают (skip) результаты, которые были найдены благодаря применению конкретного правила. На основе этих данных для каждого правила рассчитывается оценка (Score), которая определяет его дальнейшее использование в поиске.

Как это работает

Система работает путем анализа исторических данных (Query Log Data):

  • Применение правила: Система идентифицирует случаи, когда исходный запрос был переписан с использованием правила опционализации (например, [Atlanta Extreme (Optional) Bungee Jump]).
  • Анализ кликов (Click Evaluation): Если пользователь кликнул на результат, найденный по переписанному запросу, и этот результат НЕ содержит опционализированного термина (например, НЕ содержит "Extreme"), это засчитывается как положительный сигнал (Click Count увеличивается). Это означает, что игнорирование термина было полезным.
  • Анализ пропусков (Skip Evaluation): Если результат, найденный по переписанному запросу (и не содержащий опционализированного термина), был показан выше, чем результат, на который в итоге кликнул пользователь (т.е. был пропущен), это засчитывается как отрицательный сигнал (Skip Count увеличивается).
  • Расчет оценки и действие: Вычисляется Score на основе соотношения кликов и пропусков. Если оценка ниже порогового значения, правило удаляется из системы.

Актуальность для SEO

Высокая. Понимание запросов и определение намерений пользователя (интента) являются ключевыми задачами современных поисковых систем. Использование поведенческих сигналов (кликов и пропусков) в качестве обратной связи для обучения и валидации алгоритмов переписывания запросов остается стандартной практикой. Этот патент описывает конкретный механизм такой валидации.

Важность для SEO

Патент имеет значительное влияние на SEO (7.5/10). Он демонстрирует, как Google использует данные о поведении пользователей для тонкой настройки понимания того, какие слова в запросе являются существенными, а какие — нет. Это подчеркивает стратегическую важность удовлетворения основного интента запроса и оптимизации под вовлеченность (высокий CTR, низкий показатель пропусков/skips). Страницы, удовлетворяющие интент, могут ранжироваться, даже если не содержат всех слов из запроса, при условии, что пользователи подтверждают эту релевантность своими кликами.

Детальный разбор

Термины и определения

Click Evaluation (Оценка по кликам) / Click Count
Метрика положительной оценки правила. Увеличивается, когда пользователь выбирает результат, найденный благодаря применению правила опционализации (т.е. результат не содержит опционализированного термина).
Optionalization Rule (Правило опционализации)
Правило, определяющее, что конкретный термин в запросе может быть помечен как необязательный (optional). Может быть общим или зависеть от контекста (Query Context).
Query Context (Контекст запроса)
Условия, при которых применяется правило. Например, правило может применяться только если в запросе присутствуют другие определенные термины.
Query Log Data (Данные журнала запросов)
Исторические данные, включающие исходные запросы, переписанные запросы, показанные результаты, их ранжирование и выбор пользователя.
Query Term Optionalization (Опционализация термина запроса)
Процесс пометки термина в запросе как необязательного для поиска.
Revised Search Query (Переписанный поисковый запрос)
Модифицированная версия исходного запроса, в которой один или несколько терминов помечены как необязательные согласно правилам опционализации.
Skip Evaluation (Оценка по пропускам) / Skip Count
Метрика отрицательной оценки правила. Увеличивается, когда пользователь пропускает результат, найденный благодаря применению правила опционализации (т.е. результат не содержит опционализированного термина), и выбирает результат, ранжированный ниже.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной механизм оценки правила на основе кликов (Click Evaluation).

  1. Система получает доступ к правилам опционализации для конкретного термина.
  2. Система анализирует Query Log Data, который содержит: исходный запрос, переписанный запрос (созданный с помощью правила), результаты поиска и выбор пользователя.
  3. Определяется, что выбранный пользователем результат был идентифицирован с помощью переписанного запроса.
  4. В ответ на это, счетчик кликов (Click Count) для данного правила корректируется (увеличивается).
  5. На основе этого счетчика система определяет, использовать ли это правило для будущих запросов.

Claim 9 (Зависимый от 1): Критически важное уточнение условия для засчитывания клика.

Клик засчитывается только при условии, что выбранный результат (или документ по ссылке) НЕ содержит того термина, который был опционализирован правилом. Это доказывает, что именно применение правила позволило найти этот релевантный результат.

Claim 2 (Зависимый от 1): Вводит механизм оценки на основе пропусков (Skip Evaluation).

  1. Система ранжирует результаты.
  2. Определяется, что результат, ранжированный ВЫШЕ, чем выбранный пользователем результат, был идентифицирован с помощью переписанного запроса.
  3. В ответ на это, счетчик пропусков (Skip Count) для данного правила корректируется (увеличивается).

Claim 5 и 6 (Зависимые): Описывают расчет оценки (Score).

Оценка правила основывается на Click Count и Skip Count. Конкретно, оценка базируется на соотношении (i) кликов к (ii) сумме кликов и пропусков.

Claim 4 (Зависимый): Определяет формулу расчета оценки с учетом весовых коэффициентов (W1 для кликов, W2 для пропусков).

Формула расчета оценки:

W1(ClickCount)W1(ClickCount)+W2(SkipCount)\frac{W1(Click Count)}{W1(Click Count) + W2(Skip Count)}

Claim 7 (Зависимый): Описывает действие по результатам оценки.

Если рассчитанная оценка правила не удовлетворяет пороговому значению (Threshold), правило удаляется из набора правил, используемых для генерации переписанных запросов.

Где и как применяется

Изобретение представляет собой систему валидации и обратной связи, которая используется для улучшения этапа понимания запросов.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента. Query Reviser Engine использует набор активных Optionalization Rules для генерации Revised Search Queries в реальном времени. Описанный в патенте механизм оценки (Evaluation) работает офлайн и отвечает за поддержку качества этого набора правил, удаляя неэффективные.

RANKING – Ранжирование
Search Engine использует как исходный запрос, так и Revised Search Queries для поиска и ранжирования результатов в индексе.

RERANKING / METASEARCH (Косвенно)
Результаты, полученные по разным версиям запроса, объединяются и ранжируются для показа пользователю. Именно взаимодействие пользователя (клики и пропуски) с этой финальной выдачей (SERP) собирается в Query Log Data и служит входными данными для механизма оценки.

Входные данные:

  • Набор существующих Optionalization Rules.
  • Query Log Data, включающий: исходные запросы, примененные правила, сгенерированные переписанные запросы, показанные результаты, ранг каждого результата, идентификатор выбранного пользователем результата.
  • Контент результатов поиска (или индексированных документов) для проверки наличия/отсутствия опционализированных терминов.

Выходные данные:

  • Обновленные метрики для правил: Click Count, Skip Count.
  • Рассчитанные оценки (Scores) для правил.
  • Очищенный набор Optionalization Rules (правила с низкой оценкой удалены).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на многословные запросы (long-tail) и запросы с модификаторами (прилагательными, уточнениями), где не всегда очевидно, какие термины являются критически важными для интента, а какие можно игнорировать.
  • Типы контента: Влияет на все типы контента, так как механизм работает на уровне интерпретации запроса.

Когда применяется

  • Применение правил: Происходит в реальном времени при обработке поискового запроса, если для терминов запроса существуют активные Optionalization Rules (с оценкой выше порога).
  • Оценка правил (Evaluation): Происходит офлайн путем периодической обработки накопленных Query Log Data.
  • Условия срабатывания оценки: Для засчитывания клика или пропуска необходимо выполнение строгих условий: результат должен быть найден благодаря правилу, и опционализированный термин должен отсутствовать в результате/документе (согласно Claim 9 и описанию).

Пошаговый алгоритм

Процесс оценки правил опционализации (Офлайн-процесс).

  1. Доступ к правилам: Система идентифицирует правила опционализации, подлежащие оценке.
  2. Доступ к логам запросов: Извлекаются исторические данные (Query Log Data) о сессиях, где применялись эти правила. Для каждой сессии известно: исходный запрос, переписанный запрос, показанная выдача, ранжирование и выбор пользователя.
  3. Анализ кликов (Click Evaluation):
    1. Система определяет, был ли выбранный пользователем результат найден с помощью переписанного запроса.
    2. Система проверяет контент выбранного результата (или документа), чтобы убедиться, что опционализированный термин в нем ОТСУТСТВУЕТ (согласно Claim 9).
    3. Если оба условия выполнены, Click Count для правила увеличивается.
  4. Анализ пропусков (Skip Evaluation):
    1. Система анализирует результаты, которые были ранжированы ВЫШЕ, чем выбранный пользователем результат.
    2. Для каждого такого результата проверяется, был ли он найден с помощью переписанного запроса И отсутствует ли в нем опционализированный термин.
    3. Если условия выполнены (т.е. результат был сгенерирован правилом и пропущен пользователем), Skip Count для правила увеличивается.
  5. Расчет оценки (Score Calculation): Для каждого правила вычисляется оценка на основе агрегированных Click Count и Skip Count с использованием весовых коэффициентов W1 и W2 по формуле: (W1*Clicks) / (W1*Clicks + W2*Skips).
  6. Применение порога и корректировка правил: Рассчитанная оценка сравнивается с пороговым значением (Threshold). Если оценка ниже порога, правило деактивируется или удаляется из системы.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Являются основными данными для этого патента. Используются данные из Query Log Data: клики (user selections) и пропуски (skips, определяемые как невыбор более высоко ранжированного результата).
  • Контентные факторы: Система должна анализировать содержание поискового результата или индексированного документа. Это необходимо для верификации того, присутствует ли в нем термин, который был опционализирован правилом (согласно Claim 9).

Какие метрики используются и как они считаются

  • Click Count: Счетчик положительных исходов применения правила.
  • Skip Count: Счетчик отрицательных исходов применения правила.
  • Weights (W1, W2): Весовые коэффициенты, определяющие значимость кликов и пропусков. В патенте упоминается возможность использования разных весов (например, клик может быть важнее пропуска или наоборот).
  • Score (Оценка): Вычисляемая метрика эффективности правила. Рассчитывается как взвешенное соотношение кликов к общему числу взаимодействий (клики + пропуски).
  • Threshold (Порог): Минимальное значение Score, необходимое для того, чтобы правило осталось активным в системе.

Выводы

  1. Обратная связь для понимания запросов: Патент описывает механизм самообучения и валидации для компонента Query Understanding. Google не просто создает правила интерпретации запросов, но и постоянно проверяет их эффективность на реальных данных о поведении пользователей.
  2. Строгое определение Clicks и Skips: Ключевым моментом (Claim 9) является то, что клик или пропуск засчитываются для правила только тогда, когда опционализированный термин отсутствует в результате. Это позволяет точно измерить влияние именно этого правила, изолируя его от других факторов ранжирования.
  3. Автоматическое удаление плохих правил: Система спроектирована так, чтобы автоматически избавляться от правил опционализации, которые приводят к появлению нерелевантных результатов в топе выдачи (что подтверждается высоким Skip Count).
  4. Приоритет интента над лексическим соответствием: Механизм подтверждает философию Google, согласно которой точное совпадение ключевых слов не всегда необходимо. Если пользователи своими кликами подтверждают, что результат релевантен даже без некоторых слов из запроса, система учится игнорировать эти слова в будущем.
  5. Контекстная зависимость: Правила могут быть контекстно-зависимыми, и их оценка также происходит в рамках этого контекста. Слово может быть необязательным в одном контексте, но критически важным в другом.

Практика

Best practices (это мы делаем)

  • Фокус на удовлетворении основного интента (Core Intent): Убедитесь, что страница полностью отвечает на основное намерение пользователя, стоящее за запросом. Если ваш контент удовлетворяет интент лучше конкурентов, система может предпочесть его, даже если он не содержит всех модификаторов или второстепенных слов из запроса, при условии, что Google научится (через этот механизм) считать эти слова опциональными.
  • Оптимизация под вовлеченность (Engagement): Работайте над повышением CTR и снижением показателей отказов/пропусков (pogo-sticking). Положительные поведенческие сигналы служат для Google подтверждением того, что их интерпретация запроса (включая любые примененные опционализации, которые привели к показу вашей страницы) была верной.
  • Создание комплексного контента: Разрабатывайте контент, который охватывает тему широко. Это повышает вероятность того, что страница будет релевантна как для точного запроса, так и для его опционализированных версий.

Worst practices (это делать не надо)

  • Исключительный фокус на точном соответствии ключевых слов (Exact Match): Стратегии, основанные только на лексическом соответствии длинным запросам без учета основного интента, рискованны. Если Google решит, что часть запроса опциональна, такие страницы могут проиграть более общим, но более релевантным по интенту результатам.
  • Использование вводящих в заблуждение сниппетов (Clickbait): Создание заголовков и описаний, которые привлекают клик, но не соответствуют содержанию страницы, приведет к быстрому возврату пользователя в выдачу (pogo-sticking/skip). Этот патент показывает, как такие пропуски используются для оценки качества интерпретации запроса.
  • Создание тонкого контента под узкие запросы: Создание множества страниц под каждую вариацию запроса может быть неэффективным, если система объединит эти вариации через опционализацию терминов.

Стратегическое значение

Патент подтверждает критическую важность поведенческих факторов в современных поисковых системах, но не как прямого фактора ранжирования, а как механизма обратной связи для обучения и валидации алгоритмов Query Understanding. Стратегически, это означает, что SEO должно быть направлено на глубокое понимание и удовлетворение намерений пользователя. Google стремится найти лучший ответ, и если пользователи сигнализируют, что определенные слова в запросе не важны для нахождения этого ответа, Google научится их игнорировать.

Практические примеры

Сценарий: Оценка правила опционализации для коммерческого запроса

  1. Исходный запрос: "Красные кожаные туфли на высоком каблуке купить онлайн".
  2. Правило (Тестируется): Опционализировать "онлайн" в контексте "купить". Переписанный запрос: "Красные кожаные туфли на высоком каблуке купить (онлайн: optional)".
  3. Результат А (Топ-1): Страница крупного интернет-магазина. Найдена по переписанному запросу. Термин "онлайн" на странице отсутствует.
  4. Результат Б (Топ-5): Страница агрегатора локальных магазинов.
  5. Поведение пользователя 1 (Click): Пользователь кликает на Результат А. Система увеличивает Click Count для правила, так как опционализация была полезна (термин "онлайн" отсутствовал в результате А).
  6. Поведение пользователя 2 (Skip): Пользователь пролистывает Результат А и кликает на Результат Б. Система увеличивает Skip Count для правила, так как Результат А был пропущен (и термин "онлайн" в нем отсутствовал).
  7. Итог: Если большинство пользователей ведут себя как Пользователь 1, правило останется в системе. Если как Пользователь 2, правило будет удалено, и Google будет считать термин "онлайн" более важным в этом контексте.

Вопросы и ответы

Что такое "правило опционализации" (Optionalization Rule) в контексте этого патента?

Это инструкция для поисковой системы, которая позволяет считать определенное слово в запросе необязательным (optional) при поиске результатов. Например, правило может указывать, что слово "рецепт" в запросе "быстрый рецепт пасты" можно игнорировать. Правила могут быть общими или применяться только в определенном контексте (например, игнорировать слово А, только если присутствует слово Б).

Как именно система засчитывает "клик" (Click Count) для правила?

Клик засчитывается при выполнении трех условий: 1) Пользователь ввел запрос; 2) Система применила правило опционализации и сгенерировала переписанный запрос; 3) Пользователь выбрал результат, который был найден благодаря этому правилу, и этот результат НЕ СОДЕРЖИТ опционализированного термина (Claim 9). Последнее условие критически важно, так как оно доказывает полезность игнорирования этого термина.

Как система засчитывает "пропуск" (Skip Count)?

Пропуск засчитывается, если результат, найденный благодаря правилу опционализации (и не содержащий опционализированного термина), был показан в выдаче ВЫШЕ, чем тот результат, на который в итоге кликнул пользователь. Это сигнализирует о том, что применение правила привело к завышению позиции менее релевантного результата, и, следовательно, правило сработало плохо.

Что происходит с правилами, которые получают много пропусков?

Система рассчитывает оценку (Score) для каждого правила на основе соотношения кликов и пропусков. Если оценка падает ниже определенного порогового значения (Threshold), что происходит при высоком количестве пропусков относительно кликов, правило автоматически удаляется из системы. В дальнейшем оно не будет использоваться для переписывания запросов.

Подтверждает ли этот патент, что CTR и поведенческие факторы являются факторами ранжирования?

Патент подтверждает, что Google активно использует поведенческие данные (клики и пропуски), но не как прямой фактор ранжирования конкретных URL. Вместо этого они используются как механизм обратной связи для оценки и обучения алгоритмов понимания запросов (Query Understanding). Хорошее поведение пользователей валидирует интерпретацию запроса Google, а плохое — приводит к её корректировке.

Как этот механизм влияет на SEO-стратегию по работе с ключевыми словами?

Он снижает зависимость от точного лексического соответствия (exact match) и повышает важность удовлетворения основного намерения пользователя (Core Intent). Не нужно стремиться использовать абсолютно все слова из потенциального запроса на странице. Важнее убедиться, что страница является лучшим ответом на интент, даже если некоторые второстепенные слова из запроса будут проигнорированы системой.

Может ли этот механизм помочь моей странице ранжироваться по запросам, которые я не таргетировал?

Да. Если ваша страница хорошо отвечает на запрос "А Б", а пользователь ищет "А Б В", система может протестировать правило опционализации для термина "В". Если ваша страница будет показана и пользователи будут на нее кликать (подтверждая релевантность), вы сможете стабильно ранжироваться по запросу "А Б В", даже не имея термина "В" на странице.

Использует ли система весовые коэффициенты при оценке правил?

Да, патент явно описывает использование весовых коэффициентов W1 для кликов и W2 для пропусков. Это позволяет системе гибко настраивать чувствительность оценки, например, делая пропуски более значимыми, чем клики (если W2 > W1), чтобы быстрее избавляться от потенциально плохих правил.

Происходит ли оценка правил в реальном времени?

Нет. Применение правил происходит в реальном времени при обработке запроса. Однако оценка правил (расчет Click Count, Skip Count и Score) происходит офлайн путем анализа накопленных данных журнала запросов (Query Log Data). Это позволяет оценить правила на большом объеме данных без замедления работы поиска.

Что означает контекстная зависимость правил опционализации?

Это означает, что правило применяется не всегда, когда встречается определенный термин, а только в окружении других конкретных слов. Например, система может научиться игнорировать слово "лучший" в контексте "отзывы", но считать его важным в контексте "фильмы года". Оценка эффективности правила также происходит с учетом этого контекста.

Похожие патенты

Как Google использует клики и пропуски (Clicks/Skips) для определения важности порядка слов в запросе
Google анализирует поведение пользователей для оценки правил, которые меняют порядок слов в запросе (Reordering Rules). Если пользователи кликают на результаты с измененным порядком слов, правило считается полезным (Click Count). Если пропускают такие результаты ради нижестоящих (Skip Count), правило отключается. Это позволяет системе автоматически понять, когда порядок слов критичен для смысла запроса, а когда им можно пренебречь.
  • US8959103B1
  • 2015-02-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует «Решающие Клики» и «Решающие Пропуски» для валидации и очистки правил синонимов
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
  • US8965882B1
  • 2015-02-24
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
  • US20140372873A1
  • 2014-12-18
  • Структура сайта

  • Техническое SEO

  • Ссылки

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google персонализирует подсказки Autocomplete, анализируя запросы похожих пользователей и обновляя локальный кэш устройства
Google персонализирует подсказки Autocomplete (Search Suggest), анализируя поведение пользователей со схожими профилями (местоположение, интересы, история поиска). Система генерирует кастомизированное обновление для локального кэша устройства на основе запросов, введенных этими похожими пользователями. Это означает, что разные пользователи видят разные подсказки для одного и того же ввода.
  • US8868592B1
  • 2014-10-21
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.
  • US7536408B2
  • 2009-05-19
  • Индексация

  • Семантика и интент

  • Ссылки

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

seohardcore