SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует клики и пропуски (Clicks/Skips) для определения важности порядка слов в запросе

CLICK OR SKIP EVALUATION OF REORDERING RULES (Оценка правил переупорядочивания на основе кликов или пропусков)
  • US8959103B1
  • Google LLC
  • 2012-05-25
  • 2015-02-17
  • Поведенческие сигналы
  • Семантика и интент
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поведение пользователей для оценки правил, которые меняют порядок слов в запросе (Reordering Rules). Если пользователи кликают на результаты с измененным порядком слов, правило считается полезным (Click Count). Если пропускают такие результаты ради нижестоящих (Skip Count), правило отключается. Это позволяет системе автоматически понять, когда порядок слов критичен для смысла запроса, а когда им можно пренебречь.

Описание

Какую проблему решает

Патент решает проблему автоматической оценки качества и эффективности правил переупорядочивания терминов запроса (Query Term Reordering Rules). Поисковая система использует эти правила, чтобы определить, когда изменение порядка слов допустимо для улучшения результатов (либо путем переписывания запроса, либо путем изменения скоринга документов). Изобретение предоставляет механизм обратной связи для валидации этих правил, позволяя автоматически отсеивать те, которые приводят к показу нерелевантных результатов и ухудшают пользовательский опыт.

Что запатентовано

Запатентован метод автоматической оценки Reordering Rules на основе анализа поведенческих данных из логов запросов (Query Log Data). Эффективность правила определяется путем подсчета положительных сигналов, когда пользователь выбирает результат с измененным порядком слов (Click Count), и отрицательных сигналов, когда пользователь пропускает такой результат (Skip Count). На основе взвешенной оценки принимается решение о дальнейшем использовании правила.

Как это работает

Система анализирует логи поисковых сессий:

  • Click Evaluation: Если пользователь ввел запрос "A B" и кликнул на результат, содержащий "B A", счетчик Click Count для правила перестановки A и B увеличивается.
  • Skip Evaluation: Если результат, содержащий "B A", был ранжирован высоко, но пользователь пропустил его и кликнул на результат ниже, счетчик Skip Count для этого правила увеличивается.
  • Scoring: Рассчитывается оценка (Score) правила на основе взвешенного соотношения кликов и пропусков.
  • Action: Если оценка правила падает ниже порогового значения, правило удаляется из набора, используемого для пересмотра запросов или скоринга документов.

Актуальность для SEO

Высокая. Валидация алгоритмов понимания запросов (Query Understanding) с помощью агрегированных поведенческих данных является фундаментальной практикой в машинном обучении поисковых систем. Хотя современные NLP-модели (например, на базе трансформеров) имплицитно учитывают порядок слов, механизмы обратной связи, описанные в патенте, остаются актуальными для тонкой настройки и валидации того, как система интерпретирует интент пользователя.

Важность для SEO

Влияние на SEO значительное (7/10). Патент демонстрирует механизм, с помощью которого Google динамически определяет, является ли порядок слов критически важным для конкретного запроса или контекста. Это напрямую влияет на стратегии оптимизации под многословные запросы и фразовое соответствие. Он подтверждает, что конечным арбитром лингвистической релевантности является совокупное поведение пользователей (клики и пропуски).

Детальный разбор

Термины и определения

Click Count (Счетчик кликов)
Метрика для оценки Reordering Rule. Увеличивается, когда пользователь выбирает результат поиска, содержащий термины запроса в порядке, отличном от исходного.
Click Evaluation (Оценка по кликам)
Процесс оценки правила, основанный на анализе выбранных пользователем результатов, которые содержат переупорядоченные термины.
Query Context (Контекст запроса)
Условия, при которых применяется правило переупорядочивания. Например, наличие или отсутствие определенных терминов в запросе (как показано в примере с "Pants").
Query Log Data (Данные журнала запросов)
Анонимизированные данные о поисковых сессиях, включающие исходный запрос, показанные результаты, их ранжирование и действия пользователя (выбор результата).
Query Term Reordering Rule (Правило переупорядочивания терминов запроса)
Общий термин для правил, определяющих допустимость изменения порядка слов. Включает Query Term Revision Rule и Query Term Scoring Rule.
Query Term Revision Rule (Правило пересмотра запроса)
Тип правила, используемый для активного переписывания исходного запроса путем изменения порядка терминов перед выполнением поиска.
Query Term Scoring Rule (Правило оценки терминов запроса)
Тип правила, используемый на этапе ранжирования для определения веса (скоринга) документов, в которых термины встречаются в порядке, отличном от порядка в запросе.
Skip Count (Счетчик пропусков)
Метрика для оценки Reordering Rule. Увеличивается, когда результат, содержащий переупорядоченные термины, был ранжирован выше, чем результат, который в итоге выбрал пользователь (т.е. был пропущен).
Skip Evaluation (Оценка по пропускам)
Процесс оценки правила, основанный на анализе пропущенных пользователем результатов, которые содержат переупорядоченные термины.

Ключевые утверждения (Анализ Claims)

Патент содержит два основных независимых пункта, описывающих методы оценки по кликам (Claim 1) и по пропускам (Claim 10).

Claim 1 (Независимый пункт) – Click Evaluation:

  1. Система получает доступ к Query Log Data, содержащим исходный запрос (с определенным порядком терминов), результаты и выбор пользователя.
  2. Определяется, что выбранный пользователем результат содержит эти же термины, но в ином порядке.
  3. В ответ на это, система корректирует (увеличивает) Click Count для соответствующего Query Term Reordering Rule.
  4. На основе скорректированного Click Count принимается решение о дальнейшем использовании этого правила для пересмотра запросов.

Claim 10 (Независимый пункт) – Skip Evaluation:

  1. Система получает доступ к Query Log Data, включающим ранжирование результатов.
  2. Определяется, что результат, ранжированный выше, чем выбранный пользователем (т.е. пропущенный результат), содержит термины запроса в ином порядке.
  3. В ответ на это, система корректирует (увеличивает) Skip Count для соответствующего Query Term Reordering Rule.
  4. На основе скорректированных данных принимается решение о дальнейшем использовании этого правила.

Зависимые пункты (Claims 2-6, 11-15): Детализируют механизм расчета оценки (Score).

  • (Claims 2, 11): Оценка правила рассчитывается на основе как Click Count, так и Skip Count.
  • (Claims 5, 14): К кликам и пропускам применяются весовые коэффициенты (W1 и W2).
  • (Claims 6, 15): Определяется формула для расчета взвешенной оценки:

W1(Click Count)W1(Click Count)+W2(Skip Count)\frac{W1(\text{Click Count})}{W1(\text{Click Count}) + W2(\text{Skip Count})}

Зависимые пункты (Claims 4, 13): Описывают применение оценки.

  • Если оценка (Score) не достигает порогового значения (Threshold), правило удаляется из набора правил, используемых для генерации пересмотренных запросов.

Зависимые пункты (Claims 7-8, 16-17): Уточняют типы правил.

  • Оцениваемое правило может быть как Query Term Revision Rule (Claim 7), так и Query Term Scoring Rule (Claim 8).

Где и как применяется

Патент описывает систему оценки, которая функционирует преимущественно офлайн, но результаты её работы напрямую влияют на этапы обработки запросов в реальном времени.

QUNDERSTANDING – Понимание Запросов
На этом этапе применяются валидированные Query Term Revision Rules. Компонент пересмотра запросов (например, Query Reviser Engine) использует эти правила для генерации альтернативных версий запроса с измененным порядком слов. Описанный в патенте механизм обеспечивает качество этого процесса, отфильтровывая неэффективные правила.

RANKING – Ранжирование
На этом этапе могут применяться валидированные Query Term Scoring Rules. При оценке релевантности документа система может присвоить высокий вес документу, даже если порядок слов в нем отличается от запроса, при условии, что соответствующее правило имеет высокую оценку (Score).

Офлайн-анализ и валидация (Основное применение)
Сам механизм оценки работает вне основного потока обработки запросов. Он периодически обрабатывает Query Log Data для обновления метрик и оценок Reordering Rules.

Входные данные:

  • Query Log Data (исходные запросы, показанные результаты, ранжирование, данные о кликах пользователей).

Выходные данные:

  • Обновленные метрики: Click Count, Skip Count и итоговый Score для правил.
  • Решение об удалении или демотировании (снижении частоты использования) правил с низкой оценкой.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на многословные запросы, где порядок слов неоднозначен или некритичен. Примеры из патента включают запросы с размерами ("pants 30 34").
  • Контекстная зависимость: Система оценивает правила в конкретных контекстах (Query Contexts). Правило может быть эффективным в одном контексте и неэффективным в другом (например, перестановка чисел может быть полезна для размеров одежды, но вредна для телефонных номеров, как показано в примере с "555-123-4567").

Когда применяется

  • Временные рамки: Анализ логов проводится периодически (офлайн) на основе накопленных данных за определенный период.
  • Триггеры активации: Анализ запускается для тех сессий в логах, где в результатах поиска присутствовали ресурсы, содержащие переупорядоченные термины запроса.
  • Пороговые значения: Система использует порог (Threshold) для оценки качества правила. Если Score ниже порога (в патенте упоминаются примеры 0.6, 0.75, 0.9, 0.99), правило считается неэффективным.

Пошаговый алгоритм

Процесс анализа логов и оценки правил (Offline):

  1. Сбор данных: Накопление Query Log Data из поисковых сессий.
  2. Идентификация сессии: Выбор сессии для анализа, включающей исходный запрос, ранжированный список результатов и зафиксированный клик пользователя.
  3. Анализ выбранного результата (Click Evaluation):
    1. Определение, содержит ли выбранный результат термины запроса в порядке, отличном от исходного.
    2. Если ДА: Идентификация соответствующего Reordering Rule и инкремент его Click Count.
  4. Анализ пропущенных результатов (Skip Evaluation):
    1. Идентификация результатов, ранжированных выше, чем выбранный результат (пропущенные).
    2. Определение, содержат ли эти пропущенные результаты термины запроса в порядке, отличном от исходного.
    3. Если ДА: Идентификация соответствующего Reordering Rule и инкремент его Skip Count.
  5. Агрегация метрик: Периодическое суммирование Click Count и Skip Count для каждого правила по всем проанализированным сессиям.
  6. Расчет оценки (Scoring): Вычисление взвешенной оценки (Score) для правила по формуле с использованием весов W1 и W2 (см. Анализ Claims).
  7. Применение результатов (Rule Management): Сравнение Score с пороговым значением (Threshold). Если Score ниже порога, правило удаляется или деактивируется.

Какие данные и как использует

Данные на входе

Патент полностью сфокусирован на использовании поведенческих факторов для оценки внутренних правил системы.

  • Поведенческие факторы (Ключевые): Ядро изобретения. Используются Query Log Data, фиксирующие:
    • Выбор пользователя (Click).
    • Пропуски (Skip) — неявный сигнал, получаемый путем анализа ранжирования выбранного результата относительно невыбранных вышестоящих.
    • Ранжирование результатов на SERP.
  • Контентные факторы: Содержимое результатов поиска или индексированных документов анализируется для определения наличия терминов запроса и порядка их следования.

Какие метрики используются и как они считаются

  • Click Count: Счетчик положительных взаимодействий с переупорядоченными результатами.
  • Skip Count: Счетчик отрицательных взаимодействий (пропусков) переупорядоченных результатов.
  • Весовые коэффициенты (W1, W2): Эмпирически определяемые значения для взвешивания кликов и пропусков. В патенте упоминается, что веса могут быть разными.
  • Score (Оценка правила): Основная метрика качества. Рассчитывается как взвешенное соотношение кликов к сумме кликов и пропусков по формуле: W1(Click Count)W1(Click Count)+W2(Skip Count)\frac{W1(\text{Click Count})}{W1(\text{Click Count}) + W2(\text{Skip Count})}.
  • Threshold (Порог): Заданное значение, которое Score должен превысить, чтобы правило считалось качественным.
  • Both Click: В описании патента (не в Claims) упоминается особый случай, когда выбранный документ содержит как исходный, так и измененный порядок слов. Таким кликам может присваиваться меньший вес.

Выводы

  1. Важность порядка слов определяется поведением пользователей: Google не полагается только на лингвистические модели для определения значимости порядка слов. Система активно использует реальные поведенческие данные (Clicks и Skips) для валидации или опровержения предположений о взаимозаменяемости терминов.
  2. Автоматизированная самокоррекция системы: Патент описывает механизм обратной связи, позволяющий системе автоматически определять, когда изменение порядка слов полезно (преобладают клики), а когда вредно (преобладают пропуски), и соответственно корректировать набор активных Reordering Rules.
  3. Контекстная зависимость правил: Эффективность правила оценивается не глобально, а в рамках конкретного контекста (Query Context). Правило, работающее в одном контексте, может быть отключено в другом, если данные показывают его неэффективность.
  4. Два применения Reordering Rules: Валидированные правила могут использоваться как для активного переписывания запроса (Query Revision Rule), так и для корректировки весов при ранжировании документов с иным порядком слов (Query Scoring Rule).
  5. Взвешенная оценка: Использование весовых коэффициентов (W1, W2) позволяет Google тонко настраивать процесс оценки, например, делая систему более чувствительной к негативному опыту (пропускам), чем к позитивному (кликам).

Практика

Best practices (это мы делаем)

  • Использование естественного порядка слов и синонимичных конструкций: Используйте порядок слов, который является общепринятым и ожидаемым в вашей тематике. Если в нише допустимы вариации, используйте их естественно в контенте. Это повышает вероятность соответствия как исходному, так и пересмотренному запросу, который система сочтет полезным (High Click Count).
  • Фокус на релевантности и CTR сниппета: Поскольку поведение пользователей напрямую валидирует правила интерпретации запросов, критически важно оптимизировать Title и Description для максимальной ясности и привлекательности. Ваш сниппет должен четко отвечать на интент, чтобы минимизировать вероятность пропуска (Skip).
  • Анализ доминирующих паттернов в SERP: Изучайте выдачу. Если Google ранжирует результаты с разным порядком слов одинаково высоко, это указывает на то, что система применяет Reordering Rule с высокой оценкой. В этом случае можно не фокусироваться на точном порядке ключевых слов.

Worst practices (это делать не надо)

  • Неестественный порядок слов (Keyword Stuffing): Попытки манипулировать текстом, используя неестественный порядок слов для точного соответствия запросу, если это снижает читабельность и релевантность. Если такой результат будет пропущен пользователями (высокий Skip Count), это сигнализирует о низкой релевантности такого подхода.
  • Игнорирование порядка слов в критичных тематиках: В тематиках, где порядок слов определяет смысл (например, инструкции, сравнения "A vs B", направления перелетов), нельзя полагаться на то, что Google "поймет". Необходимо строго соблюдать правильный порядок, так как система, скорее всего, отключит правила переупорядочивания для этих контекстов на основе негативных сигналов.
  • Создание страниц под пермутации (Keyword Permutation Spam): Создание множества страниц под все возможные перестановки ключевых слов. Google стремится понять смысл через валидированные правила, а не найти точное совпадение порядка.

Стратегическое значение

Патент подтверждает стратегию Google по использованию массовых поведенческих данных для обучения и валидации систем понимания естественного языка (NLU). Для SEO это означает, что техническое соответствие ключевым словам уступает место семантической релевантности, подтвержденной поведением пользователей. Долгосрочная стратегия должна фокусироваться на удовлетворении интента с использованием естественного языка, что приводит к высокому CTR и низкому показателю пропусков.

Практические примеры

Сценарий 1: Гибкий порядок слов (E-commerce, пример из патента)

  1. Запрос: "pants 30 34" (штаны размер 30 34).
  2. Действие Google: Система тестирует Reordering Rule и показывает также результаты для "pants 34 30" или "30 34 pants". Пользователи активно кликают на варианты с перестановкой.
  3. Результат: Click Count высокий, Skip Count низкий. Правило "Swap Numbers in Context with 'Pants'" валидируется.
  4. Действие SEO: Можно оптимизировать заголовок под любой из этих вариантов, выбирая наиболее конверсионный.

Сценарий 2: Критичный порядок слов (Пример из патента)

  1. Запрос: "555-123-4567".
  2. Действие Google: Система тестирует общее правило "Swap Numbers", показывая результаты для "123-555-4567". Пользователи пропускают эти результаты (Skip) и кликают на результаты с исходным порядком.
  3. Результат: Skip Count высокий. Оценка правила падает. Система может создать новое правило "Preserve Numbers Separated By Dashes" или сузить контекст для правила "Swap Numbers", чтобы исключить телефонные номера.
  4. Действие SEO: Для структурированных данных (номера, коды) необходимо строго соблюдать стандартный формат.

Вопросы и ответы

Означает ли этот патент, что порядок слов в запросе не имеет значения?

Нет, это не так. Патент описывает механизм, с помощью которого Google точно определяет, когда порядок слов имеет значение, а когда им можно пренебречь. Система учится на поведении пользователей: если изменение порядка слов приводит к пропускам результатов (Skips), Google понимает, что порядок важен для этого контекста, и отключает соответствующее правило переупорядочивания.

Что такое Query Term Reordering Rule?

Это внутренняя инструкция поисковой системы, которая предполагает, что изменение порядка слов не меняет интент. Она может использоваться двояко: для изменения самого запроса пользователя (Query Term Revision Rule) или для оценки документов, где слова идут в другом порядке (Query Term Scoring Rule).

Как рассчитывается оценка качества правила?

Используется взвешенная формула: W1⋅ClicksW1⋅Clicks+W2⋅Skips\frac{W1 \cdot \text{Clicks}}{W1 \cdot \text{Clicks} + W2 \cdot \text{Skips}}. W1 и W2 — это весовые коэффициенты. Это позволяет настроить, насколько сильно клики и пропуски влияют на итоговую оценку. Если оценка падает ниже порога, правило удаляется.

Что важнее для Google: клики или пропуски?

Оба важны, но их относительная важность определяется весовыми коэффициентами (W1 и W2). Это позволяет Google настраивать чувствительность. Например, если W2 выше W1, то пропуски (негативный опыт пользователя) считаются более значимыми при оценке правила, делая систему более консервативной.

Как я могу повлиять на этот механизм как SEO-специалист?

Напрямую повлиять на правила нельзя, но можно повлиять на данные, которые система использует для обучения. Оптимизируйте свои сниппеты (Title и Description) для максимальной релевантности и высокого CTR, используя естественный язык и общепринятый порядок слов. Чем выше CTR вашего релевантного результата, тем сильнее сигнал для Google.

Что такое "Skip" (пропуск) в контексте этого патента?

Пропуск фиксируется, когда результат поиска, содержащий переупорядоченные термины, был показан в выдаче, но пользователь не кликнул на него, а выбрал результат, расположенный ниже. Это сильный негативный сигнал для Reordering Rule, которое привело к показу пропущенного результата.

Происходит ли эта оценка в реальном времени?

Нет. Анализ Query Log Data, подсчет кликов/пропусков и расчет оценок выполняются как периодический офлайн-процесс. Результаты этой оценки — обновленный набор валидированных правил — затем используются в реальном времени при обработке запросов пользователей.

Как этот патент связан с современными алгоритмами типа BERT или MUM?

Современные NLP-модели лучше понимают контекст и значимость порядка слов. Однако описанный в патенте механизм является системой валидации более высокого уровня. Независимо от того, как был сгенерирован результат (с помощью простых правил или сложных моделей), этот патент позволяет оценить конечный результат по реакции пользователя и скорректировать поведение системы.

Что такое "Query Context" и почему это важно?

Query Context определяет условия применения правила. Например, правило может гласить: "менять местами числа" (общее правило), но может быть уточнено: "...только если в запросе есть слово 'Pants'" (контекст). Это важно, так как позволяет Google применять переупорядочивание только там, где это имеет смысл, и избегать ошибок в других ситуациях.

Что такое "Both Click", упоминаемый в описании патента?

В детальном описании патента (не в Claims) упоминается ситуация "both click". Это происходит, когда выбранный документ содержит как исходный порядок слов, так и переупорядоченный. В таких случаях неясно, какой именно вариант привел к клику, и патент предлагает присваивать таким кликам меньший вес из-за неоднозначности.

Похожие патенты

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google использует клики и пропуски (skips) для определения, какие слова в запросе можно игнорировать
Google тестирует правила, которые делают определенные слова в запросе необязательными (опциональными), чтобы найти более релевантные результаты. Патент описывает, как система оценивает эффективность этих правил, анализируя поведение пользователей. Если пользователи кликают на результаты, найденные благодаря игнорированию слова, правило считается успешным. Если пропускают (skip) такие результаты, правило может быть удалено.
  • US9141672B1
  • 2015-09-22
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о кликах и пропусках для валидации и удаления неэффективных синонимов в поиске
Google постоянно тестирует правила подстановки (синонимы) для расширения запросов. Этот патент описывает механизм оценки эффективности этих правил с помощью анализа поведения пользователей (клики и пропуски результатов). Если пользователи часто пропускают результаты, содержащие подставленный термин, система автоматически удаляет это правило, очищая понимание запросов от нерелевантных синонимов.
  • US8965875B1
  • 2015-02-24
  • Поведенческие сигналы

  • Семантика и интент

  • EEAT и качество

Как Google использует "ложные пропуски" (Fake Skips) для точной оценки качества своих правил синонимов
Google анализирует поведение пользователей для оценки качества синонимов, используемых при переписывании запросов. Патент вводит метрику "Fake Skip" (Ложный пропуск). Она фиксируется, если пользователь пропустил результат с синонимом, но кликнул на результат ниже, который также содержит этот синоним и исходный термин. Это позволяет точнее калибровать систему синонимов и не пессимизировать хорошие правила из-за неоднозначного поведения пользователей.
  • US8909627B1
  • 2014-12-09
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google автоматически оценивает и удаляет неэффективные синонимы и правила расширения запросов
Google использует механизм для оценки эффективности правил подстановки (синонимов). Если подставленный термин редко встречается в топовых результатах поиска или если пользователи не кликают на результаты, содержащие этот термин, система автоматически удаляет или понижает уверенность в этом правиле. Это позволяет поддерживать качество и точность понимания запросов.
  • US8600973B1
  • 2013-12-03
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google вычисляет тематический авторитет автора (Author Rank) на основе его вклада в контент
Google патентует систему для количественной оценки экспертности авторов по конкретным темам. Система анализирует документы, определяет их тематику (Topic) и вес этой тематики (Weight), а затем учитывает долю вклада (Authorship Percentage) каждого автора в раскрытие этой темы. На основе этих данных формируется кумулятивный «Сигнал Авторитета» (Authority Signature) автора, позволяющий идентифицировать экспертов в различных областях.
  • US8458196B1
  • 2013-06-04
  • EEAT и качество

  • Семантика и интент

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов
Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.
  • US6941293B1
  • 2005-09-06
  • Семантика и интент

  • Ссылки

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google агрегирует, оценивает и ранжирует комментарии, отзывы и упоминания о веб-странице из разных источников
Google собирает комментарии, отзывы и посты в блогах, относящиеся к определенной веб-странице. Система использует сложные алгоритмы для определения основной темы упоминаний (особенно если в них несколько ссылок) и ранжирует эти комментарии на основе авторитетности автора, свежести, качества языка и обратной связи пользователей, чтобы представить наиболее полезные мнения.
  • US8745067B2
  • 2014-06-03
  • EEAT и качество

  • Свежесть контента

  • Семантика и интент

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google ранжирует комментарии и UGC, используя объективное качество и субъективную персонализацию
Google использует двухфакторную модель для ранжирования пользовательского контента (комментариев, отзывов). Система вычисляет объективную оценку качества (репутация автора, грамотность, длина, рейтинги) и субъективную оценку персонализации (является ли автор другом или предпочтительным автором, соответствует ли контент интересам и истории поиска пользователя). Итоговый рейтинг объединяет обе оценки для показа наиболее релевантного и качественного UGC.
  • US8321463B2
  • 2012-11-27
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google определяет популярность и ранжирует физические события (концерты, выставки) в локальной выдаче
Google использует специализированную систему для ранжирования физических событий в определенном месте и времени. Система вычисляет оценку популярности события на основе множества сигналов: количества упоминаний в интернете, кликов на официальную страницу, популярности связанных сущностей (артистов, команд), значимости места проведения и присутствия в общих поисковых запросах о событиях. Затем результаты переранжируются для обеспечения разнообразия, понижая схожие события или события одной категории.
  • US9424360B2
  • 2016-08-23
  • Local SEO

  • Поведенческие сигналы

seohardcore