SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей

REFINING SEARCH RESULTS (Уточнение результатов поиска)
  • US8498974B1
  • Google LLC
  • 2009-08-31
  • 2013-07-30
  • Поведенческие сигналы
  • Мультиязычность
  • Персонализация
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.

Описание

Какую проблему решает

Патент решает проблему искажения релевантности при использовании агрегированных поведенческих данных (например, кликов) от разнородных групп пользователей. Если документ очень популярен у одной аудитории (например, в Китае), но нерелевантен для другой (например, в США), использование общего показателя кликов может неоправданно повысить этот документ для американского пользователя. Существующие методы часто использовали резкие переходы (например, от данных по стране к глобальным данным), упуская возможность использовать данные от схожих, но не идентичных аудиторий (например, соседних стран).

Что запатентовано

Запатентована система уточнения результатов поиска, которая модифицирует использование поведенческих сигналов (requestor behavior) на основе заранее определенной «совместимости» (predefined compatibility) характеристик пользователей, таких как язык и местоположение. Система сегментирует исторические данные о кликах и выборочно снижает или исключает влияние данных от групп пользователей, признанных несовместимыми с текущим пользователем, даже если эти данные показывают высокую вовлеченность.

Как это работает

Механизм (Rank Refiner Engine) работает следующим образом:

  • Сбор и Сегментация: Для пары запрос/документ собираются исторические данные о кликах, сегментированные по языку и стране прошлых пользователей.
  • Расчет метрик: Вычисляются доли кликов (Click Fractions) для каждого сегмента.
  • Определение совместимости: Система определяет, совместимы ли характеристики сегментов с характеристиками текущего пользователя.
  • Корректировка данных: Влияние данных от несовместимых сегментов снижается (reducing) или полностью исключается (eliminating).
  • Расчет фактора ранжирования: На основе скорректированных данных вычисляется итоговый поведенческий фактор (scoring factor). Могут использоваться метрики вероятности понимания документа, такие как Language Demotion Score (LD) и Country Demotion Score (CD).
  • Ранжирование: Результаты переранжируются с учетом этого уточненного фактора.

Актуальность для SEO

Высокая. Персонализация, локализация и точная интерпретация поведенческих сигналов являются ключевыми направлениями развития поиска. В условиях глобального интернета способность разграничивать поведение разных аудиторий (лингвистических и географических) критически важна для поддержания релевантности выдачи.

Важность для SEO

Патент имеет высокое стратегическое значение (8.5/10) для международного SEO. Он демонстрирует, что поведенческие сигналы (например, CTR) не являются универсальными и не переносятся автоматически между разными сегментами. Высокий CTR в одном регионе может не оказать влияния на ранжирование в другом, если аудитории признаны «несовместимыми». Это подчеркивает необходимость оптимизации под конкретную целевую аудиторию и ее локальные поведенческие паттерны.

Детальный разбор

Термины и определения

Click Fraction (Доля кликов)
Метрика, представляющая распределение кликов по различным характеристикам пользователей для конкретной пары запрос/документ. Например, отношение числа кликов от пользователей с определенным языком к общему числу кликов по документу.
Click Measures (Меры кликов)
Данные, представляющие поведение пользователей (requestor behavior) относительно ранее отправленных запросов и конкретного результата поиска.
Compatibility / Predefined Compatibility (Совместимость)
Заранее установленные правила или модели, определяющие схожесть между характеристиками пользователей (например, совместимость русского и украинского языков или совместимость соседних стран).
Country Demotion Score (CD) (Оценка понижения по стране)
Мера способности пользователя понять документ, основанная на совместимости страны пользователя и страны документа (или страны происхождения кликов).
Language Demotion Score (LD) (Оценка понижения по языку)
Мера способности пользователя понять соответствующий документ. Варьируется от 0 (низкая вероятность понимания/совместимости) до 1.0 (высокая вероятность).
Rank Modifier Engine (Механизм модификации ранга)
Компонент системы, который корректирует ранжирование на основе дополнительных сигналов, включая поведенческие модели.
Rank Refiner Engine (Механизм уточнения ранга)
Компонент, ответственный за реализацию логики патента: анализ совместимости характеристик и корректировку поведенческих данных.
Result Selection Logs (Логи выбора результатов)
Хранилище данных о взаимодействии пользователей с выдачей. Фиксирует запрос (Q), документ (D), время (T), язык (L) и страну (C) пользователя.
User Characteristics (Характеристики пользователя)
Атрибуты пользователя, такие как язык (user languages) и местоположение (user locations/страна).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод фильтрации поведенческих данных по языковой совместимости.

  1. Система получает результаты поиска в ответ на запрос пользователя.
  2. Каждый результат связан с набором click measures. Каждая мера относится к отдельному естественному языку и представляет поведение прошлых пользователей этого языка.
  3. Система «уменьшает» (reducing) меру кликов, если она относится к языку, который является «несовместимым» (incompatible) с языком текущего пользователя.
  4. Система рассчитывает фактор ранжирования (scoring factor) на основе скорректированных мер кликов.
  5. Система ранжирует результаты на основе этих факторов.

Ядро изобретения — это использование сегментированных поведенческих данных и активное снижение влияния данных от несовместимых языковых сегментов перед ранжированием.

Claim 2 (Зависимый от 1): Уточняет расчет фактора ранжирования.

Расчет включает взвешивание мер кликов с помощью веса, который представляет «способность пользователя понять документ». Это соответствует использованию Language Demotion Score (LD).

Claim 5 (Зависимый от 4, который зависит от 1): Уточняет расчет фактора ранжирования с учетом стран.

Если прошлые пользователи находились в другой стране, расчет включает взвешивание мер кликов весом, основанным на стране пользователя и стране документа. Это соответствует использованию Country Demotion Score (CD).

Claim 9 (Зависимый от 1): Уточняет механизм уменьшения.

Уменьшение (reducing) меры кликов может включать ее полное исключение (eliminating). Система может полностью игнорировать клики от несовместимых групп.

Claim 10 (Зависимый от 1): Описывает определение несовместимости.

Определение несовместимости языка основывается, по крайней мере, на анализе поисковых запросов, отправленных пользователями в разных странах. Это предполагает офлайн-анализ данных.

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса для корректировки ранжирования на основе поведенческих факторов.

INDEXING – Индексирование (и анализ логов)
На этом этапе система обрабатывает Result Selection Logs. Данные о кликах (Q, D, T, L, C) агрегируются и сегментируются. Также офлайн-процессы анализируют эти данные для определения моделей совместимости языков и стран.

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Rank Modifier Engine использует поведенческие сигналы для корректировки ранжирования. Rank Refiner Engine (описанный в патенте) вмешивается в этот процесс.

  1. Получение данных: Для кандидатов на ранжирование извлекаются сегментированные поведенческие данные (click measures).
  2. Уточнение сигналов: Rank Refiner Engine анализирует контекст текущего пользователя (язык, страна) и применяет логику совместимости для корректировки (уменьшения или исключения) влияния кликов от несовместимых групп.
  3. Расчет факторов: Вычисляются итоговые scoring factors с использованием скорректированных данных и метрик типа LD и CD.
  4. Финальное ранжирование: Результаты сортируются с учетом этих факторов.

Входные данные:

  • Запрос и характеристики текущего пользователя (L, C).
  • Набор документов-кандидатов.
  • Исторические данные о кликах (Result Selection Logs), сегментированные по L и C прошлых пользователей.
  • Предопределенные модели совместимости и метрики (LD, CD).

Выходные данные:

  • Скорректированные поведенческие факторы (scoring factors) для каждого документа.

На что влияет

  • Международный и многоязычный контент: Критически влияет на ранжирование сайтов, ориентированных на несколько стран или языков. Успех в одном сегменте не транслируется автоматически в другой.
  • Специфические запросы: Влияет на запросы с неоднозначным интентом или запросы, где результаты популярны у разных, не пересекающихся аудиторий. Также влияет на запросы с дефицитом данных, позволяя использовать данные из совместимых регионов.
  • Локализация: Механизм поддерживает продвижение локальных документов путем учета кликов на разных языках в пределах одной страны пользователя (важно для многоязычных стран).

Когда применяется

  • Условия активации: Наличие достаточного объема исторических поведенческих данных для пары запрос/документ, сегментированных по разным характеристикам пользователей.
  • Триггер корректировки: Когда значительная часть поведенческих данных исходит от групп пользователей, чьи характеристики (язык/страна) отличаются от характеристик текущего пользователя, и существует риск искажения релевантности из-за несовместимости.

Пошаговый алгоритм

Процесс А: Учет совместимости характеристик (на примере языка)

  1. Получение данных: Для пары запрос/документ извлекаются сегментированные данные о кликах по языкам (например, English, German, Chinese).
  2. Расчет Click Fractions: Вычисляется доля кликов для каждого языка (например, English 0.3, German 0.2, Chinese 0.5).
  3. Первичная сортировка: Языки сортируются по убыванию доли кликов (Chinese 0.5, English 0.3, German 0.2).
  4. Анализ совместимости: Система сравнивает языки с языком текущего пользователя (например, English), используя Predefined Compatibility.
  5. Корректировка (Adjusting/Reducing): Система идентифицирует несовместимые языки (например, Chinese) и уменьшает их влияние. Это может быть применение понижающего веса или полное исключение данных (eliminating). В примере исключается Chinese 0.5.
  6. Пересчет и повторная сортировка: Click Fractions пересчитываются для оставшихся совместимых языков (например, English 0.6, German 0.4).
  7. Расчет Scoring Factor: Скорректированные данные (L+) используются для расчета итогового фактора.

Процесс Б: Агрегация данных с использованием Demotion Scores

Система использует рассчитанные данные для определения итогового фактора ранжирования, применяя формулы, включающие LD и CD, чтобы определить вес различных уровней данных.

Пример 1: Уровень совместимости языков (L+)
Баланс между общими кликами (B) и кликами от совместимых языков (L+), в зависимости от вероятности понимания (LD):
LD∗B+(1−LD)∗L+LD*B+(1-LD)*L+

Пример 2: Уровень совместимости стран (C+)
Баланс на основе совместимости стран (CD), используя клики на языке пользователя (L) и клики из совместимых стран (C+):
L∗CD+(1−CD)∗C+L*CD+(1-CD)*C+

Пример 3: Уровень продвижения локальных документов (C*)
Учет кликов на разных языках в пределах одной страны пользователя. Агрегация данных по всем языкам (C*), используемым в стране, и комбинирование их с данными по конкретному языку/стране пользователя (C), используя LD:
C+LD∗C∗C+LD*C*

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Основные данные. Используются Result Selection Logs. Фиксируются: запрос (Q), выбранный документ (D), время на документе (T). Также фиксируется негативная информация (результат показан, но не кликнут), позиции кликов, IR-оценки показанных результатов, заголовки и сниппеты.
  • Географические факторы: Страна (C) пользователя (текущего и прошлых), определяемая по IP-адресу или используемому серверу.
  • Пользовательские факторы: Язык (L) пользователя (текущего и прошлых). Также могут использоваться cookie, возраст cookie, IP-адрес, user agent браузера.

Какие метрики используются и как они считаются

  • Click Fraction (Доля кликов): Рассчитывается для сегмента. Пример: (Клики по документу от пользователей с языком X) / (Общее число кликов по документу).
  • Compatibility (Совместимость): Предопределенная метрика схожести языков/стран. Может определяться на основе анализа поисковых запросов из разных стран (Claim 10).
  • Language Demotion Score (LD) и Country Demotion Score (CD): Оценки (от 0 до 1.0) вероятности понимания контента, основанные на совместимости языка и страны соответственно.
  • Агрегированные показатели кликов (B, L+, C+, C*):
    • B: Общее количество кликов.
    • L+: Клики для совместимых языков (после фильтрации).
    • C+: Клики из совместимых стран.
    • C*: Клики для всех языков, используемых в стране пользователя.
  • Scoring Factor (Фактор ранжирования): Итоговая метрика, рассчитываемая на основе агрегированных показателей и Demotion Scores (см. формулы в разделе 3.3).

Выводы

  1. Поведенческие сигналы контекстуальны и сегментированы: Google не использует агрегированные глобальные данные о кликах напрямую. CTR и другие метрики взаимодействия сегментируются по языку и стране и используются только в релевантном контексте.
  2. Совместимость (Compatibility) как ключевой фильтр: Введено понятие совместимости между аудиториями. Система активно подавляет или полностью исключает (Claim 9) поведенческие сигналы от несовместимых групп пользователей.
  3. Гибкость вместо жесткой иерархии: Вместо жесткого выбора между локальными и глобальными данными, система использует гибкие модели (промежуточные уровни L+, C+) и веса (LD, CD) для учета данных от схожих, но не идентичных аудиторий (например, родственные языки, соседние страны).
  4. Продвижение локального контента (C*): Система может учитывать клики на разных языках в пределах одной страны пользователя для продвижения локально релевантных документов, что важно для многоязычных регионов.
  5. Защита от манипуляций: Механизм усложняет кросс-региональную накрутку поведенческих факторов, так как клики из несовместимых источников будут отфильтрованы.

Практика

Best practices (это мы делаем)

  • Фокус на локализованном User Experience: Сосредоточьтесь на удовлетворении интента и максимизации положительных поведенческих сигналов (высокий CTR, вовлеченность) именно в вашем целевом языковом и географическом сегменте. Успех в одном сегменте не гарантирует автоматического успеха в другом.
  • Точная настройка международного таргетинга: Используйте hreflang и другие сигналы локализации, чтобы четко указать Google целевую аудиторию каждой страницы. Это поможет системе корректно сопоставить контент с нужным сегментом и правильно интерпретировать поведенческие сигналы.
  • Анализ данных по сегментам: Анализируйте эффективность (CTR, позиции) отдельно для каждого целевого языка и страны в GSC. Не полагайтесь на агрегированные данные.
  • Стратегия для совместимых рынков: При выходе на рынки с совместимыми языками или близкие географически (например, США/Канада или СНГ), положительные сигналы могут частично переноситься (уровни L+, C+). Это усиливает стратегию построения региональных хабов.

Worst practices (это делать не надо)

  • Накрутка поведенческих факторов из нецелевых регионов: Попытки манипулировать CTR с использованием трафика или ботов из несовместимых языковых или географических сегментов будут неэффективны. Система идентифицирует и исключит (eliminating) эти сигналы при ранжировании для целевой аудитории.
  • Игнорирование локализации (One Size Fits All): Создание единой версии контента в надежде на глобальное ранжирование за счет общих сигналов. Если контент не удовлетворяет локальный интент или языки несовместимы (низкий LD), он не получит преимущества от глобальных кликов.
  • Игнорирование языковой совместимости: Попытка ранжироваться по запросам на одном языке с контентом на другом языке. Language Demotion Score (LD) понизит вес поведенческих сигналов.

Стратегическое значение

Патент подтверждает, что Google рассматривает глобальный поиск как совокупность множества локальных поисков, связанных моделями совместимости. Поведенческие факторы являются локализованными и контекстуальными. Долгосрочная SEO-стратегия должна фокусироваться на глубоком понимании интента и поведения пользователей в каждом отдельном целевом сегменте (гипер-сегментация), а не на поиске универсальных факторов ранжирования.

Практические примеры

Сценарий 1: Фильтрация несовместимых кликов (Защита от искажения)

  1. Ситуация: Пользователь ищет на английском языке в США. Существует документ, который очень популярен по этому запросу в Китае (среди китайскоязычных пользователей).
  2. Действие системы: Rank Refiner Engine видит высокий Click Fraction из Китая.
  3. Применение совместимости: Система определяет китайский язык/Китай как несовместимые с английским языком/США.
  4. Результат: Данные о кликах из Китая исключаются (eliminated) при расчете ранжирования для пользователя из США. Документ не получает неоправданного буста.

Сценарий 2: Использование совместимых данных (Расширение покрытия)

  1. Ситуация: Пользователь ищет на русском языке из Беларуси. Исторических данных по этому запросу из Беларуси недостаточно для оценки поведенческих факторов.
  2. Действие системы: Система ищет данные из совместимых регионов. Россия и Беларусь могут быть признаны совместимыми (высокий CD).
  3. Применение совместимости: Система использует данные о кликах русскоязычных пользователей из России (уровень C+), чтобы оценить релевантность документа.
  4. Результат: Ранжирование для пользователя из Беларуси улучшается за счет использования релевантных поведенческих данных из совместимой страны.

Вопросы и ответы

Что такое «совместимость» (Compatibility) языков или стран в контексте этого патента?

Совместимость — это предопределенная мера схожести между характеристиками пользователей. Например, родственные языки (испанский и португальский) или соседние страны (США и Канада) могут считаться совместимыми. Эта мера используется для определения того, следует ли учитывать поведенческие данные (клики) от одной группы пользователей при ранжировании результатов для другой группы.

Как Google определяет, что язык или страна несовместимы?

Патент указывает, что это определяется на основе офлайн-анализа поисковых запросов, отправленных пользователями в разных странах (Claim 10). Вероятно, используются модели машинного обучения для анализа паттернов поведения, лингвистической близости, географического контекста и статистических данных о владении языками для построения карты совместимости.

Означает ли это, что высокий CTR бесполезен?

Нет, высокий CTR критически важен, но его влияние локализовано и контекстуально. Высокий CTR от вашей целевой (совместимой) аудитории является сильным положительным сигналом. Однако высокий CTR от аудитории, которую Google считает несовместимой с вашим целевым пользователем, будет проигнорирован или его влияние будет значительно снижено.

Насколько агрессивно система подавляет клики от несовместимых аудиторий?

Подавление может быть очень агрессивным. Патент (Claim 9) описывает как применение понижающих весов, так и полное исключение (eliminating) этих данных из расчета финального фактора ранжирования (scoring factor). Это означает, что клики могут быть полностью проигнорированы.

Что такое Language Demotion Score (LD) и Country Demotion Score (CD)?

Это метрики от 0 до 1, которые оценивают вероятность того, что пользователь поймет документ, основываясь на совместимости языков (LD) или стран (CD). Они используются в формулах ранжирования как весовые коэффициенты: чем ниже оценка, тем меньше учитываются поведенческие сигналы из соответствующего сегмента.

Как этот патент влияет на накрутку поведенческих факторов (ПФ)?

Он делает накрутку значительно сложнее и менее эффективной, особенно если она выполняется из нецелевых регионов или с использованием нецелевых языков. Поскольку система фильтрует клики на основе совместимости языка и страны источника клика с текущим пользователем, клики из несовместимых источников будут просто проигнорированы или сильно понижены в весе.

Как использовать этот патент для улучшения локального SEO в многоязычных странах?

Патент описывает механизм (C*), который агрегирует клики на разных языках в пределах одной страны пользователя для продвижения локально релевантных документов. Если вы работаете, например, в Швейцарии, оптимизируйте контент так, чтобы он был локально релевантен, это может дать преимущество за счет агрегации сигналов от немецкоязычных, франкоязычных и других групп в стране.

Влияет ли это на сайты на английском языке, таргетированные глобально?

Да. Хотя английский язык используется глобально, система все равно применяет совместимость на уровне стран (Country Demotion Score). Поведенческие сигналы пользователей из США могут иметь больший вес для пользователя из США, чем сигналы от англоязычных пользователей из Индии или Великобритании, если система считает контексты различными.

Что происходит, если по запросу мало исторических данных о кликах?

В этом случае механизм совместимости становится важным для расширения данных. Вместо игнорирования поведенческого фактора или использования нерелевантных глобальных данных, система попытается использовать данные из совместимых языков (L+) или совместимых стран (C+), чтобы получить более точный сигнал.

Какова основная рекомендация для SEO-специалиста, исходя из этого патента?

Основная рекомендация — фокусироваться на гипер-локализации и точном таргетинге. Необходимо обеспечить максимальную релевантность и добиться сильных поведенческих сигналов именно от вашей целевой аудитории. Сигналы от нецелевых (несовместимых) пользователей будут иметь минимальное влияние.

Похожие патенты

Как Google приоритизирует локальное поведение пользователей над глобальной популярностью в международном поиске
Google использует систему для корректировки поискового ранжирования на основе местоположения и языка пользователя. Система приоритизирует данные о кликах от конкретной популяции пользователей (например, страны) над более широкими популяциями (например, глобальными данными). Глобальные сигналы популярности «понижаются» в весе, чтобы гарантировать более высокое ранжирование локально релевантных результатов, даже если они менее популярны в мировом масштабе.
  • US8694511B1
  • 2014-04-08
  • Local SEO

  • Поведенческие сигналы

  • SERP

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

Как Google использует клики и пропуски пользователей для оценки и корректировки правил близости терминов (Proximity Rules)
Google анализирует поведение пользователей для оценки эффективности правил близости (Proximity Rules), которые влияют на ранжирование в зависимости от расстояния между ключевыми словами на странице. Система отслеживает, кликают ли пользователи на результаты, где термины расположены далеко друг от друга, или пропускают их. На основе этих данных (Click Count, Skip Count) вычисляется оценка качества правила, что позволяет Google динамически адаптировать важность фактора близости.
  • US9146966B1
  • 2015-09-29
  • Поведенческие сигналы

  • SERP

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

seohardcore