SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google приоритизирует локальное поведение пользователей над глобальной популярностью в международном поиске

MODIFYING SEARCH RESULT RANKING BASED ON POPULATIONS (Модификация ранжирования результатов поиска на основе популяций)
  • US8694511B1
  • Google LLC
  • 2007-08-20
  • 2014-04-08
  • Local SEO
  • Поведенческие сигналы
  • SERP
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для корректировки поискового ранжирования на основе местоположения и языка пользователя. Система приоритизирует данные о кликах от конкретной популяции пользователей (например, страны) над более широкими популяциями (например, глобальными данными). Глобальные сигналы популярности «понижаются» в весе, чтобы гарантировать более высокое ранжирование локально релевантных результатов, даже если они менее популярны в мировом масштабе.

Описание

Какую проблему решает

Патент решает проблему искажения локальной поисковой выдачи результатами, которые популярны глобально, но менее релевантны для конкретной популяции пользователей. Он устраняет уязвимость, при которой высокий Click-Through Rate (CTR) или другие поведенческие метрики в одной большой стране (например, США) могут неправомерно повысить ранжирование результата в меньшей стране (например, Канаде), вытесняя локально релевантные документы.

Что запатентовано

Запатентована система модификации ранжирования, использующая иерархические популяции пользователей (например, Страна, Язык, Глобальный уровень) для расчета quality of result statistic (статистики качества результата), основанной на поведении пользователей (кликах). Ключевым элементом является механизм «понижения веса» (deemphasizing) данных из более широких популяций при их комбинировании с данными из более специфичных популяций для сохранения локальной релевантности.

Как это работает

Система собирает и агрегирует данные о кликах (click data), которые взвешиваются по времени просмотра (viewing time), и категоризирует их по странам и языкам. При оценке релевантности документа для конкретного контекста (например, пользователь из Канады, ищущий на английском языке), система приоритизирует данные о кликах из Канады. Если этих данных недостаточно, она использует данные для английского языка в целом (более широкая популяция). Однако, чтобы глобальные данные не исказили локальную выдачу, система применяет правила для «понижения веса» глобальных данных, особенно если локальные сигналы слабее глобальных.

Актуальность для SEO

Высокая. Международный и локализованный поиск являются фундаментальными аспектами работы Google. Использование поведенческих сигналов (кликов, dwell time) с поправкой на контекст пользователя остается критически важным механизмом ранжирования в 2025 году. Этот патент описывает базовую логику того, как Google интерпретирует поведенческие факторы в международном контексте.

Важность для SEO

Патент имеет высокое значение (8/10), особенно для международного SEO. Он демонстрирует, что глобальная популярность и высокий глобальный CTR не гарантируют высоких позиций в локальной выдаче. Система требует локализованного подхода к оптимизации и измерению эффективности, подчеркивая важность удовлетворения локальных пользователей над глобальными метриками.

Детальный разбор

Термины и определения

Click Data (Данные о кликах)
Агрегированная информация о взаимодействии пользователей с результатами поиска, включающая клики и время просмотра документа (dwell time). Клики часто взвешиваются (weighted clicks) в зависимости от продолжительности просмотра (короткие, средние, длинные).
Deemphasize (Понижение веса / Приглушение)
Процесс уменьшения влияния данных из второй (более широкой) популяции при расчете итоговой статистики качества. Это может достигаться за счет применения коэффициентов сглаживания (smoothing factors) или других весовых функций.
First Population (Первая популяция)
Более специфичная группа пользователей, например, пользователи из определенной страны (Country-specific).
LCC (Long Click Count) Fraction (Доля длинных кликов)
Метрика, упомянутая в описании патента. Оценивает качество результата на основе доли кликов, которые привели к длительному просмотру страницы, независимо от других результатов по запросу.
Population (Популяция)
Группа пользователей, объединенная общими признаками, такими как страна, язык или глобальная совокупность всех пользователей.
Quality of Result Statistic (Статистика качества результата)
Итоговая метрика, рассчитанная путем комбинирования данных о кликах из разных популяций (с учетом понижения веса). Используется как входной сигнал для ранжирования.
Second Population (Вторая популяция)
Более широкая группа пользователей, включающая первую популяцию. Например, пользователи, говорящие на определенном языке (Language-specific) или глобальная база (Generic).
Traditional Click Fraction (Традиционная доля кликов)
Метрика, упомянутая в описании патента. Оценивает популярность результата относительно других результатов для данного запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод модификации ранжирования на основе популяций.

  1. Идентификация данных о кликах (click data) для документа, где каждый клик взвешен по времени просмотра (viewing time) и ассоциирован со страной и языком пользователя.
  2. Расчет первых данных (first click data) путем агрегации взвешенных кликов для конкретной страны.
  3. Расчет вторых данных (second click data) путем агрегации взвешенных кликов для конкретного языка (более широкая популяция).
  4. Понижение веса (deemphasizing) вторых данных относительно первых, основываясь, как минимум, на определении того, что язык запроса и язык пользовательского интерфейса совпадают.
  5. Расчет quality of result statistic путем комбинирования первых данных с пониженными в весе вторыми данными.
  6. Предоставление этой статистики как входного сигнала для ранжирования документа.

Если язык запроса совпадает с языком интерфейса (например, английский запрос на google.ca), система предполагает локальный интент и понижает влияние глобальных данных о кликах, чтобы предотвратить доминирование результатов, популярных за пределами этой страны.

Claim 2 (Зависимый от 1): Определяет дополнительное условие для понижения веса.

  1. Определяется первая доля кликов (first click fraction) на основе первых данных (Страна).
  2. Определяется вторая доля кликов (second click fraction) на основе вторых данных (Язык).
  3. Если первая доля МЕНЬШЕ второй доли, вторые данные понижаются в весе.

Это критически важный механизм. Если документ очень популярен глобально (высокая вторая доля), но менее популярен в конкретной стране (низкая первая доля), система активно уменьшает буст от глобальной популярности, чтобы защитить локальную релевантность.

Claim 3 (Зависимый от 1): Определяет еще одно условие для понижения веса.

  1. Определяется, совпадает ли язык документа с языком пользовательского интерфейса.
  2. Если ДА, вторые данные понижаются в весе.

Если пользователь видит результат на том же языке, что и его интерфейс, система понижает влияние глобальных кликов, приоритизируя локальное поведение.

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса для корректировки ранжирования на основе поведенческих данных.

CRAWLING & INDEXING – Сканирование, Индексирование и Сбор данных
На этом этапе происходит сбор и сохранение сырых данных о поведении пользователей (Result Selection Logs). Эти данные включают запрос (Q), документ (D), время просмотра (T), язык (L) и страну (C) пользователя. Данные агрегируются и сохраняются в иерархической структуре баз данных (например, Глобальная -> Язык -> Страна).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. Компонент Rank Modifier Engine использует данные из Result Selection Logs для расчета quality of result statistic.

  1. Получение контекста: Определяется контекст пользователя (Страна, Язык).
  2. Извлечение данных: Система извлекает данные о кликах для пары Запрос-Документ из наиболее специфичной популяции (например, Страна).
  3. Обработка Разреженности (Backoff): Если специфичных данных недостаточно, система обращается к более широкой популяции (например, Язык или Глобальный уровень).
  4. Применение Deemphasizing: При комбинировании данных из разных уровней применяются правила понижения веса для более широких данных.
  5. Расчет статистики: Генерируется финальная quality of result statistic (например, скорректированная доля кликов).
  6. Модификация ранжирования: Эта статистика используется для корректировки Ranking Score документа.

Входные данные:

  • Исходный запрос пользователя.
  • Контекст пользователя (Страна, Язык интерфейса).
  • Язык документа.
  • Агрегированные данные о кликах (Click Data) из иерархических баз данных (Страна, Язык, Глобальный уровень).

Выходные данные:

  • Quality of result statistic, которая используется как сигнал для модификации ранжирования.

На что влияет

  • Конкретные типы контента и ниши: Наибольшее влияние оказывается на сайты, работающие в международном масштабе или в нескольких регионах с одним языком (например, США/Канада/Великобритания). Особенно актуально для e-commerce, новостных и информационных сайтов, где интент и релевантные ответы могут сильно отличаться географически.
  • Специфические запросы: Влияет на запросы с неоднозначным географическим интентом или запросы, где популярные ответы различаются в разных странах (например, названия брендов, общие информационные запросы типа «страхование» или «доставка еды»).

Когда применяется

  • Условия применения: Алгоритм применяется при расчете поведенческих факторов ранжирования для запросов, по которым накоплена статистика кликов в разных популяциях.
  • Триггеры активации: Механизм понижения веса (deemphasizing) активируется, когда система комбинирует данные из разных уровней иерархии популяций (например, при нехватке данных на уровне страны и использовании данных на уровне языка).
  • Специфические условия активации понижения:
    • Когда доля кликов в специфичной популяции ниже, чем в широкой.
    • Когда язык запроса совпадает с языком интерфейса.
    • Когда язык документа совпадает с языком интерфейса.

Пошаговый алгоритм

Процесс расчета статистики качества результата:

  1. Идентификация запроса и контекста: Система получает запрос и определяет контекст пользователя (Страна, Язык интерфейса), а также язык запроса.
  2. Определение популяций: Устанавливается иерархия популяций. Например, Первая популяция (специфичная) = Страна пользователя; Вторая популяция (широкая) = Язык пользователя.
  3. Извлечение первых данных: Система извлекает агрегированные данные о кликах (first click data) для данного запроса и документа из Первой популяции.
  4. Извлечение вторых данных: Система извлекает агрегированные данные о кликах (second click data) из Второй популяции.
  5. Оценка условий для понижения веса: Система проверяет выполнение условий для deemphasizing:
    • Совпадают ли язык запроса и язык интерфейса?
    • Совпадают ли язык документа и язык интерфейса?
    • Является ли доля кликов, рассчитанная по первым данным, меньше доли кликов, рассчитанной по вторым данным?
  6. Применение понижения веса: Если условия выполнены, вес вторых данных уменьшается относительно первых. Это может быть реализовано через применение коэффициентов сглаживания (smoothing factors), которые зависят от объема первых данных.
  7. Комбинирование данных: Первые данные и пониженные в весе вторые данные объединяются. Например, с использованием иерархических формул, приведенных в описании патента.
  8. Генерация статистики: Создается итоговая quality of result statistic.
  9. Передача сигнала ранжирования: Статистика передается в систему ранжирования для корректировки Ranking Score документа.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы:
    • Клики (Clicks) на результаты поиска.
    • Время просмотра документа (Dwell time / Time on document). Используется для классификации кликов (короткие, средние, длинные) и их взвешивания.
    • Логи выбора результатов (Result Selection Logs).
  • Географические факторы:
    • Страна пользователя (Country), определяемая, например, по IP или используемому интерфейсу (e.g., google.ca).
  • Пользовательские факторы (Контекст):
    • Язык интерфейса (Language of the user interface).
    • Язык запроса (Language of the query).
  • Контентные факторы:
    • Язык документа (Language of the document).

Какие метрики используются и как они считаются

Система использует метрики, основанные на взвешенных кликах, и применяет иерархический подход к их расчету.

  • Взвешенные клики (Weighted Clicks - #WC): Клики взвешиваются на основе времени просмотра. Длинные клики получают больший вес, короткие – меньший или отрицательный.
  • Традиционная доля кликов (Traditional Click Fraction): Метрика популярности относительно других результатов. Пример формулы из описания: [#WC(Q,D)]/[#WC(Q)+S0][\#WC(Q,D)] / [\#WC(Q) + S0], где S0 – коэффициент сглаживания.
  • Доля длинных кликов (LCC Fraction): Метрика качества результата, независимая от позиции. Пример формулы из описания: [#WC(query,url)]/[#C(query,url)+S0][\#WC(query,url)] / [\#C(query,url) + S0].
  • Иерархические метрики: Метрики рассчитываются на разных уровнях:
    • BASE (Глобальный уровень).
    • LANG (Уровень языка).
    • COUNTRY (Уровень страны).
  • Коэффициенты сглаживания (Smoothing Factors - S0, S1, S2): Используются для реализации механизма deemphasizing и backoff (отката к более общему уровню). Патент предполагает, что эти коэффициенты могут настраиваться, например, в зависимости от объема трафика в популяции.
  • Комбинирование метрик: Система комбинирует метрики с разных уровней, применяя правила понижения веса. Например, итоговая метрика COUNTRY использует данные уровня страны, а также данные LANG (пониженные в весе) и BASE (еще более пониженные в весе).

Выводы

  1. Приоритет локального поведения над глобальным: Google активно приоритизирует сигналы удовлетворенности пользователей (Click Data, LCC) из специфичной популяции (Страна) над сигналами из более широкой популяции (Язык, Глобальный уровень).
  2. Механизм защиты от глобального искажения (Deemphasizing): Система использует конкретные правила для «понижения» веса глобальных данных. Особенно важно правило: если локальная популярность ниже глобальной, влияние глобальных данных агрессивно снижается. Это предотвращает доминирование глобально популярных, но локально нерелевантных результатов.
  3. Контекст определяет интерпретацию кликов: Ценность клика зависит не только от его продолжительности (dwell time), но и от контекста, в котором он был совершен (Страна пользователя, Язык интерфейса, Язык запроса). Совпадение языка запроса и интерфейса интерпретируется как сильный сигнал локального интента.
  4. Критичность локализованного анализа эффективности: Для международного SEO недостаточно отслеживать глобальные метрики. Необходимо анализировать CTR и удовлетворенность пользователей в разрезе каждой целевой страны и языка.

Практика

Best practices (это мы делаем)

  • Оптимизация под локальный интент и удовлетворенность: Сосредоточьтесь на создании контента, который максимально полно отвечает на запросы пользователей в конкретной стране. Цель — добиться высоких показателей LCC (Long Click Count) именно среди локальной аудитории, а не только высокого глобального CTR.
  • Локализованный мониторинг эффективности: Отслеживайте ранжирование, CTR и поведенческие метрики отдельно для каждой целевой страны и языка. Не полагайтесь на средние или глобальные данные. Эффективность в США не гарантирует эффективность в Канаде или Великобритании.
  • Усиление локальных сигналов: Используйте локальные сигналы релевантности (локальные ссылки, упоминания в местных СМИ, привязка к местным сущностям), чтобы улучшить восприятие контента локальной аудиторией и повысить локальные поведенческие метрики.
  • Корректная техническая локализация: Убедитесь, что техническая реализация (например, hreflang, ccTLD или структура подпапок) четко указывает Google, какая версия контента предназначена для какой популяции (Страна/Язык). Это помогает системе корректно ассоциировать поведенческие сигналы с нужной версией страницы.

Worst practices (это делать не надо)

  • Игнорирование локальных различий в интенте: Использование прямого перевода контента без адаптации под локальный рынок. Механизм deemphasizing накажет страницы, которые популярны в одной стране, но не удовлетворяют пользователей в другой.
  • Ориентация на глобальный CTR: Попытки оптимизировать глобальную кликабельность в ущерб локальной релевантности. Система активно понизит вес глобальных кликов, если локальные сигналы слабые.
  • Объединение разных стран в один языковой раздел: Создание единой «английской» версии сайта для США, Великобритании и Австралии без учета локальных особенностей. Поведение пользователей из разных стран будет смешиваться, что может привести к неоптимальному ранжированию во всех регионах.

Стратегическое значение

Патент подтверждает стратегическую важность глубокой локализации в международном SEO. Успех на международных рынках не достигается простым масштабированием или переводом. Google рассматривает каждую комбинацию Страна/Язык как отдельную Population со своими уникальными потребностями и поведенческими паттернами. Долгосрочная стратегия должна включать ресурсы для понимания и удовлетворения этих отдельных популяций, а не рассматривать международный поиск как монолитный.

Практические примеры

Сценарий: Ранжирование интернет-магазина в Канаде и США

Сайт Ecommerce.com (США) и Localshop.ca (Канада) ранжируются по запросу "buy running shoes" (купить кроссовки).

  1. Ситуация: Ecommerce.com имеет огромную глобальную популярность и высокий Traditional Click Fraction в США. Localshop.ca менее популярен глобально, но предлагает релевантный контент для канадцев (цены в CAD, местная доставка).
  2. Обработка запроса в Канаде (google.ca): Пользователь ищет на английском языке из Канады.
  3. Анализ данных:
    • Первая популяция (Канада): Ecommerce.com имеет низкую долю кликов (пользователи уходят из-за цен в USD). Localshop.ca имеет высокую долю кликов.
    • Вторая популяция (Английский язык глобально): Ecommerce.com имеет очень высокую долю кликов (из-за США).
  4. Применение Deemphasizing: Система обнаруживает, что (1) Язык запроса и интерфейса совпадают (Английский) и (2) Доля кликов в Первой популяции для Ecommerce.com НИЖЕ, чем во Второй.
  5. Результат: Влияние высокой глобальной популярности Ecommerce.com агрессивно понижается (deemphasized) при ранжировании в Канаде. Localshop.ca получает преимущество за счет сильных локальных сигналов и ранжируется выше.

Вопросы и ответы

Что такое «Популяция» (Population) в контексте этого патента?

Популяция — это группа пользователей, объединенная общими признаками. Патент описывает иерархию популяций: наиболее специфичная — это комбинация Страна+Язык (например, Канадцы, говорящие по-французски), более широкая — Язык (все франкоговорящие пользователи), и самая широкая — Глобальная база (все пользователи). Система использует эту иерархию для расчета поведенческих факторов.

Что означает «Deemphasizing» (Понижение веса)?

Это процесс уменьшения влияния данных о кликах из более широкой популяции при расчете ранжирования для более узкой популяции. Например, если данных из Канады мало, система использует глобальные данные, но снижает их вес. Это делается для того, чтобы глобальная популярность не перекрывала локальную релевантность.

В каком случае Google наиболее агрессивно понижает вес глобальных данных?

Наиболее агрессивное понижение происходит, когда доля кликов (Click Fraction) в локальной популяции значительно ниже, чем в глобальной. Это указывает на то, что результат популярен в мире, но не релевантен локально. В этом случае система активно защищает локальную выдачу от искажения глобальными данными.

Как этот патент влияет на стратегию международного SEO для сайта на одном языке (например, Английском)?

Он подчеркивает, что нельзя рассматривать англоязычный рынок как единое целое. Поведение пользователей в США, Великобритании и Австралии оценивается отдельно. Необходимо оптимизировать контент и пользовательский опыт для каждой страны индивидуально, чтобы добиться высоких локальных поведенческих метрик (LCC, CTR) в каждой из них.

Что важнее: глобальный CTR или локальный CTR?

Локальный CTR (и особенно локальный LCC - доля длинных кликов) значительно важнее для ранжирования в конкретной стране. Патент описывает механизм, который специально создан для приоритизации локальных сигналов над глобальными, даже если локальных данных меньше.

Как язык интерфейса пользователя влияет на ранжирование согласно патенту?

Если язык запроса пользователя совпадает с языком его интерфейса (например, немецкий запрос на google.de), это интерпретируется как сильный сигнал локального интента. В этом случае система активирует понижение веса глобальных данных, чтобы убедиться, что результаты максимально релевантны для этой локальной популяции.

Что такое LCC Fraction и почему она упоминается в патенте?

LCC (Long Click Count) Fraction — это доля длинных кликов. Она измеряет, как долго пользователи остаются на странице после клика, что является индикатором качества и удовлетворенности. Патент использует эти взвешенные по времени клики (Weighted Clicks) как основу для расчета Quality of Result Statistic в разных популяциях.

Если мой сайт хорошо ранжируется в США, поможет ли это ранжированию в Канаде?

Это может помочь только в том случае, если поведение канадских пользователей схоже с поведением пользователей из США для данного запроса. Однако, если канадские пользователи предпочитают другие результаты (локальная доля кликов ниже глобальной), то высокая популярность в США будет «понижена» (deemphasized) и не даст значительного преимущества в Канаде.

Как этот патент связан с использованием hreflang?

Хотя патент напрямую не упоминает hreflang, корректное использование hreflang помогает Google понять, какая страница предназначена для какой популяции (Страна/Язык). Это позволяет системе более точно собирать и применять локализованные поведенческие сигналы к нужным страницам, делая механизм, описанный в патенте, более эффективным.

Стоит ли использовать единую глобальную версию сайта вместо локализованных версий?

Исходя из этого патента, это плохая стратегия, если интент пользователей различается географически. Единая версия затрудняет оптимизацию под локальные поведенческие факторы. Локализованные версии позволяют максимизировать Quality of Result Statistic для каждой отдельной популяции.

Похожие патенты

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования
Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.
  • US7454417B2
  • 2008-11-18
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google использует язык интерфейса пользователя и поведенческие сигналы для определения языковой релевантности документа
Google определяет, для носителей каких языков релевантен документ, анализируя агрегированные данные о кликах. Система изучает, какой языковой интерфейс поиска (например, google.fr или google.de) использовали пользователи, кликнувшие на результат. Учитывая поведенческие факторы, такие как время пребывания на странице (Dwell Time) и позиция клика, Google рассчитывает Оценку Языковой Релевантности. Это позволяет определить целевую аудиторию страницы независимо от языка ее контента.
  • US9208231B1
  • 2015-12-08
  • Мультиязычность

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google группирует похожие запросы и поисковые подсказки, определяя интент пользователя через анализ сессий и кликов
Google использует графовую модель (Марковскую цепь) для кластеризации поисковых подсказок и связанных запросов. Система анализирует, какие запросы пользователи вводят в одной сессии и на какие документы они кликают. Это позволяет сгруппировать запросы, ведущие к схожему контенту, и предложить пользователю разнообразный набор подсказок, отражающих разные интенты.
  • US8423538B1
  • 2013-04-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR
Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.
  • US10922326B2
  • 2021-02-16
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google алгоритмически определяет и верифицирует языковые версии страниц, анализируя ссылки, контент и частоту обновлений
Google использует систему для автоматической идентификации связанных версий контента (например, переводов). Система анализирует ссылки между страницами и ищет «индикаторы связи» (названия языков в анкорах или флаги). Обнаруженная связь затем верифицируется с помощью машинного перевода и сравнения контента, а также анализа частоты обновлений. Это позволяет Google показывать пользователю наиболее подходящую языковую или региональную версию в поиске.
  • US8892596B1
  • 2014-11-18
  • Мультиязычность

  • Ссылки

  • SERP

Как Google использует личную историю поиска и профиль интересов для персонализации подсказок Autocomplete
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
  • US20140108445A1
  • 2014-04-17
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

seohardcore