SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования

METHODS AND SYSTEMS FOR IMPROVING A SEARCH RANKING USING POPULATION INFORMATION (Методы и системы для улучшения поискового ранжирования с использованием информации о популяции)
  • US7454417B2
  • Google LLC
  • 2003-09-12
  • 2008-11-18
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Local SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.

Описание

Какую проблему решает

Патент решает проблему, когда глобальные сигналы ранжирования не отражают релевантность для конкретных групп пользователей (популяций). Например, предпочтения пользователей из Японии могут отличаться от предпочтений пользователей из США по одному и тому же запросу. Если система опирается только на глобальные данные, она может возвращать нерелевантные результаты для специфических групп. Также патент предлагает решение проблемы нехватки данных (data sparsity) при попытке оценить релевантность для небольших популяций.

Что запатентовано

Запатентована система и метод корректировки поискового ранжирования на основе поведенческих данных (Clickthrough Data), сегментированных по популяциям пользователей. Ядром изобретения является расчет Population Signal (Сигнала Популяции). Этот расчет включает механизм статистического сглаживания, который балансирует между данными о кликах конкретной популяции и глобальными данными о кликах.

Как это работает

Система работает следующим образом:

  • Определение популяции: При получении запроса система идентифицирует популяцию пользователя (например, по IP-адресу, языковым настройкам, демографии), используя Automatic-identification data и Self-identification data.
  • Сбор данных: Система обращается к базе данных популяции (Population DB) и базе данных кликов (Click Through DB), чтобы получить исторические данные о поведении этой группы.
  • Расчет Сигнала Популяции: Для каждого документа рассчитывается оценка (Population Signal), отражающая вероятность клика на этот документ пользователем из данной популяции.
  • Сглаживание: Если данных о кликах для конкретной популяции мало, система использует Smoothing Factor (µ), чтобы больше полагаться на глобальные данные о кликах. Если данных много, система больше доверяет данным конкретной популяции.
  • Ранжирование: Полученный сигнал используется Ranking Processor для корректировки итогового Ranking Score документа.

Актуальность для SEO

Высокая. Несмотря на дату подачи (2003 год), описанные принципы являются фундаментальными для современных поисковых систем. Персонализация, локализация и использование сегментированных поведенческих данных для улучшения ранжирования критически важны. Описанные методы статистического сглаживания (например, Байесовское сглаживание) для обработки разреженных данных по-прежнему актуальны в Information Retrieval и машинном обучении.

Важность для SEO

Патент имеет высокое значение для SEO (8/10), особенно для международного и локального продвижения. Он объясняет механизм, лежащий в основе различий поисковой выдачи в разных регионах, языковых версиях или для разных демографических групп. Это подчеркивает, что релевантность зависит от контекста пользователя (его популяции), и для успешного ранжирования необходимо удовлетворять интент целевой аудитории и генерировать положительные поведенческие сигналы именно внутри этого сегмента.

Детальный разбор

Термины и определения

Population (Популяция)
Группа пользователей, объединенная общими характеристиками. Примеры включают местоположение (страна, регион, город), демографические данные (возраст, пол), язык, общие интересы или интернет-провайдера (ISP).
Population Signal (Сигнал Популяции)
Оценка, рассчитываемая для документа в контексте конкретного запроса и конкретной популяции. Отражает релевантность или популярность документа именно для этой группы пользователей на основе исторических кликов. Обозначается как S(q,dj)S(q, d_j)S(q,dj​).
Clickthrough Data / Selection Data (Данные о кликах / Данные о выборе)
Поведенческие данные, фиксирующие взаимодействие пользователей с результатами поиска (клики на ссылки). Эти данные хранятся и анализируются в привязке к запросу, документу и популяции пользователя.
Smoothing Factor (μ) (Коэффициент сглаживания)
Статистическая переменная (обозначаемая как µ - мю). Используется для корректировки Population Signal в условиях нехватки данных (data sparsity). Определяет степень доверия к данным о кликах конкретной популяции. Если кликов мало, система больше полагается на глобальные данные.
Automatic-identification data (Автоматически собираемые данные)
Данные, используемые для определения популяции пользователя без его прямого участия. Примеры: IP-адрес, доменное имя (например, .co.jp), cookies, версия и языковые настройки браузера.
Self-identification data (Данные самоидентификации)
Данные, предоставленные пользователем, которые помогают определить его популяцию. Примеры: данные регистрации, выбранные языковые предпочтения, указанное местоположение.
Sub-population (Субпопуляция)
Более узкая группа внутри популяции. Патент описывает иерархию: например, «Парижане» < «Франция» < «Европа».
Population Processor (Процессор популяции)
Компонент поисковой системы, отвечающий за определение популяции пользователя и расчет Population Signal.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод улучшения ранжирования.

  1. Система получает поисковый запрос от пользователя.
  2. Идентифицируется как минимум одна группа популяции (first population group), связанная с этим пользователем.
  3. Определяется первый документ (first article), релевантный запросу.
  4. Рассчитывается Population Signal для этого документа на основе данных, связанных с идентифицированной группой популяции.
  5. Определяется оценка ранжирования (Ranking Score) для документа на основе этого Population Signal.
  6. В ответ на запрос выводятся результаты поиска, в которых документ ранжируется с использованием этой оценки.

Claims 2-11 (Зависимые): Детализируют способы определения популяции пользователя.

Определение популяции может основываться на демографических данных, вероятном географическом местоположении (определенном через IP-адрес, введенный пользователем адрес), а также на Self-identification data или Automatic-identification data.

Claim 12, 13 (Зависимые): Определяют природу Population Signal.

Population Signal представляет собой оценку выбора (selection score) документа в контексте данной популяции. Эта оценка выбора, в частности, может быть количеством кликов (number of clicks) на документ, совершенных членами данной популяции по данному запросу.

Claim 14 (Зависимый от 13): Вводит понятие сглаживания.

Population Signal включает коэффициент сглаживания (Smoothing Factor), связанный с кликами. Это подтверждает использование статистических методов для повышения надежности оценки при малом количестве данных.

Claim 20 (Зависимый): Указывает на возможность использования нескольких популяций.

Система может определить вторую группу популяции (second population group) и использовать ее данные для расчета Population Signal. Это позволяет учитывать иерархии (Страна > Регион) или пересечения (например, язык и местоположение).

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса для персонализации выдачи на основе группового поведения.

INDEXING – Индексирование и извлечение признаков (Офлайн-процессы)
На этом этапе происходит предварительная обработка данных. Clickthrough data и данные о популяциях собираются, анализируются и индексируются в Population DB и Click Through DB. Рассчитываются агрегированные статистики кликов (глобальные и по популяциям).

QUNDERSTANDING – Понимание Запросов (Идентификация пользователя)
В момент получения запроса система должна определить популяцию текущего пользователя. Это происходит путем анализа Automatic-identification data (IP, домен) и Self-identification data (язык браузера, настройки аккаунта).

RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение патента. После того как базовый набор документов получен (Document Locator) и определена популяция пользователя:

  1. Population Processor рассчитывает Population Signal для документов, используя данные из баз и применяя Smoothing Factor (µ).
  2. Ranking Processor использует этот сигнал как один из факторов (наряду с другими сигналами) для определения финального Ranking Score.

Входные данные:

  • Поисковый запрос (Q).
  • Идентификатор популяции пользователя (P).
  • Начальный набор результатов поиска.
  • Агрегированные данные о кликах (глобальные и специфичные для популяции P).
  • Коэффициент сглаживания (µ).

Выходные данные:

  • Population Signal (S(q,dj)S(q, d_j)S(q,dj​)) для каждого документа, который затем используется в ранжировании.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, интент которых зависит от местоположения (локальные запросы), культуры или языка (например, запрос "football" в США и Великобритании; запрос "cricket" в США и Индии).
  • Локальный поиск и Международное SEO: Алгоритм напрямую используется для адаптации выдачи под конкретные страны и языки, гарантируя, что пользователи увидят результаты, популярные в их регионе или языковой группе.

Когда применяется

  • Условия работы: Алгоритм применяется во время выполнения запроса (real-time ranking).
  • Триггеры активации: Активируется, когда система может идентифицировать популяцию пользователя. Влияние алгоритма тем сильнее, чем больше специфичных для популяции данных собрано и чем сильнее они отличаются от глобальных данных.
  • Обработка нехватки данных (Data Sparsity): Если данных для конкретной популяции (например, "пользователи из Люксембурга") недостаточно, система может использовать данные более высокого уровня иерархии (например, "пользователи из Европы") или полагаться на глобальные данные через механизм сглаживания (Smoothing Factor).

Пошаговый алгоритм

Процесс расчета Population Signal (на примере Формулы 1 из патента):

  1. Инициализация: Система получает запрос "Q" от пользователя.
  2. Определение популяции: Определяется популяция "P" пользователя (например, "Франция").
  3. Определение параметров: Определяется коэффициент сглаживания (µ).
  4. Сбор статистики по популяции (Агрегация): Система рассчитывает общее количество кликов по всем документам для запроса "Q", совершенных популяцией "P" (∑i#(q,di,P)\sum_i \#(q, d_i, P)∑i​#(q,di​,P)).
  5. Сбор глобальной статистики (Агрегация): Система рассчитывает общее количество кликов по всем документам для запроса "Q", совершенных всеми пользователями (∑i#(q,di)\sum_i \#(q, d_i)∑i​#(q,di​)).
  6. Обработка документа (Итерация): Для каждого конкретного документа djd_jdj​:
    • Получить количество кликов популяции P: #(q,dj,P)\#(q, d_j, P)#(q,dj​,P).
    • Получить количество глобальных кликов: #(q,dj)\#(q, d_j)#(q,dj​).
  7. Расчет: Вычисление Population Signal по формуле (см. раздел Метрики), объединяющей эти данные с применением µ.
  8. Применение: Передача Population Signal в Ranking Processor для корректировки ранга документа djd_jdj​.

Какие данные и как использует

Данные на входе

Система использует несколько типов данных для определения популяции и расчета сигнала:

  • Поведенческие факторы: Clickthrough data (данные о кликах) являются основным источником информации. Система отслеживает, какие документы выбираются пользователями по конкретным запросам, сегментируя данные по популяциям.
  • Географические факторы: IP-адрес пользователя, страна домена, используемого для доступа к поисковой системе (например, google.co.jp), информация о местоположении, указанная пользователем.
  • Пользовательские факторы (Демография и Предпочтения): Языковые настройки браузера или ОС (Automatic-identification data), регистрационные данные (возраст, пол, если доступны), cookies, история интересов (Self-identification data).

Какие метрики используются и как они считаются

Ключевым элементом патента является формула для расчета Population Signal. В патенте приводится несколько примеров, основной из которых (Формула 1, согласно тексту патента в Col 12):

S(q,dj)=#(q,dj,P)+μ⋅#(q,dj)∑i#(q,di)+μ∑i#(q,di,P)+μS(q, d_j) = \frac{\#(q, d_j, P) + \mu \cdot \frac{\#(q, d_j)}{\sum_i \#(q, d_i) + \mu}}{\sum_i \#(q, d_i, P) + \mu}S(q,dj​)=∑i​#(q,di​,P)+μ#(q,dj​,P)+μ⋅∑i​#(q,di​)+μ#(q,dj​)​​

Где:

  • S(q,dj)S(q, d_j)S(q,dj​): Итоговый Population Signal.
  • #(q,dj,P)\#(q, d_j, P)#(q,dj​,P): Количество кликов на документ djd_jdj​ по запросу q, совершенных популяцией P. (Специфичный сигнал).
  • #(q,dj)\#(q, d_j)#(q,dj​): Количество кликов на документ djd_jdj​ по запросу q, совершенных всеми пользователями. (Глобальный сигнал).
  • ∑i#(q,di)\sum_i \#(q, d_i)∑i​#(q,di​): Сумма кликов по всем документам для запроса q всеми пользователями.
  • ∑i#(q,di,P)\sum_i \#(q, d_i, P)∑i​#(q,di​,P): Сумма кликов по всем документам для запроса q популяцией P.
  • μ\muμ: Коэффициент сглаживания.

Интерпретация формулы (Байесовское сглаживание):

Эта формула реализует механизм, схожий с Байесовским сглаживанием. Она рассчитывает вероятность того, что пользователь из популяции P кликнет на документ djd_jdj​, используя глобальную вероятность клика как априорную (prior) вероятность.

Коэффициент μ\muμ определяет баланс:

  • Если μ\muμ велик или данных популяции P мало, то итоговый сигнал приближается к глобальной вероятности клика. Система "не доверяет" разреженным данным популяции.
  • Если μ\muμ мал или данных популяции P много, то итоговый сигнал приближается к вероятности клика именно внутри популяции P.

Иерархия популяций: Патент также упоминает, что если данных для субпопуляции недостаточно, система может использовать данные более высокого уровня иерархии (например, использовать данные по Европе, если данных по Франции мало).

Выводы

  1. Релевантность контекстуальна и зависит от популяции: Патент формализует идею о том, что наилучший результат не универсален, а зависит от того, к какой группе принадлежит пользователь (география, язык, демография). Глобальная релевантность уступает место групповым предпочтениям.
  2. Сегментированные поведенческие сигналы: Clickthrough data используется не глобально, а в разрезе конкретных популяций. Высокое взаимодействие внутри группы повышает ранжирование для членов этой группы. Это механизм групповой персонализации.
  3. Критичность обработки нехватки данных (Data Sparsity): Smoothing Factor (μ) является ключевым механизмом. Он позволяет системе динамически балансировать между специфичными (но разреженными) данными популяции и общими (надежными) глобальными данными, используя методы статистического (Байесовского) сглаживания.
  4. Иерархический подход к популяциям: Система предусматривает использование иерархий (Субпопуляций). Если данных для узкой группы мало (например, город), можно использовать данные более широкой группы (например, страна или континент).
  5. Многомерность популяций: Пользователь может принадлежать к нескольким популяциям одновременно (Claim 20), что дает возможность для сложной персонализации (например, по языку и местоположению одновременно).

Практика

Best practices (это мы делаем)

  • Оптимизация под интент целевой популяции: Необходимо четко понимать целевую аудиторию (популяцию) и ее специфические интенты. Контент должен быть максимально релевантен именно для этой группы, чтобы максимизировать положительные поведенческие сигналы (клики/CTR) внутри сегмента.
  • Глубокая локализация и культурная адаптация: При международном SEO критически важен не просто перевод, а адаптация контента под культурные и поведенческие особенности региона. Контент должен резонировать с местной аудиторией и стимулировать взаимодействие.
  • Корректная техническая реализация международного SEO: Используйте инструменты (hreflang, локальные домены, настройка таргетинга), чтобы помочь Google правильно ассоциировать ваш контент с нужной популяцией.
  • Локализованный мониторинг и анализ: Мониторьте ранжирование и показатели CTR не глобально, а в разрезе ключевых целевых рынков (популяций). Анализируйте выдачу в целевых регионах (используя VPN), чтобы понять предпочтения местной аудитории.

Worst practices (это делать не надо)

  • Игнорирование локальных предпочтений: Применение универсальной SEO-стратегии ("one-size-fits-all"). Предположение, что страница, оптимизированная для одного рынка (например, США), будет автоматически хорошо ранжироваться в других (например, в Японии или Германии).
  • Поверхностный перевод без адаптации: Использование машинного перевода без учета локальных особенностей. Такой контент получит низкое вовлечение от местной популяции, что приведет к низкому Population Signal.
  • Манипуляции с поведенческими факторами из нецелевых регионов: Накрутка кликов (например, через клик-фермы) из случайных локаций не улучшит Population Signal для целевой аудитории, так как система анализирует поведение сегментированно.

Стратегическое значение

Этот патент является одним из фундаментальных документов, описывающих механизмы персонализации и локализации поиска на основе группового поведения. Он подтверждает стратегическую важность понимания и удовлетворения потребностей конкретных сегментов аудитории. Для SEO это означает, что невозможно разработать единую стратегию для всех рынков; успех определяется не абстрактной релевантностью, а реальным взаимодействием целевых пользователей с контентом в их локальном или демографическом контексте.

Практические примеры

Сценарий 1: Адаптация выдачи по запросу с различным культурным значением

  1. Запрос (Q): "Cricket"
  2. Пользователь 1 (Популяция: США): Система идентифицирует пользователя в США. Исторические Clickthrough Data показывают, что пользователи в США чаще кликают на результаты про насекомое или мобильного оператора Cricket Wireless.
  3. Пользователь 2 (Популяция: Индия): Система идентифицирует пользователя в Индии. Исторические данные показывают, что пользователи в Индии почти исключительно кликают на результаты про спорт крикет.
  4. Расчет Population Signal: Сайты про спорт получат высокий сигнал в Индии и низкий в США. Сайты про насекомых — наоборот.
  5. Результат: Оба пользователя видят совершенно разную выдачу, адаптированную под предпочтения их популяции.

Сценарий 2: Обработка нехватки данных (Data Sparsity)

  1. Запрос (Q): Редкий технический термин.
  2. Пользователь: Находится в Люксембурге.
  3. Анализ данных: Система обнаруживает, что из Люксембурга по этому запросу было всего 2 клика. Этого недостаточно для надежных выводов.
  4. Активация Сглаживания (μ): Система активирует Smoothing Factor. Она будет больше полагаться на глобальные данные о кликах или данные более широкой популяции (например, «Европа»).
  5. Результат: Выдача для пользователя из Люксембурга будет близка к глобальной выдаче, а не основана на случайных 2 кликах.

Вопросы и ответы

Что такое "Популяция" в контексте этого патента?

Популяция — это любая идентифицируемая группа пользователей, объединенная общими признаками. Чаще всего это географическое положение (страна, город) или язык. Однако патент также упоминает демографические данные (возраст, пол), общие интересы и даже технические параметры, такие как интернет-провайдер. Система стремится определить группу, к которой принадлежит пользователь, чтобы адаптировать выдачу.

Как Google определяет, к какой популяции я принадлежу?

Используется комбинация методов. Основные — это автоматически собираемые данные (Automatic-identification data), такие как ваш IP-адрес (для определения местоположения), язык и версия браузера, а также доменная зона (например, google.fr). Также используются данные, которые вы предоставляете сами (Self-identification data), например, настройки языка в аккаунте Google или указанное местоположение.

Что такое Коэффициент Сглаживания (μ) и зачем он нужен?

Коэффициент Сглаживания (μ) — это механизм защиты от ненадежных данных при их нехватке (Data Sparsity). Если по запросу было всего несколько кликов от пользователей из маленькой популяции, система не может уверенно судить о предпочтениях всей группы. μ определяет, насколько система должна "сгладить" эти данные, опираясь на более надежную глобальную статистику.

Означает ли этот патент, что CTR является фактором ранжирования?

Да, в контексте этого патента Clickthrough Data (данные о выборе, включая клики) напрямую используется для расчета Population Signal, который влияет на Ranking Score. Это подтверждает использование поведенческих данных для оценки качества и релевантности, но важно понимать, что учитывается не глобальный CTR, а CTR конкретной популяции, к которой принадлежит пользователь.

Как это влияет на международное SEO?

Это имеет критическое значение. Нельзя предполагать, что глобально успешный контент будет успешен везде. Для успеха на конкретном рынке (в конкретной популяции) необходимо, чтобы контент нравился именно местной аудитории и стимулировал взаимодействие. Это требует глубокой локализации контента и понимания местного интента, а не только перевода.

Может ли сайт с меньшим количеством ссылок обогнать авторитетный сайт благодаря этому механизму?

Да, это возможно в рамках конкретной популяции. Если менее авторитетный сайт лучше отвечает на интент определенной группы пользователей (например, локальный бизнес в конкретном городе) и собирает значительно больше кликов от этой группы, его Population Signal может быть достаточно высоким, чтобы компенсировать отставание по другим факторам ранжирования для этой конкретной аудитории.

Что делать, если данных по моей узкой нише или региону мало?

В этом случае активируется механизм сглаживания (μ). Система будет больше полагаться на данные более широких популяций (например, данные по стране вместо города) или на глобальные данные о кликах. Также будут иметь больший вес другие факторы ранжирования, не связанные с поведением популяции.

Влияет ли этот механизм только на локальный поиск?

Нет, он влияет шире. Популяции могут определяться не только по географии, но и по языку, демографическим признакам (возраст, пол) или общим интересам. Например, предпочтения пользователей определенного возраста могут отличаться от предпочтений других возрастных групп по информационным или коммерческим запросам, и система это учтет.

Как система обрабатывает пользователей, принадлежащих к нескольким популяциям?

Патент упоминает (Claim 20), что система может идентифицировать несколько групп популяции, связанных с пользователем, и использовать их данные при расчете Population Signal. Например, пользователь может быть идентифицирован как "франкоговорящий" (Популяция 1) и "находящийся в Канаде" (Популяция 2). Система может взвешивать данные обеих популяций.

Насколько актуальны формулы расчета сигнала, приведенные в патенте?

Патент подан в 2003 году. Конкретные математические формулы, вероятно, устарели и были заменены более сложными моделями машинного обучения. Однако сами принципы — использование сегментированных поведенческих данных и механизм статистического сглаживания при нехватке данных — остаются фундаментальными для работы современных поисковых систем.

Похожие патенты

Как Google приоритизирует локальное поведение пользователей над глобальной популярностью в международном поиске
Google использует систему для корректировки поискового ранжирования на основе местоположения и языка пользователя. Система приоритизирует данные о кликах от конкретной популяции пользователей (например, страны) над более широкими популяциями (например, глобальными данными). Глобальные сигналы популярности «понижаются» в весе, чтобы гарантировать более высокое ранжирование локально релевантных результатов, даже если они менее популярны в мировом масштабе.
  • US8694511B1
  • 2014-04-08
  • Local SEO

  • Поведенческие сигналы

  • SERP

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя
Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.
  • US9443022B2
  • 2016-09-13
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.
  • US20240378237A1
  • 2024-11-14
  • Мультимедиа

  • EEAT и качество

  • Семантика и интент

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google автоматически добавляет текст существующих объявлений к сайтлинкам (Sitelinks) для повышения CTR
Google использует систему для автоматического улучшения сайтлинков в рекламных объявлениях. Система анализирует существующие текстовые объявления (креативы) рекламодателя и определяет их конечные целевые страницы, игнорируя параметры отслеживания. Затем она сопоставляет их с URL сайтлинков и добавляет наиболее релевантный и эффективный текст креатива к сайтлинку для повышения кликабельности (CTR).
  • US10650066B2
  • 2020-05-12
  • Ссылки

  • SERP

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

seohardcore