SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования

RANKING SEARCH RESULT DOCUMENTS BASED ON USER ATTRIBUTES (Ранжирование документов в результатах поиска на основе атрибутов пользователя)
  • US9436742B1
  • Google LLC
  • 2014-03-14
  • 2016-09-06
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.

Описание

Какую проблему решает

Патент решает задачу повышения релевантности поисковой выдачи путем ее персонализации на основе атрибутов пользователя. Стандартное ранжирование может не учитывать специфические предпочтения различных групп пользователей. Изобретение позволяет системе определить, какие документы предпочитают (или избегают) пользователи с определенными характеристиками (интересами, демографией и т.д.), и использовать эту информацию для корректировки выдачи для конкретного пользователя, принадлежащего к этим группам.

Что запатентовано

Запатентована система для расчета и применения показателей предвзятости (Bias Measures) документов по отношению к атрибутам пользователей (User Attributes). Система определяет, насколько поведение группы пользователей с определенным атрибутом отличается от поведения общей массы пользователей при взаимодействии с конкретным документом. Эти показатели рассчитываются заранее (офлайн) и затем используются в реальном времени для персонализации ранжирования путем сравнения атрибутов пользователя, выполняющего поиск, с атрибутами, связанными с документами.

Как это работает

Система работает в три этапа:

  • Определение атрибутов пользователя: Анализируется история взаимодействий пользователя с документами. Атрибуты этих документов (например, темы, сущности, URL) ассоциируются с пользователем.
  • Расчет показателей предвзятости (Офлайн): Для документа и атрибута система сравнивает частоту взаимодействий с этим документом среди пользователей, имеющих этот атрибут, с частотой взаимодействий среди всех пользователей. Результатом является Bias Measure, показывающий "лифт" (положительная предвзятость) или "падение" (отрицательная предвзятость) интереса.
  • Ранжирование (В реальном времени): Когда пользователь выполняет поиск, система сопоставляет его атрибуты с атрибутами документов-кандидатов. Соответствующие Bias Measures агрегируются в Overall Bias Measure, который используется для корректировки ранжирования (повышения или понижения) документа.

Актуальность для SEO

Высокая. Персонализация и понимание намерений пользователя на основе его контекста и истории являются ключевыми направлениями развития поиска. Использование агрегированных данных о поведении пользователей для корректировки ранжирования остается фундаментальной техникой. Описанный механизм обеспечивает способ измерения предпочтений аудитории, что напрямую связано с концепциями удовлетворенности пользователя и релевантности контента.

Важность для SEO

Влияние на SEO высокое (8/10). Патент описывает конкретный механизм персонализации, основанный на поведении аудитории. Это подчеркивает, что для успешного SEO недостаточно оптимизировать контент только под ключевые слова; критически важно понимать целевую аудиторию сайта (User Attributes) и максимизировать ее вовлеченность (Indicated Interactions). Сайты, которые четко нацелены на определенный сегмент пользователей и хорошо удовлетворяют его потребности, получат преимущество в ранжировании для этого сегмента.

Детальный разбор

Термины и определения

User Attribute (Атрибут пользователя)
Характеристика, связанная с пользователем. Может включать интересы, темы, демографические данные, принадлежность к определенным кластерам сайтов или даже конкретные URL, с которыми пользователь часто взаимодействовал. Определяется на основе истории взаимодействий пользователя.
Bias Measure (Показатель предвзятости)
Метрика, связанная с конкретным документом и конкретным атрибутом пользователя. Она указывает на вероятность взаимодействия с документом пользователями, обладающими этим атрибутом, по сравнению с общей популяцией пользователей. Высокий показатель означает положительную предвзятость (группа предпочитает документ), низкий — отрицательную.
Overall Bias Measure (Общий показатель предвзятости)
Агрегированная оценка для документа, рассчитанная на основе нескольких Bias Measures, соответствующих атрибутам пользователя, выполняющего поиск.
Indicated Interactions (Зафиксированные взаимодействия)
Действия пользователей с документами (клики в поиске, посещения через браузер, взаимодействия в приложениях). Эти данные собираются в Indicated Interactions Database.
Navigational Measure (Навигационный показатель)
Метрика, зависящая от запроса, указывающая на частоту выбора документа для конкретного поискового запроса (например, CTR по запросу). Используется как фактор балансировки для предотвращения чрезмерной персонализации.
Document Attributes Engine
Компонент системы, отвечающий за офлайн-расчет Bias Measures для документов.
User Attributes Engine
Компонент системы, отвечающий за определение User Attributes на основе истории взаимодействий.
Document Bias Module
Компонент Ranking Engine, отвечающий за расчет Overall Bias Measure и корректировку ранжирования в реальном времени.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает процесс ранжирования в реальном времени с использованием атрибутов пользователя.

  1. Система идентифицирует документы, релевантные запросу пользователя.
  2. Идентифицируются атрибуты (User Attributes) этого пользователя.
  3. Для данного документа определяется набор атрибутов пользователя, которые также связаны с этим документом (сопоставление).
  4. Для каждого сопоставленного атрибута извлекается Bias Measure документа.
  5. Ключевой механизм расчета Bias Measure: Показатель основан на сравнении (А) количества взаимодействий с документом пользователями, имеющими этот атрибут, и (Б) количества взаимодействий с документом второй группой пользователей (включающей тех, у кого нет этого атрибута, например, общая популяция).
  6. Ключевое условие: Эти взаимодействия включают взаимодействия с документом независимо от запроса (independent of the query).
  7. Рассчитывается Overall Bias Measure для документа на основе отдельных Bias Measures.
  8. Ранжирование документа определяется на основе Overall Bias Measure.

Claim 12 (Независимый пункт): Описывает офлайн-процесс вычисления Bias Measure для документа.

  1. Идентифицируется атрибут пользователя и документ.
  2. Идентифицируются взаимодействия с документом первой группы пользователей (имеющих атрибут). Взаимодействия происходят в ответ на более чем один запрос.
  3. Идентифицируются взаимодействия с документом второй группы пользователей (включая тех, у кого нет атрибута). Также в ответ на более чем один запрос.
  4. Определяется Bias Measure путем сравнения взаимодействий первой и второй групп.
  5. Детализация расчета: Расчет включает сравнение: (A) Количества взаимодействий с данным документом первой группой по отношению к общему количеству взаимодействий первой группы (со всеми документами); и (B) Количества взаимодействий с данным документом второй группой по отношению к общему количеству взаимодействий второй группы (со всеми документами).
  6. Bias Measure ассоциируется с документом и атрибутом.

Claim 5, 6, 8, 9 (Зависимые): Детализируют механизм корректировки ранжирования.

Ранжирование документа может определяться путем сравнения его Overall Bias Measure с Overall Bias Measure другого документа (Claim 5, 6). Кроме того, решение о корректировке ранжирования может также основываться на Navigational Measure (зависящий от запроса показатель, например, CTR) как текущего документа, так и другого документа (Claim 8, 9). Это служит механизмом безопасности, чтобы персонализация не перекрывала сильные сигналы релевантности запросу.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя предварительно обработанные данные для финальной корректировки выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна предварительно рассчитать и сохранить Bias Measures для документов. Document Attributes Engine анализирует данные о взаимодействиях и атрибутах пользователей офлайн и сохраняет результаты в Document Attributes and Bias Measures Database. Эти данные могут быть включены в основной индекс или связаны с ним.

QUNDERSTANDING – Понимание Запросов / Обработка пользователя
Система (User Attributes Engine) анализирует историю взаимодействий пользователя для определения его User Attributes. Эти данные хранятся в User Attributes Database и извлекаются при обработке запроса для понимания контекста пользователя.

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента происходит на финальных стадиях ранжирования или на этапе переранжирования.

  1. Начальное ранжирование: Ranking Engine определяет начальный набор результатов и их scores.
  2. Персонализация: Document Bias Module извлекает атрибуты пользователя.
  3. Расчет предвзятости: Для документов-кандидатов модуль сопоставляет атрибуты пользователя с атрибутами документа и рассчитывает Overall Bias Measure.
  4. Корректировка: Ранжирование корректируется (повышается или понижается) на основе Overall Bias Measure, потенциально с учетом Navigational Measures.

Входные данные:

  • Запрос пользователя.
  • Идентификатор пользователя (для извлечения User Attributes).
  • Начальный набор результатов поиска.
  • Document Attributes and Bias Measures Database (данные о предвзятости документов).
  • Navigational Measures (данные о кликах по запросу).

Выходные данные:

  • Переранжированный (персонализированный) набор результатов поиска.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на широкие или неоднозначные запросы, где стандартных сигналов релевантности недостаточно для определения наилучшего результата, и предпочтения пользователя могут служить сильным дифференциатором.
  • Контентные факторы: Влияет на все типы контента, для которых можно определить атрибуты (темы, сущности) и собрать статистику взаимодействий.
  • Конкретные ниши или тематики: Сильное влияние в тематиках, связанных с интересами, хобби, стилем жизни, где предпочтения пользователей сильно варьируются (например, рецепты, обзоры техники, путешествия).

Когда применяется

Алгоритм применяется при обработке поискового запроса, если выполнены следующие условия:

  • Наличие данных о пользователе: Система смогла идентифицировать пользователя и извлечь его User Attributes (т.е. пользователь залогинен или идентифицирован иным способом, и у него есть история взаимодействий).
  • Наличие данных о документах: Для документов в выдаче предварительно рассчитаны Bias Measures.
  • Сопоставление атрибутов: Существует пересечение между атрибутами пользователя и атрибутами, связанными с документами в выдаче.
  • Условия корректировки: Overall Bias Measure достаточно силен для изменения ранжирования. Корректировка может быть активирована, только если разница в Overall Bias Measure между двумя документами превышает порог, и/или если Navigational Measures (сигналы, зависящие от запроса) не противоречат изменению порядка.

Пошаговый алгоритм

Процесс состоит из трех основных частей: определение атрибутов пользователя, офлайн-расчет показателей предвзятости и ранжирование в реальном времени.

Процесс А: Определение Атрибутов Пользователя (User Attributes)

  1. Сбор взаимодействий: Идентификация набора документов, с которыми взаимодействовал пользователь (из Indicated Interactions Database). Это могут быть клики в поиске, посещения сайтов и т.д.
  2. Идентификация атрибутов документов: Для каждого документа из набора определяются его атрибуты (например, темы, сущности, кластеры сайтов, URL).
  3. Ассоциация и взвешивание: Атрибуты документов ассоциируются с пользователем. Может быть рассчитан вес атрибута на основе частоты взаимодействий с документами, имеющими этот атрибут.
  4. Сохранение: Атрибуты и их веса сохраняются в профиле пользователя (User Attributes Database).

Процесс Б: Расчет показателей предвзятости (Bias Measures) (Офлайн)

  1. Идентификация Документа и Атрибута: Выбирается документ (D) и атрибут пользователя (A).
  2. Определение Группы 1: Идентификация пользователей, связанных с атрибутом A.
  3. Определение Группы 2: Идентификация более широкой группы пользователей (например, все пользователи).
  4. Сбор взаимодействий: Извлечение данных о взаимодействиях Группы 1 и Группы 2 с документом D. Важно, что эти взаимодействия агрегируются по многим различным запросам.
  5. Расчет показателей взаимодействия:
    1. Расчет частоты взаимодействия Группы 1 с D (нормализованной по общей активности Группы 1).
    2. Расчет частоты взаимодействия Группы 2 с D (нормализованной по общей активности Группы 2).
  6. Расчет Bias Measure: Сравнение частоты взаимодействия Группы 1 и Группы 2. (Например, деление показателя Группы 1 на показатель Группы 2 для определения "лифта").
  7. Фильтрация (Опционально): Сохранение только тех Bias Measures, которые демонстрируют значительную предвзятость (например, превышают порог или находятся за пределами стандартного отклонения).
  8. Сохранение: Ассоциация Bias Measure для атрибута A с документом D в Document Attributes and Bias Measures Database.

Процесс В: Ранжирование (В реальном времени)

  1. Получение запроса и атрибутов: Получение запроса от пользователя и извлечение его User Attributes.
  2. Начальное ранжирование: Идентификация документов, релевантных запросу.
  3. Сопоставление атрибутов: Для данного документа (D) определяется набор атрибутов пользователя, которые также связаны с D.
  4. Извлечение Bias Measures: Извлечение соответствующих Bias Measures для сопоставленных атрибутов.
  5. Расчет Overall Bias Measure: Агрегация отдельных Bias Measures (например, путем усреднения или взвешенного усреднения на основе весов атрибутов пользователя).
  6. Определение ранжирования: Корректировка позиции документа D на основе Overall Bias Measure.
    1. Сравнение (Опционально): Сравнение Overall Bias Measure документа D с показателем другого документа (D2).
    2. Балансировка (Опционально): Учет Navigational Measures (зависящих от запроса) для D и D2 перед применением корректировки.
    3. Применение: Повышение или понижение документа в выдаче.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые): Indicated Interactions. Это основа всего патента. Используются данные о том, какие пользователи с какими документами взаимодействовали. Включает клики в поиске, а также взаимодействия вне поиска (посещения через браузер, действия в приложениях). Важно, что для расчета Bias Measure используются взаимодействия, произошедшие в ответ на множество разных запросов (query-independent).
  • Контентные/Структурные факторы (Косвенно): Атрибуты документов (темы, сущности, кластеры сайтов), которые извлекаются из контента или структуры, используются для определения User Attributes.
  • Пользовательские факторы: User Attributes, извлеченные из истории поведения или предоставленные пользователем (например, демография, местоположение).

Какие метрики используются и как они считаются

  • Bias Measure (Показатель предвзятости): Рассчитывается для пары (Документ, Атрибут пользователя). Патент предлагает формулу, которая измеряет "лифт" интереса определенной группы к документу по сравнению с общим интересом.

    Пример формулы, описанной в патенте (Claim 12 и Description):

Выводы

  1. Персонализация через сегментацию аудитории: Google сегментирует пользователей по атрибутам (User Attributes), основанным на их поведении, и измеряет предпочтения этих сегментов (Bias Measures) по отношению к конкретным документам.
  2. Query-Independent Поведенческие сигналы: Bias Measures рассчитываются на основе взаимодействий, произошедших в ответ на множество разных запросов или даже вне поиска. Это означает, что общая вовлеченность аудитории сайта (посещения, время на сайте, повторные визиты) имеет значение, а не только CTR в конкретной поисковой выдаче.
  3. Измерение "Лифта" интереса: Формула Bias Measure специально разработана для измерения того, насколько *больше* или *меньше* определенная группа интересуется документом по сравнению со средним пользователем, с нормализацией по общей активности группы.
  4. Баланс между персонализацией и релевантностью запросу: Патент предусматривает использование Navigational Measures (сигналов, зависящих от запроса, таких как CTR) для ограничения влияния персонализации. Если документ имеет высокий Overall Bias Measure, но низкий Navigational Measure для данного запроса (и наоборот у конкурента), система может не применить повышение.
  5. Атрибуты основаны на контенте: User Attributes определяются через атрибуты контента, с которым взаимодействовал пользователь (темы, сущности, URL). Это подчеркивает важность четкого тематического позиционирования сайта.

Практика

Best practices (это мы делаем)

  • Фокус на целевой аудитории и ее вовлечении: Необходимо четко понимать, кто является целевой аудиторией сайта (какие у нее User Attributes) и создавать контент, который максимизирует ее взаимодействие. Сайты с высокой лояльностью и вовлеченностью определенного сегмента получат более высокие Bias Measures для этого сегмента.
  • Развитие Topical Authority и Четкое Позиционирование: Создавайте контент, который четко ассоциируется с определенными темами и сущностями. Это поможет Google корректно определять атрибуты вашего контента и, как следствие, атрибуты пользователей, которые его потребляют, что необходимо для работы механизма Bias Measure.
  • Стимулирование повторных взаимодействий (Query-Independent Signals): Поскольку Bias Measures учитывают взаимодействия независимо от запроса, работайте над повышением лояльности аудитории, стимулируйте прямые заходы, используйте email-рассылки и социальные сети для возврата пользователей.
  • Анализ аудитории в системах аналитики: Используйте инструменты аналитики для сегментации аудитории по интересам и поведению. Понимание того, какие сегменты показывают наибольшую вовлеченность (высокий Bias Measure) с вашим контентом, поможет скорректировать контент-стратегию.

Worst practices (это делать не надо)

  • Привлечение нецелевого трафика: Привлечение трафика из сегментов, которые плохо взаимодействуют с контентом (низкая вовлеченность, высокий Bounce Rate), может привести к формированию низких или отрицательных Bias Measures для этих сегментов, что ухудшит ранжирование сайта для них.
  • Игнорирование удовлетворенности пользователя (User Satisfaction): Фокус исключительно на привлечении клика (например, кликбейт) без последующего качественного взаимодействия приведет к низким показателям предвзятости.
  • Размытие тематики сайта ("Обо всем"): Создание контента на слишком разные темы может затруднить идентификацию четких User Attributes у аудитории и помешать формированию сильных положительных Bias Measures в конкретных нишах.

Стратегическое значение

Патент подтверждает важность анализа поведения пользователей на уровне сегментов аудитории. Стратегически, SEO смещается от чисто технической или контентной оптимизации к оптимизации пользовательского опыта (User Experience Optimization) и управлению вовлеченностью аудитории. Построение бренда и лояльной аудитории в определенной нише напрямую влияет на видимость сайта для этой аудитории через механизм Bias Measures. Это также объясняет, почему сайты с сильной лояльной аудиторией часто ранжируются лучше, даже если их контент слабее оптимизирован под конкретные ключевые слова.

Практические примеры

Сценарий: Персонализация выдачи для любителя походов

  1. Определение Атрибутов: Пользователь часто посещает сайты о походах, читает обзоры снаряжения и маршруты. Google присваивает ему User Attribute: "Интерес: Хайкинг" и "Интерес: Снаряжение для активного отдыха".
  2. Расчет Bias Measures (Офлайн): Google анализирует два сайта:
    • Сайт А (Общий спортивный магазин): Пользователи с атрибутом "Хайкинг" взаимодействуют с ним на 10% чаще, чем средний пользователь. Bias Measure = 1.1.
    • Сайт Б (Специализированный блог о походах): Пользователи с атрибутом "Хайкинг" взаимодействуют с ним в 3 раза чаще, чем средний пользователь. Bias Measure = 3.0.
  3. Поиск (В реальном времени): Пользователь ищет "лучшие треккинговые ботинки".
  4. Ранжирование: Изначально Сайт А ранжируется выше из-за общих факторов (например, PageRank).
  5. Корректировка: Система видит атрибут пользователя "Хайкинг". Она рассчитывает Overall Bias Measure. У Сайта Б он значительно выше (3.0 против 1.1).
  6. Результат: Система повышает Сайт Б в выдаче для этого конкретного пользователя, так как он демонстрирует сильную положительную предвзятость для его интересов.

Вопросы и ответы

Что такое "User Attribute" в контексте этого патента и как он определяется?

User Attribute — это характеристика пользователя, такая как интерес к определенной теме, сущности, демографический признак или даже предпочтение определенных сайтов (URL). В патенте основной способ определения атрибутов — это анализ истории взаимодействий пользователя. Если пользователь часто взаимодействует с документами на тему "Квантовая физика", ему будет присвоен соответствующий атрибут.

Что означает, что "Bias Measure" рассчитывается независимо от запроса (query-independent)?

Это означает, что при расчете Bias Measure система учитывает общее количество взаимодействий с документом, которые произошли в ответ на множество разных запросов или даже вне поисковой сессии. Это отличается от CTR по конкретному запросу. Это показатель общей привлекательности документа для определенной группы пользователей, а не его релевантности одному запросу.

Как именно рассчитывается "Bias Measure"? Что показывает эта метрика?

Bias Measure показывает, насколько чаще или реже группа пользователей с определенным атрибутом взаимодействует с документом по сравнению со всеми пользователями. Расчет включает нормализацию по общей активности обеих групп. Например, если любители джаза взаимодействуют с сайтом в 2 раза чаще, чем средний пользователь (с учетом их общей активности в сети), Bias Measure будет равен 2.0.

Может ли этот механизм сильно понизить мой сайт в выдаче?

Да. Если ваш сайт имеет отрицательный Bias Measure для определенного сегмента аудитории (т.е. эта группа взаимодействует с вашим сайтом значительно реже, чем в среднем), то при поиске пользователем из этого сегмента ваш сайт может быть понижен в выдаче в пользу сайтов с нейтральным или положительным показателем.

Как система предотвращает чрезмерную персонализацию, которая может навредить релевантности?

Патент описывает механизм балансировки с использованием Navigational Measures. Это сигналы, зависящие от запроса (например, CTR для конкретного запроса). Прежде чем повысить документ на основе высокого Overall Bias Measure (персонализация), система может проверить Navigational Measures этого документа и его конкурентов, чтобы убедиться, что изменение порядка не противоречит сильным сигналам релевантности запросу.

Как SEO-специалисту можно повлиять на "Bias Measure" своего сайта?

Необходимо сосредоточиться на повышении вовлеченности и удовлетворенности целевой аудитории. Четкое тематическое позиционирование помогает привлечь правильный сегмент, а качественный контент, хороший UX и решение задач пользователя стимулируют положительные взаимодействия. Работа над лояльностью аудитории и повторными визитами также критически важна.

Учитывает ли этот патент только клики в поиске Google?

Нет. В патенте указано, что Indicated Interactions могут включать взаимодействия через различные приложения, такие как браузер (например, прямые посещения), почтовые клиенты, социальные сети и т.д., при условии, что система имеет доступ к этим данным (с разрешения пользователя).

Что произойдет, если у пользователя нет истории поиска или он не залогинен?

Если система не может определить User Attributes пользователя, механизм персонализации, описанный в патенте, не будет активирован. В этом случае будет использоваться стандартное ранжирование, не учитывающее Overall Bias Measure.

Имеет ли значение разнообразие трафика для этого алгоритма?

Да, но в специфическом ключе. Привлечение разнообразного трафика, который плохо конвертируется или не вовлекается, может навредить, создав отрицательные Bias Measures для этих сегментов. Стратегически выгоднее сосредоточиться на привлечении и глубоком вовлечении узкой целевой аудитории, формируя сильные положительные Bias Measures для нее.

Как этот патент связан с E-E-A-T?

Прямой связи в тексте нет, но есть концептуальная. Сайты, демонстрирующие E-E-A-T, как правило, лучше удовлетворяют потребности своей целевой аудитории и генерируют более сильные сигналы вовлеченности. Это приводит к более высоким Bias Measures. Если авторитетный сайт постоянно удовлетворяет запросы определенного сегмента пользователей, этот механизм усиливает его позиции для этого сегмента.

Похожие патенты

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков
Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.
  • US10394832B2
  • 2019-08-27
  • Поведенческие сигналы

  • Персонализация

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google персонализирует выдачу, понижая результаты, которые пользователь исторически игнорирует или быстро покидает
Google использует историю поиска пользователя для выявления результатов, которые пользователь систематически пропускает или считает нерелевантными (например, быстро возвращается на выдачу). Такие результаты идентифицируются как «нежелательные» (User-Disfavored) и активно понижаются в персональной выдаче для этого пользователя, даже если их общий рейтинг высок.
  • US7827170B1
  • 2010-11-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации
Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).
  • US8645393B1
  • 2014-02-04
  • Персонализация

  • Семантика и интент

  • SERP

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google классифицирует запросы как навигационные или исследовательские, чтобы регулировать количество показываемых результатов
Google использует систему для динамического определения количества отображаемых результатов поиска. Система классифицирует запрос как навигационный (поиск конкретного места/ресурса) или исследовательский (поиск вариантов). Классификация основана на анализе компонентов оценки релевантности (совпадение по названию vs. категории) и энтропии исторических кликов. При навигационном интенте количество результатов сокращается.
  • US9015152B1
  • 2015-04-21
  • Семантика и интент

  • Поведенческие сигналы

  • Local SEO

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
  • US9098582B1
  • 2015-08-04
  • Ссылки

  • Мультиязычность

  • Семантика и интент

seohardcore