SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи

RECENT INTEREST BASED RELEVANCE SCORING (Оценка релевантности на основе недавних интересов)
  • US8972391B1
  • Google LLC
  • 2009-10-02
  • 2015-03-03
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).

Описание

Какую проблему решает

Патент решает проблему статической релевантности, когда стандартные алгоритмы не учитывают сиюминутный контекст или краткосрочные намерения пользователя в рамках текущей поисковой сессии (activity period). Это особенно важно для неоднозначных запросов. Изобретение позволяет динамически адаптировать выдачу, основываясь на недавней активности пользователя, чтобы лучше соответствовать его текущим информационным потребностям.

Что запатентовано

Запатентована система персонализации поиска, которая определяет краткосрочную категорию интереса (short-term category of interest) пользователя на основе его недавней активности. Для текущего запроса система сравнивает статистику кликов двух групп: пользователей с аналогичным краткосрочным интересом и общей популяции. Если поведение статистически значимо отличается, оценки релевантности (Relevance Scores) корректируются для текущего пользователя.

Как это работает

Механизм работает в двух режимах:

  • Офлайн (Анализ данных): Система анализирует исторические логи сессий, определяет категории интересов и вычисляет две ключевые метрики для связки Запрос-Документ: Category Click Fraction (как часто кликают пользователи с определенным интересом) и General Click Fraction (как часто кликают все). Клики взвешиваются по времени взаимодействия (Dwell Time). Затем вычисляется Category Relevance – разница между этими показателями.
  • Онлайн (Обработка запроса): Когда пользователь вводит запрос, система определяет его текущую категорию интереса по недавней активности. Затем она использует предварительно рассчитанные Category Relevance Scores для переранжирования стандартных результатов, если разница в поведении превышает установленный порог.

Актуальность для SEO

Высокая. Понимание контекста сессии (Task-based search) и персонализация выдачи являются ключевыми направлениями развития поиска в 2025 году. Этот патент описывает конкретный механизм использования сегментированных поведенческих данных (включая Dwell Time) для переранжирования в реальном времени, что остается критически важным для улучшения пользовательского опыта.

Важность для SEO

Патент имеет высокое значение (85/100). Он демонстрирует, что релевантность динамична и зависит от контекста сессии. Он подтверждает важность поведенческих факторов, в частности, сегментированного CTR и Dwell Time (Claim 3). Для SEO это означает необходимость оптимизации под конкретные сценарии использования (User Journeys) и задачи пользователя, а не только под изолированные запросы.

Детальный разбор

Термины и определения

Activity Period / Recent Search Activity Period (Период активности)
Временное окно (например, последние 30 минут, 2 часа) или поисковая сессия, в течение которого анализируется активность пользователя для определения его краткосрочных интересов.
Category Click Fraction / Category Selection Value (Доля кликов по категории)
Метрика, показывающая частоту выбора (CTR) конкретного результата по запросу пользователями, имеющими определенную Category of Interest.
General Click Fraction / General Selection Value (Общая доля кликов)
Метрика, показывающая частоту выбора (CTR) конкретного результата по запросу общей популяцией пользователей.
Category Relevance (Релевантность категории)
Мера разницы между Category Click Fraction и General Click Fraction.
Category Relevance Score (Оценка релевантности категории)
Оценка, основанная на Category Relevance, используемая для корректировки базового IR Score.
Dwell Time (Время взаимодействия)
Время, проведенное пользователем на просмотре документа после клика. Используется как весовой коэффициент для кликов (Claim 3).
Interest Identifier (Идентификатор интересов)
Компонент системы, определяющий краткосрочную категорию интереса пользователя на основе его недавней активности.
IR Score (Query Specific Score)
Базовая оценка релевантности документа запросу до применения персонализации.
Selection Counts (Счетчики выборов)
Количество кликов на результат. Взвешиваются по Dwell Time.
Short-term Category of Interest (Краткосрочная категория интереса)
Тема или задача, которой пользователь интересуется в данный момент.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод персонализации ранжирования.

  1. Система анализирует недавнюю поисковую активность пользователя для определения краткосрочной Category of Interest. Анализ включает сравнение введенных запросов с категориями выбранных результатов.
  2. Получается набор результатов для текущего запроса с исходными оценками.
  3. Для каждого результата вычисляются:
    • Category selection value (Доля кликов пользователей с этим интересом).
    • General selection value (Доля кликов всех пользователей).
    • Category relevance (Разница между первыми двумя показателями).
  4. Выбираются результаты, у которых Category relevance превышает порог (threshold).
  5. Оценки выбранных результатов корректируются.
  6. Производится финальное ранжирование на основе скорректированных оценок.

Claim 3 (Зависимый): Детализирует подсчет кликов.

Каждый клик (selection) взвешивается (weighted) на основе веса, зависящего от количества времени, которое пользователь провел за просмотром документа (Dwell Time). Это критически важное уточнение: система ценит "длинные клики" выше, чем "короткие".

Claim 5 и 6 (Зависимые): Описывают механизм корректировки оценки.

Корректировка происходит путем комбинирования Category relevance с базовой оценкой (Information Retrieval score). Комбинирование может осуществляться путем сложения или умножения этих оценок.

Claim 7 и 8 (Зависимые): Уточняют определение интереса.

Определение Category of Interest может учитывать специфическую информацию о пользователе, например, демографические данные или местоположение.

Где и как применяется

Изобретение требует как предварительных вычислений (офлайн), так и обработки в реальном времени (онлайн).

INDEXING / Поведенческий анализ (Офлайн)
Система непрерывно анализирует исторические логи поисковых сессий (Result Selection Logs). На этом этапе происходит:

  1. Определение и классификация категорий интересов.
  2. Расчет взвешенных по Dwell Time кликов.
  3. Вычисление Category Click Fraction и General Click Fraction для миллионов комбинаций Запрос-Документ-Категория.
  4. Вычисление и кэширование Category Relevance Scores.

QUNDERSTANDING – Понимание Запросов (Онлайн)
В реальном времени Interest Identifier анализирует текущую сессию пользователя (недавние запросы и клики), чтобы на лету определить его Short-term Category of Interest.

RERANKING – Переранжирование (Онлайн)
Основное применение патента. После того как стандартный RANKING сгенерировал результаты (с IR Scores) и QUNDERSTANDING определил категорию интереса:

  1. Rank Modifier Engine извлекает предварительно рассчитанные Category Relevance Scores.
  2. Применяет эти оценки к базовым IR Scores для генерации Adjusted Scores (только если порог значимости превышен).
  3. Происходит финальная сортировка результатов.

Входные данные (Онлайн):

  • Текущий запрос и данные о сессии пользователя.
  • Базовый набор результатов с их IR Scores.
  • База данных предварительно рассчитанных Category Relevance Scores.

Выходные данные (Онлайн):

  • Персонализированный набор результатов поиска со скорректированными оценками.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные запросы (например, "Java", "Apple", "Anderson"), где контекст сессии помогает разрешить неоднозначность и определить текущий интент.
  • Пользовательские пути (User Journeys): Влияет на сессии, требующие серии связанных запросов для выполнения задачи (исследование продукта, планирование, обучение).

Когда применяется

  • Условие 1 (Определение интереса): Система смогла надежно определить краткосрочную категорию интереса пользователя на основе его недавней активности.
  • Условие 2 (Наличие данных): Существует достаточно исторических данных о поведении других пользователей по данному запросу и данной категории интереса.
  • Триггер активации (Порог): Разница между Category Click Fraction и General Click Fraction превышает установленный порог (является статистически значимой).

Пошаговый алгоритм

Процесс А: Офлайн-вычисление оценок релевантности (на основе исторических данных)

  1. Сбор данных: Сохранение логов активности (запросы, клики, время взаимодействия/Dwell Time).
  2. Идентификация интересов: Анализ логов для определения категорий интересов на основе шаблонов сессий.
  3. Подсчет кликов: Определение количества выборов (Selection Counts) для каждой комбинации Запрос-Документ-Категория. Клики взвешиваются по Dwell Time.
  4. Расчет Category Click Fraction (CCF).
  5. Расчет General Click Fraction (GCF).
  6. Расчет Category Relevance: Определение разницы между CCF и GCF.
  7. Проверка значимости: Определение, превышает ли Category Relevance установленный порог.
  8. Сохранение оценки: Если порог превышен, сохранение Category Relevance Score в кэше.

Процесс Б: Онлайн-обработка запроса (в реальном времени)

  1. Анализ активности пользователя: Просмотр недавней активности текущего пользователя (в рамках сессии).
  2. Определение интереса: Идентификация Short-term Category of Interest пользователя.
  3. Получение запроса и ресурсов: Получение текущего запроса и базовых результатов с IR Scores.
  4. Извлечение оценок: Получение предварительно рассчитанных (в Процессе А) Category Relevance Scores.
  5. Корректировка ранжирования: Вычисление Adjusted Scores путем комбинирования (сложения или умножения) базовых IR Scores и Category Relevance Scores.
  6. Предоставление результатов: Ранжирование ресурсов на основе скорректированных оценок.

Какие данные и как использует

Данные на входе

Патент фокусируется почти исключительно на поведенческих данных для реализации механизма персонализации.

  • Поведенческие факторы:
    • Последовательности запросов (Query Sequences): Используются для определения контекста сессии и категории интереса.
    • Клики (Selections/Clicks): Основные данные для расчета Click Fractions.
    • Время взаимодействия (Dwell Time): Критически важный фактор. Используется как весовой коэффициент для кликов (Claim 3). Долгие клики ценятся выше коротких.
  • Пользовательские факторы: История пользователя в рамках текущей сессии. Также упоминается возможность использования демографических данных, местоположения и языка для уточнения категории интереса (Claim 7, 8).

Какие метрики используются и как они считаются

  • Weighted Selection Counts (Взвешенные счетчики выборов): Подсчет кликов, где каждый клик взвешен по Dwell Time.
  • Category Click Fraction (CCF):

Выводы

  1. Контекст сессии как ключевой фактор персонализации: Google активно использует недавнюю историю поиска пользователя для динамического переранжирования результатов. Ранжирование адаптируется к текущей задаче пользователя (short-term category of interest).
  2. Сегментированный анализ поведенческих факторов: Система не полагается на общий CTR. Она сравнивает поведение узкого сегмента пользователей (с тем же интересом) с общим поведением. Повышение получают результаты, которые диспропорционально предпочитает целевой сегмент.
  3. Dwell Time как мера качества клика: Критически важный вывод (Claim 3): клики взвешиваются по времени взаимодействия с контентом. Это прямое подтверждение того, что Google ценит удовлетворенность пользователя ("длинные клики") выше, чем просто факт перехода.
  4. Устранение неоднозначности: Этот механизм является мощным инструментом для разрешения неоднозначности запросов, используя контекст сессии для выбора правильного интента.
  5. Защита от шума (Thresholds): Корректировка происходит только при наличии статистически значимой разницы в поведении, что предотвращает случайные флуктуации в ранжировании.

Практика

Best practices (это мы делаем)

  • Оптимизация под удовлетворенность пользователя (Maximizing Dwell Time): Поскольку клики взвешиваются по времени взаимодействия (Claim 3), создание контента, который полностью отвечает на интент и удерживает внимание, критически важно. Работайте над качеством контента для минимизации быстрых возвратов на выдачу (pogo-sticking).
  • Оптимизация под задачи и сессии (Task-based Optimization): Проектируйте контент и структуру сайта для поддержки всего пути пользователя (User Journey). Понимайте контекст сессии: какие запросы пользователи вводят до и после взаимодействия с вашим контентом. Это поможет сайту стать предпочтительным выбором для определенной Category of Interest.
  • Повышение CTR для целевых сегментов: Оптимизируйте сниппеты (Title/Description) так, чтобы они были максимально привлекательными именно для пользователей, находящихся в релевантном контексте. Это повысит ваш Category Click Fraction.
  • Четкое таргетирование интента: При работе с неоднозначными запросами убедитесь, что ваш контент четко соответствует одному из возможных интентов. Если интерес пользователя совпадет с вашим интентом, вы получите значительное преимущество.

Worst practices (это делать не надо)

  • Использование кликбейта: Привлечение трафика обманчивыми заголовками приводит к коротким кликам. Такие клики получат низкий вес при расчете Selection Counts, что снизит эффективность поведенческих факторов и может привести к пессимизации для целевой аудитории.
  • Оптимизация только под изолированные запросы: Игнорирование контекста сессии. Страница может иметь хорошую релевантность изолированному запросу, но проигрывать в ранжировании, если она не соответствует текущей задаче пользователя.
  • Создание поверхностного или слишком общего контента: Контент, который не удовлетворяет информационную потребность, приведет к низкому Dwell Time. Слишком общий контент может не выделиться ни в одной конкретной Category of Interest.

Стратегическое значение

Патент подтверждает стратегический сдвиг от анализа изолированных запросов к пониманию поисковых задач и контекста сессии. Релевантность динамична. Для SEO это означает, что фокус должен быть направлен на глубокое удовлетворение информационных потребностей конкретных сегментов аудитории. Поведенческие сигналы, особенно Dwell Time, анализируются Google в гранулярном виде и используются для обучения систем персонализации. Способность сайта быть лучшим ответом в специфическом контексте становится ключевым фактором успеха.

Практические примеры

Сценарий 1: Уточнение неоднозначного запроса (Бизнес-школы)

  1. Недавняя активность: Пользователь искал "Harvard Business School" и "Kellogg".
  2. Определение интереса: Google определяет Category of Interest как "Бизнес-школы".
  3. Текущий запрос: Пользователь вводит "Anderson".
  4. Анализ данных: Google проверяет исторические данные:
    • Общая популяция (General Click Fraction) часто кликает на результаты, связанные с фамилией Андерсон или другими значениями.
    • Пользователи с интересом "Бизнес-школы" (Category Click Fraction) подавляюще часто кликают на "UCLA Anderson School of Management".
  5. Результат: Разница значительна. Google резко повышает в выдаче сайт UCLA Anderson для этого пользователя.

Сценарий 2: Планирование путешествия

  1. Недавняя активность: Пользователь ищет "Авиабилеты в Париж" и "Отели в Париже".
  2. Определение интереса: Category of Interest: "Путешествие в Париж".
  3. Текущий запрос: Пользователь вводит "Метро".
  4. Анализ данных: Пользователи с интересом "Путешествие в Париж" по запросу "Метро" чаще кликают на схему парижского метрополитена, чем на сайт магазина "Metro Cash & Carry".
  5. Результат: Сайт со схемой метро Парижа получает буст для этого пользователя.

Вопросы и ответы

Как система определяет «Категорию интереса» пользователя?

Система анализирует недавнюю активность пользователя (Recent Activity Period), например, в рамках текущей сессии. Она сравнивает введенные запросы и категории выбранных пользователем результатов (Claim 1). Если пользователь недавно искал «Harvard Business School» и «Kellogg», система может определить категорию интереса как «Бизнес-школы».

Подтверждает ли этот патент важность Dwell Time (времени на сайте)?

Да, критически важно. В Claim 3 прямо указано, что при подсчете кликов (Selection Counts) они взвешиваются на основе времени, которое пользователь провел на странице. Длинные клики получают больший вес, чем короткие (pogo-sticking). Это напрямую влияет на расчет Category Click Fraction и итоговую корректировку ранжирования.

Влияет ли общий CTR сайта на ранжирование по этому патенту?

Влияет, но косвенно. Важна не абсолютная кликабельность (General Click Fraction), а разница между CTR специфического сегмента (Category Click Fraction) и общим CTR. Если результат популярен у всех, но еще более популярен у целевого сегмента, он получит повышение. Если он одинаково популярен у всех, корректировки не будет.

Это долгосрочная или краткосрочная персонализация?

Это механизм краткосрочной персонализации. Он основан на недавних интересах и активности в рамках текущей сессии или короткого временного окна (например, 30 минут). Он предназначен для адаптации выдачи к текущей задаче пользователя, а не на основе его долгосрочного профиля.

Как этот патент влияет на оптимизацию под неоднозначные запросы?

Он имеет критическое значение. Для неоднозначных запросов (например, «Apple») недавняя активность (например, поиск «iPhone 16») предоставит контекст. Это позволит Google полностью изменить выдачу, отдав предпочтение результатам, соответствующим этому контексту (технологии), а не другим значениям (фрукты).

Что произойдет, если мой результат нравится общей аудитории, но не нравится целевому сегменту?

Это приведет к отрицательной Category Relevance (Category Click Fraction ниже General Click Fraction). Если пользователь будет идентифицирован как принадлежащий к этому целевому сегменту, ваш результат может быть понижен (демоутнут) в выдаче для него.

Что такое порог (Threshold) и как он работает?

Порог — это минимальная разница в поведении сегмента и общей массы, необходимая для активации переранжирования. Он защищает от шума и случайных флуктуаций. Если разница незначительна (например, статистически не значима), Google будет использовать стандартное ранжирование.

Как SEO-специалисту оптимизировать сайт под этот алгоритм?

Необходимо фокусироваться на оптимизации под задачи и сессии пользователя (User Journey). Создавайте контент, который максимально удовлетворяет интент и обеспечивает длительное время взаимодействия (Dwell Time). Улучшайте сниппеты для максимизации CTR именно среди целевого сегмента аудитории.

Вся ли работа алгоритма происходит в реальном времени?

Нет. Определение интереса пользователя и финальное переранжирование происходят в реальном времени. Однако расчет ключевых метрик (Click Fractions, Category Relevance Score) на основе анализа исторических логов происходит заранее в офлайн-режиме. В онлайне система извлекает эти готовые оценки.

Использует ли этот механизм данные о моем местоположении или демографии?

Да, патент упоминает (Claim 7, 8), что пользовательская информация, такая как демография или местоположение, может использоваться для дополнительного уточнения или определения категории интереса. Это позволяет сделать персонализацию еще более точной.

Похожие патенты

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует поведение в сессии (запросы и клики) для профилирования пользователей и персонализации выдачи на лету
Google анализирует действия пользователя в рамках текущей поисковой сессии, такие как специфическая терминология, орфография или клики по результатам, чтобы отнести его к определенной «Группе пользователей» (например, по профессии или демографии). Последующие результаты поиска переранжируются на основе того, что исторически популярно или непопупулярно в этой конкретной группе по сравнению с общей популяцией пользователей.
  • US8930351B1
  • 2015-01-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю запросов в текущей сессии и статистические паттерны для переранжирования результатов
Google анализирует миллионы прошлых поисковых сессий, выявляя статистически значимые последовательности запросов («Пути Запросов»), которые заканчиваются кликом на определенный URL («Конечная Точка Контента»). Когда текущая сессия пользователя совпадает с историческим путем, Google переранжирует результаты, повышая те URL, которые исторически удовлетворяли пользователей в аналогичном контексте, пропорционально вероятности их выбора.
  • US7610282B1
  • 2009-10-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует данные о закладках, сообществах и поведении пользователей для персонализации и контекстуализации поиска
Патент описывает раннюю систему персонализации поиска, которая собирает и анализирует закладки (content pointers) пользователей и групп, организованные в иерархические категории. Эта информация используется для создания профилей интересов (content vectors), которые затем применяются для дополнения поисковых запросов (query augmentation) и переранжирования результатов (contextualization) с учетом личного контекста, интересов сообщества и недавней активности пользователя.
  • US7031961B2
  • 2006-04-18
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google создает мгновенные интерактивные результаты на SERP, предварительно загружая и персонализируя скрытый контент
Google использует механизм для создания интерактивных блоков ответов (Answer Boxes), таких как Погода или Панели Знаний. Система отправляет пользователю не только видимый результат, но и дополнительный скрытый контент («карточки»), выбранный на основе истории взаимодействий пользователя. При взаимодействии с блоком (свайп или клик) дополнительный контент отображается мгновенно, без отправки нового запроса на сервер.
  • US9274683B2
  • 2016-03-01
  • SERP

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует социальные связи и анализ контекста рекомендаций (Endorsements) для персонализации поисковой выдачи
Google анализирует контент (например, посты в микроблогах и социальных сетях), созданный контактами пользователя. Система определяет, является ли ссылка в этом контенте "подтверждением" (Endorsement) на основе окружающих ключевых слов. Если да, то при поиске пользователя эти результаты могут быть аннотированы, указывая, кто из контактов и через какой сервис подтвердил результат, и потенциально повышены в ранжировании.
  • US9092529B1
  • 2015-07-28
  • Поведенческие сигналы

  • Персонализация

  • EEAT и качество

Как Google масштабирует расчет кратчайших путей в графе ссылок от авторитетных сайтов («Seed Nodes»)
Патент описывает инфраструктуру Google для распределенного вычисления кратчайших путей в огромных графах, таких как веб-граф. Система позволяет эффективно и отказоустойчиво рассчитывать расстояние от любого узла до ближайших авторитетных «Seed Nodes». Это foundational технология, которая делает возможным применение алгоритмов ранжирования, основанных на анализе ссылочного графа и распространении авторитетности (например, типа TrustRank) в масштабах всего интернета.
  • US8825646B1
  • 2014-09-02
  • Ссылки

Как Google анализирует текст вокруг ссылки (Rare Words) для борьбы со спамом и определения шаблонных ссылок
Google использует механизм для оценки качества ссылок, выходящий за рамки анкорного текста. Система анализирует редкие слова (rare words) в тексте, непосредственно окружающем ссылку, чтобы определить её уникальный контекст. Ранжирование улучшается при наличии разнообразия этих контекстов. Ссылки с повторяющимся контекстом (спам, Google-бомбинг или шаблонные/сквозные ссылки) идентифицируются и дисконтируются.
  • US8577893B1
  • 2013-11-05
  • Антиспам

  • Ссылки

  • Семантика и интент

Как Google использует контент вокруг ссылок (вне анкора) для генерации «Синтетического Описательного Текста» и ранжирования вашего сайта
Google может генерировать «Синтетический Описательный Текст» для страницы, анализируя контент и структуру сайтов, которые на нее ссылаются. Система создает структурные шаблоны для извлечения релевантного текста (например, заголовков или абзацев рядом со ссылкой), который затем используется как мощный сигнал ранжирования. Этот механизм позволяет лучше понять содержание страницы, особенно если традиционный анкорный текст низкого качества или отсутствует.
  • US9208233B1
  • 2015-12-08
  • Ссылки

  • Семантика и интент

  • Индексация

seohardcore