SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google дифференцирует и взвешивает поведенческие сигналы для персонализации рекомендаций контента

PERSONALIZED CONTENT-BASED RECOMMENDATION SYSTEM WITH BEHAVIOR-BASED LEARNING (Персонализированная система рекомендаций на основе контента с обучением на основе поведения)
  • US20170344572A1
  • Google LLC
  • 2009-01-29
  • 2017-11-30
  • Персонализация
  • Поведенческие сигналы
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для персонализации рекомендаций контента, анализируя характеристики документов (например, через TF-IDF) и создавая динамические профили интересов пользователей. Система обучается на основе поведения: разные типы взаимодействий (просмотр, печать, сохранение) по-разному влияют на профиль пользователя, а влияние этих поведенческих сигналов со временем ослабевает (Signal Decay).

Описание

Какую проблему решает

Патент решает проблему поиска релевантного контента в больших массивах документов (Corpus). Он предлагает улучшение по сравнению с системами, основанными на коллаборативной фильтрации (которые требуют больших объемов данных о взаимодействиях других пользователей). Основная задача — предоставить пользователю высоко персонализированные рекомендации на основе анализа самого контента и индивидуального поведения пользователя, что особенно эффективно во внутренних или специализированных системах.

Что запатентовано

Запатентована система рекомендаций, которая сопоставляет взвешенные характеристики документа (Document Features) с профилем интересов пользователя (User Profile). Ключевым элементом изобретения является механизм обучения на основе поведения (Behavior-Based Learning). Система дифференцированно обрабатывает различные типы взаимодействий пользователя с контентом (например, просмотр, печать, сохранение, лайк/дизлайк), присваивая им разный вес при обновлении профиля. Кроме того, влияние этих поведенческих сигналов на профиль пользователя со временем уменьшается (Interaction Aging/Decay).

Как это работает

Система функционирует в несколько этапов:

  • Извлечение характеристик: Документы анализируются для извлечения ключевых терминов (n-грамм), которым присваиваются веса, например, с помощью алгоритма TF-IDF.
  • Построение профиля: Создается профиль пользователя на основе явных интересов, связанных с ним документов (например, резюме) и демографических данных.
  • Оценка документов: Рассчитывается релевантность документов для пользователя путем сравнения вектора характеристик документа и вектора профиля пользователя (например, используя Cosine Similarity).
  • Корректировка оценок: Оценки могут быть скорректированы на основе внешних правил, например, для повышения свежего контента (Recency Bias).
  • Мониторинг и обучение: Система отслеживает, как пользователь взаимодействует с рекомендациями. Разные действия (например, печать против просмотра) приводят к разной степени обновления профиля. Вес старых взаимодействий уменьшается.

Актуальность для SEO

Средняя/Высокая. Концепции персонализации, дифференциации поведенческих сигналов и их затухания во времени (Signal Decay) являются фундаментальными для современных рекомендательных систем (включая Google Discover и News). Однако конкретные методы, упомянутые в патенте (TF-IDF, Cosine Similarity), значительно устарели по сравнению с современными нейросетевыми подходами (векторные эмбеддинги, трансформеры). Патент дает важное концептуальное понимание принципов, но не отражает текущую техническую реализацию.

Важность для SEO

Патент имеет значительное влияние на SEO-стратегии, ориентированные на рекомендательные системы, такие как Google Discover. Он показывает, что Google стремится измерять глубину вовлеченности, а не только факт клика. Для SEO-специалистов это подчеркивает важность создания контента, который стимулирует более значимые взаимодействия (сохранение, шеринг), и необходимость постоянного поддержания вовлеченности, так как влияние прошлых сигналов затухает.

Детальный разбор

Термины и определения

Behavior-Based Learning (Обучение на основе поведения)
Механизм, при котором система обновляет профиль пользователя на основе его взаимодействий с рекомендованным контентом.
Corpus (Корпус документов)
Определенная коллекция документов (например, статьи, технические презентации, события календаря).
Cosine Similarity (Косинусное сходство)
Метрика для расчета сходства между двумя векторами. В патенте используется для сравнения вектора профиля пользователя и вектора характеристик документа.
Document Features (Характеристики документа)
Набор терминов (слова и фразы, n-граммы), представляющих концепции документа, каждый из которых имеет связанный вес.
Interaction Aging/Decay (Старение/Затухание взаимодействия)
Механизм, при котором влияние взаимодействия пользователя на его профиль уменьшается с течением времени по мере старения этого взаимодействия (age increases).
Profile Features (Характеристики профиля)
Набор терминов с весами, представляющих области интересов пользователя.
TF-IDF (Term-Frequency/Inverse Document Frequency)
Алгоритм взвешивания терминов, используемый для определения важности слова в контексте документа и корпуса.
User Profile (Профиль пользователя)
Набор данных, описывающий интересы пользователя, используемый для персонализации рекомендаций.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод персонализированной рекомендации с обучением.

  1. Система определяет набор взвешенных характеристик (weighted features) для каждого документа и генерирует первую оценку.
  2. Система получает профиль пользователя, включающий явно указанные пользователем термины интереса.
  3. Первая оценка корректируется на основе корреляции между характеристиками документа и профилем пользователя.
  4. Рекомендации представляются пользователю.
  5. Система определяет различные взаимодействия пользователя (different user interactions) с документами.
  6. Профиль пользователя обновляется на основе этих взаимодействий. Здесь раскрываются два ключевых механизма:
  7. Механизм дифференциации: Первое взаимодействие (конкретно упоминаются: печать, сохранение, email, лайк или дизлайк), указывающее на первый уровень интереса, обновляет значение в профиле на величину, отличную от той, которую вызывает второе взаимодействие, указывающее на второй уровень интереса.
  8. Механизм затухания (Decay): Влияние взаимодействия на корректировку значения в профиле уменьшается с течением времени по мере увеличения возраста взаимодействия (age increases).
  9. Генерируется вторая оценка (рекомендация) на основе обновленного профиля.

Ядро изобретения — это сложный механизм обратной связи. Система не просто учитывает факт взаимодействия, а оценивает его качество (тип действия) и актуальность (возраст действия) для динамического обновления профиля интересов пользователя.

Claim 2, 3, 5, 6 (Зависимые): Детализируют источники данных для профиля пользователя. Профиль может быть определен из областей интересов, явно указанных интересов, интересов, выведенных из предыдущих выборов пользователя (или других пользователей), а также из связанных документов (резюме, бизнес-планы).

Claim 10 (Зависимый): Указывает на корректировку оценки на основе взвешивания времени между датой документа и заданной датой (механизм учета свежести).

Где и как применяется

Изобретение применяется в системах рекомендаций контента (например, Google Discover, Google News), а не в основном движке веб-поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе система анализирует документы корпуса и извлекает Document Features. В патенте для этого предлагается использовать TF-IDF для создания взвешенных векторов терминов для каждого документа. Эти данные сохраняются в репозитории характеристик документов.

QUNDERSTANDING – Понимание Запросов (и Профилей)
Система выполняет функцию понимания пользователя — построение и поддержание User Profile. Это происходит путем анализа исходных данных (явные интересы, демография) и постоянного обновления профиля на основе поведенческих данных (Behavior-Based Learning).

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Система рассчитывает Document Scores для пользователя.

  1. Расчет базовой релевантности: Вычисляется корреляция (например, Cosine Similarity) между вектором профиля пользователя и векторами документов.
  2. Корректировка оценок: Применяются правила для корректировки базовых оценок (например, повышение свежести, бустинг определенных типов документов).
  3. Финальное ранжирование: Документы сортируются по итоговым оценкам для предоставления рекомендаций.

Входные данные:

  • Векторы характеристик документов (Document Features).
  • Профиль пользователя (User Profile).
  • Данные о взаимодействиях пользователя (тип взаимодействия, время).
  • Правила корректировки оценок (например, параметры свежести).

Выходные данные:

  • Отсортированный список рекомендованных документов.
  • Обновленный профиль пользователя.

На что влияет

  • Типы контента и платформы: Наибольшее влияние оказывается на платформы, ориентированные на рекомендации и персонализацию (например, Google Discover, ленты новостей), а не на стандартное веб-ранжирование по явному запросу. Влияет на все типы контента, которые могут быть рекомендованы (статьи, видео, события).

Когда применяется

  • Условия применения: Алгоритм применяется, когда доступен профиль пользователя и система настроена на предоставление персонализированных рекомендаций.
  • Триггеры активации: Процесс рекомендации активируется при запросе пользователя (например, открытие ленты). Процесс обучения активируется при любом взаимодействии пользователя с контентом.
  • Временные рамки: Обучение происходит непрерывно. Механизм затухания (Signal Decay) гарантирует, что система адаптируется к изменяющимся интересам пользователя.

Пошаговый алгоритм

Фаза А: Генерация рекомендаций

  1. Получение профиля пользователя: Система загружает текущий User Profile (вектор интересов).
  2. Извлечение кандидатов: Отбираются документы из корпуса для оценки.
  3. Расчет базовой оценки (Scoring): Для каждого документа рассчитывается сходство между его вектором характеристик (TF-IDF) и профилем пользователя (например, с помощью Cosine Similarity).
  4. Корректировка оценок (Adjustment): Базовые оценки корректируются на основе заданных правил. Например, применяется бустинг за свежесть (упоминается возможность использования экспоненциального затухания exponential decay и периода полураспада документа document half-life) или бустинг за тип документа.
  5. Ранжирование и представление: Документы сортируются по итоговой оценке и представляются пользователю.

Фаза Б: Обучение на основе поведения (Learning Loop)

  1. Мониторинг взаимодействий: Система фиксирует действия пользователя с рекомендованным контентом.
  2. Классификация взаимодействия: Определяется тип действия (просмотр, печать, сохранение, email, лайк, дизлайк).
  3. Определение веса взаимодействия (Дифференциация): Каждому типу действия присваивается предопределенный вес (например, вес сохранения > веса просмотра).
  4. Обновление профиля пользователя: Характеристики (термины) из просмотренного документа добавляются в профиль пользователя или их вес увеличивается пропорционально весу взаимодействия.
  5. Применение затухания (Decay): Вес существующих характеристик в профиле пользователя, основанных на прошлых взаимодействиях, уменьшается с течением времени (Interaction Aging). Это гарантирует, что недавние взаимодействия имеют большее влияние.
  6. Обработка негативных сигналов: В случае явного неодобрения (дизлайк) вес соответствующих характеристик в профиле может быть уменьшен, а сам документ может быть исключен из будущих рекомендаций.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Полный текст документов. Используется для извлечения терминов (n-грамм) и расчета весов TF-IDF. Также используются метаданные, такие как теги.
  • Технические факторы: Дата создания или модификации документа (для учета свежести). Тип документа (может использоваться для специфического бустинга).
  • Поведенческие факторы: Ключевые данные для обучения. Система отслеживает различные типы взаимодействий: просмотр (viewing), печать (printing), сохранение (saving), отправка по email (emailing), явное одобрение (marking as favored) и явное неодобрение (marking as disfavored). Также фиксируется время взаимодействия.
  • Пользовательские факторы: Явно указанные интересы (ключевые слова). Документы, связанные с пользователем (например, резюме). Организационные данные (например, LDAP, отдел, должность) могут использоваться для инициализации профиля.

Какие метрики используются и как они считаются

  • TF-IDF: Стандартный расчет для определения веса характеристик документа.
  • Cosine Similarity: Стандартный расчет для определения сходства между профилем пользователя и документом.
  • Interaction Weights (Веса взаимодействий): Предопределенные значения, присваиваемые разным типам поведенческих сигналов. Патент утверждает, что разные действия имеют разный вес.
  • Signal Decay / Interaction Aging (Затухание сигнала / Старение взаимодействия): Функция, которая уменьшает влияние прошлых взаимодействий на текущий профиль пользователя с течением времени.
  • Recency Adjustment (Корректировка свежести): Функция для повышения оценок более новых документов, возможно с использованием экспоненциального затухания (exponential decay).

Выводы

  1. Дифференциация поведенческих сигналов: Ключевой вывод заключается в том, что не все взаимодействия пользователя с контентом оцениваются одинаково. Система явно различает действия, указывающие на высокий уровень интереса (печать, сохранение, лайк), и действия с низким уровнем интереса (просмотр). Это критически важно для понимания качества вовлеченности.
  2. Затухание сигналов (Signal Decay): Влияние поведенческих сигналов на персонализацию не является постоянным. Патент четко описывает механизм Interaction Aging, при котором старые взаимодействия теряют свою значимость. Это означает, что для поддержания видимости в персонализированных рекомендациях необходимо постоянное вовлечение.
  3. Динамические профили пользователей: Профили интересов постоянно обновляются на основе поведения с учетом дифференциации и затухания, что позволяет системе адаптироваться к изменениям в интересах пользователя.
  4. Многофакторное построение профиля: Система использует не только поведение, но и явные интересы, а также связанные данные (например, резюме, демографию) для построения профиля.
  5. Важность свежести контента: Патент предусматривает механизмы корректировки оценок для повышения более нового контента (Recency Adjustment).
  6. Концептуальная значимость устаревших методов: Хотя использование TF-IDF и Cosine Similarity устарело, базовая концепция сопоставления вектора контента с вектором профиля пользователя остается актуальной и сейчас реализуется с помощью нейросетевых эмбеддингов.

Практика

Best practices (это мы делаем)

  • Стимулирование глубокого вовлечения: Фокусируйтесь на качестве контента, который удовлетворяет интент пользователя настолько, чтобы стимулировать действия высокого уровня интереса (сохранение в закладки, шеринг, положительная обратная связь). Согласно патенту, эти действия имеют больший вес при обновлении профиля пользователя, чем простые просмотры.
  • Поддержание постоянной вовлеченности: Из-за механизма затухания сигналов (Signal Decay) нельзя полагаться на прошлые успехи. Необходимо регулярно публиковать контент и поддерживать вовлеченность аудитории, чтобы оставаться релевантными для их текущих профилей интересов.
  • Оптимизация свежести контента: Регулярно обновляйте контент. Патент явно упоминает механизмы корректировки оценок в пользу более свежих документов.
  • Оптимизация под Google Discover и персонализацию: Создавайте контент с четкой тематической направленностью. Это увеличивает вероятность совпадения характеристик контента с профилями интересов пользователей, что является основой для рекомендаций в этом патенте.

Worst practices (это делать не надо)

  • Кликбейт и оптимизация под просмотры: Стратегии, направленные только на получение клика (просмотра) без последующего вовлечения, менее эффективны. Система дифференцирует "просмотр" от более значимых взаимодействий.
  • Игнорирование негативной обратной связи: Патент учитывает явное неодобрение (marking as disfavored). Получение таких сигналов (например, "Не показывать контент с этого сайта" в Discover) может привести к исключению контента из рекомендаций пользователя.
  • Ставка на "вечнозеленый" контент без обновлений: Хотя вечнозеленый контент важен, игнорирование фактора свежести может привести к понижению в рекомендациях из-за Recency Adjustments и exponential decay.

Стратегическое значение

Патент подтверждает, что Google обладает сложными механизмами для интерпретации и взвешивания поведенческих данных для целей персонализации. Он демонстрирует переход от простых метрик (как CTR) к более глубокому пониманию качества взаимодействия. Для долгосрочной SEO-стратегии это означает, что построение лояльной аудитории и обеспечение устойчивого, высококачественного вовлечения являются ключевыми факторами успеха в персонализированных сервисах Google. Несмотря на устаревшие алгоритмы (TF-IDF), заложенные принципы дифференциации и затухания сигналов остаются критически важными.

Практические примеры

Сценарий: Оптимизация статьи для Google Discover

  1. Действие: SEO-специалист публикует глубокий анализ новой технологии. В статью добавляются элементы, стимулирующие сохранение (например, шпаргалки, ключевые выводы для скачивания) и шеринг.
  2. Взаимодействие пользователя: Пользователь находит статью в Discover, проводит на ней значительное время (учитывается как просмотр), а затем сохраняет шпаргалку (учитывается как сохранение).
  3. Работа системы (согласно патенту): Система фиксирует оба действия. "Сохранение" получает значительно больший вес, чем "Просмотр" (Дифференциация).
  4. Обновление профиля: Профиль интересов пользователя обновляется. Вес терминов, связанных с этой технологией и этим сайтом, значительно увеличивается.
  5. Затухание сигнала: В течение следующих недель влияние этого конкретного взаимодействия будет уменьшаться (Signal Decay). Если пользователь не будет продолжать взаимодействовать с подобным контентом, его профиль интересов изменится.
  6. Результат: В краткосрочной перспективе пользователь с большей вероятностью увидит контент с этого сайта по этой теме. В долгосрочной перспективе сайту необходимо продолжать публиковать вовлекающий контент, чтобы компенсировать затухание сигнала.

Вопросы и ответы

Описывает ли этот патент алгоритмы ранжирования Google Search?

Патент фокусируется на системах персонализированных рекомендаций (таких как Google Discover или News), а не на ранжировании общего веб-поиска по явному запросу. Он описывает, как контент предлагается пользователю на основе его профиля интересов, а не в ответ на конкретный запрос.

Какой самый важный инсайт для SEO в этом патенте?

Самый важный инсайт — это два механизма обработки поведенческих сигналов: Дифференциация и Затухание (Decay). Во-первых, не все взаимодействия равны (сохранение ценится выше просмотра). Во-вторых, влияние любого взаимодействия со временем уменьшается. Это требует стратегии постоянного и глубокого вовлечения аудитории.

Достаточно ли получать много кликов (CTR), чтобы система считала контент хорошим?

Нет, недостаточно. Патент явно указывает, что система различает разные типы взаимодействий и присваивает им разный вес. Действия, свидетельствующие о более высоком уровне интереса (печать, сохранение, шеринг, лайк), оказывают более сильное влияние на профиль пользователя, чем простой просмотр (который следует за кликом).

Как работает механизм затухания сигналов (Signal Decay)?

Механизм Interaction Aging уменьшает вес поведенческого сигнала с течением времени. Это означает, что недавнее поведение пользователя оказывает гораздо большее влияние на его текущие рекомендации, чем то, что он делал давно. Система адаптируется к меняющимся интересам, "забывая" старые паттерны поведения.

Google все еще использует TF-IDF и Cosine Similarity, как описано в патенте?

Маловероятно, что Google использует TF-IDF и Cosine Similarity в их классическом виде для таких задач в 2025 году. Эти методы были стандартом на момент подачи заявки (2009 год). Сегодня используются гораздо более сложные нейросетевые модели (например, Трансформеры) для создания векторных представлений (эмбеддингов) контента и профилей пользователей. Однако базовая концепция сопоставления этих векторов остается той же.

Какие конкретно типы взаимодействий отслеживает система?

В патенте явно упоминаются: просмотр (viewing), печать (printing), сохранение (saving), отправка по электронной почте (emailing), явное обозначение как понравившееся (explicitly marking as favored) и явное обозначение как не понравившееся (explicitly marking as disfavored).

Имеет ли значение свежесть контента для этой системы рекомендаций?

Да, имеет. Патент описывает механизм корректировки оценок (Score Adjustment), который может быть использован для смещения результатов в пользу более свежих документов. Упоминается возможность настройки "периода полураспада" документа для управления этим смещением.

Может ли негативная обратная связь от пользователей навредить сайту?

Да. Система учитывает сигналы явного неодобрения (explicitly marking as disfavored). Это может привести к удалению конкретного документа из рекомендаций пользователя и уменьшению веса связанных тем в его профиле. В контексте Google Discover это соответствует функции "Не показывать контент с сайта X".

Как система строит профиль пользователя?

Профиль строится из нескольких источников. Он инициализируется на основе явно указанных пользователем интересов, анализа связанных с ним документов (например, резюме) и даже демографических/организационных данных. В дальнейшем профиль динамически обновляется и уточняется на основе поведения пользователя.

Применяется ли этот алгоритм к новым пользователям?

Эффективность алгоритма для новых пользователей ниже, так как он в значительной степени полагается на накопленные поведенческие данные для обучения (Behavior-Based Learning). Однако система может использовать исходные данные (явные интересы или демографию) для создания начального профиля и быстро начать обучение по мере появления первых взаимодействий.

Похожие патенты

Как Google персонализирует, локализует и ранжирует новостной контент для Google News и Discover
Google использует систему для персонализации новостного контента, анализируя темы (используя Knowledge Graph), местоположения и даты публикации статей. Система создает динамические профили пользователей на основе истории чтения, применяя механизм «затухания» для устаревших интересов. Ранжирование учитывает релевантность, качество источника, популярность (количество просмотров) и свежесть контента.
  • US9569547B2
  • 2017-02-14
  • Персонализация

  • Свежесть контента

  • Knowledge Graph

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)
Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.
  • US8055655B1
  • 2011-11-08
  • Поведенческие сигналы

  • Персонализация

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков
Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.
  • US10394832B2
  • 2019-08-27
  • Поведенческие сигналы

  • Персонализация

Как Google использует тематические векторы, косинусное сходство и анализ когезии кластеров для автоматической классификации контента
Патент Google, описывающий технологию автоматической организации документов. Система создает тематическую сигнатуру документа (вектор тем и их весов) и сравнивает её с существующими наборами документов, используя Cosine Similarity. Затем вычисляется Оценка Уверенности на основе среднего сходства и однородности набора. Патент раскрывает фундаментальные механизмы Information Retrieval, которые Google использует для понимания семантики и оценки тематической когезии контента.
  • US8458194B1
  • 2013-06-04
  • Семантика и интент

Как Google вычисляет схожесть документов, используя значимость слов, их описательность и распознавание фраз
Google использует алгоритм для определения схожести документов, который превосходит традиционный TF-IDF. Система вычисляет Оценку Значимости (Prominence Score) и Оценку Описательности (Descriptiveness Score) для отдельных слов и фраз. Учитывается, где именно на странице расположены термины и насколько информативными они являются в целом. Это позволяет точнее определять релевантность и тематическую близость контента.
  • US7958136B1
  • 2011-06-07
  • Семантика и интент

Популярные патенты

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует генеративный ИИ для создания чата с конкретным сайтом прямо в поисковой выдаче и предоставления глубинных ссылок
Google патентует механизм, позволяющий пользователям взаимодействовать с конкретным результатом поиска через интерфейс чата (prompt input interface) прямо на странице выдачи. Искусственный интеллект анализирует запрос пользователя и его последующий промпт, определяет намерение (поиск информации, действие или навигация) и предоставляет глубинные ссылки (deep links) на конкретные внутренние страницы этого же домена в виде conversational response.
  • US12353458B2
  • 2025-07-08
  • Ссылки

  • Семантика и интент

  • SERP

Как Google использует свой индекс для автоматического обновления устаревших ссылок в закладках, истории поиска и на веб-страницах
Система Google поддерживает актуальность различных коллекций URL (закладки пользователей, история поиска, электронные письма), используя основной поисковый индекс как эталон канонических адресов. Если сохраненный URL устарел, система автоматически заменяет его на актуальную версию. Также описан механизм уведомления владельцев сайтов о неработающих исходящих ссылках.
  • US20130144836A1
  • 2013-06-06
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

seohardcore