SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует профили пользователей для персонализации и изменения порядка показа рекламы в поиске

PERSONALIZATION OF PLACED CONTENT ORDERING IN SEARCH RESULTS (Персонализация порядка размещаемого контента в результатах поиска)
  • US7693827B2
  • Google LLC
  • 2004-07-13
  • 2010-04-06
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google создает детальные профили интересов пользователей на основе истории поиска, поведения и взаимодействия с контентом. Эти профили используются для персонализации выдачи, в частности, для изменения порядка показа рекламы (Placed Content). Система вычисляет показатель сходства между профилем пользователя и профилем рекламы, корректируя стандартный рейтинг (CTR * Ставка), чтобы показывать пользователю наиболее релевантные объявления.

Описание

Какую проблему решает

Патент решает проблему неоптимального ранжирования «размещаемого контента» (Placed Content, преимущественно рекламы), когда стандартные метрики (например, CTR, умноженный на ставку) не учитывают индивидуальные интересы конкретного пользователя. Это может приводить к показу рекламы, которая имеет высокий общий рейтинг, но нерелевантна для данного пользователя. Изобретение улучшает релевантность рекламы и повышает вероятность взаимодействия с ней за счет персонализации.

Кроме того, патент детально описывает инфраструктуру для создания глубоких профилей пользователей на основе их поведения, что является фундаментом для персонализации как платных, так и органических результатов.

Что запатентовано

Запатентована система и метод использования профиля пользователя для изменения порядка ранжирования Placed Content (рекламы). Система создает и поддерживает профили пользователей на основе истории запросов, взаимодействия с документами и личной информации. При получении нового запроса система сравнивает профиль пользователя с профилем подходящей рекламы, вычисляет показатель сходства (Similarity Score) и использует его для модификации стандартной оценки ранжирования рекламы (например, корректируя CTR).

Как это работает

Система работает в несколько этапов:

  • Профилирование пользователя: Непрерывный сбор данных о поведении пользователя (запросы, клики, время на сайте, просмотренный контент) для создания трех типов профилей: на основе терминов (Term-based), категорий (Category-based) и ссылок (Link-based).
  • Профилирование контента: Создание аналогичных профилей для рекламы (Placed Content Profile).
  • Получение запроса и рекламы: Система получает запрос и идентифицирует подходящую рекламу.
  • Расчет сходства: Вычисляется Similarity Score между профилем пользователя и профилем рекламы.
  • Масштабирование: На основе Similarity Score определяется коэффициент масштабирования (Scaling Factor).
  • Корректировка рейтинга: Стандартный рейтинг рекламы (например, CTR * Ставка) умножается на Scaling Factor.
  • Переранжирование: Рекламные объявления упорядочиваются на основе нового персонализированного рейтинга.

Актуальность для SEO

Высокая. Персонализация является ключевым элементом современных поисковых и рекламных систем. Методы глубокого профилирования пользователей, описанные в патенте, хотя и поданы в 2004 году, заложили основу для последующих разработок Google в области понимания интересов пользователя. В 2025 году эти принципы остаются крайне актуальными, хотя конкретные реализации, вероятно, эволюционировали в сторону более сложных нейросетевых моделей.

Важность для SEO

Влияние на SEO (органический поиск) – высокое, но косвенное. Патент фокусируется на Placed Content (рекламе). Однако он детально раскрывает инфраструктуру и методы Google для профилирования пользователей (сбор данных, анализ контента, категоризация интересов). Понимание того, как Google строит User Profile, критически важно для SEO-стратегии, поскольку эти же профили используются (как описано в родительской заявке этого патента) для персонализации органической выдачи. SEO-специалисты должны понимать, что поведение их аудитории напрямую влияет на то, как Google будет классифицировать их интересы и, соответственно, ранжировать контент для них.

Детальный разбор

Термины и определения

Placed Content (Размещаемый контент)
Контент, размещаемый на платной основе или конкурирующий за место в выдаче. Преимущественно рекламные объявления.
User Profile (Профиль пользователя)
Набор данных, характеризующий интересы и предпочтения пользователя. Может включать Term-based, Category-based и Link-based профили.
Term-based Profile (Профиль на основе терминов)
Часть профиля, представляющая интересы пользователя в виде списка терминов с весами.
Category-based Profile (Профиль на основе категорий)
Часть профиля, представляющая интересы пользователя в виде списка категорий (часто иерархических, например, Open Directory Project) с весами.
Link-based Profile (Профиль на основе ссылок)
Часть профиля, идентифицирующая предпочтительные ссылки (URL, хосты, домены) пользователя с весами.
Paragraph Sampling (Выборка параграфов)
Метод автоматического извлечения релевантного контента из документа. Приоритет отдается длинным параграфам, игнорируется шаблонный текст, JavaScript и короткие сегменты.
Context Analysis (Контекстный анализ)
Метод идентификации важных терминов в документе путем поиска контекстных шаблонов (префиксов/постфиксов), которые были предварительно обучены на наборе данных.
Similarity Score (Показатель сходства)
Метрика, определяющая степень сходства между профилем пользователя и профилем размещаемого контента (рекламы).
Scaling Factor (Коэффициент масштабирования)
Множитель, производный от Similarity Score, используемый для корректировки CTR или общей оценки ранжирования рекламы.
CTR (Click-Through Rate)
Показатель кликабельности рекламы (клики / показы).
Popularity Score (Оценка популярности)
Итоговая оценка ранжирования рекламы, учитывающая профиль пользователя, ставку (Bid) и CTR.

Ключевые утверждения (Анализ Claims)

Патент является продолжением (Continuation-in-part) более ранней заявки (10/676,711), которая фокусировалась на персонализации органического поиска. Данный патент фокусируется на применении этих же механизмов профилирования к Placed Content (рекламе).

Claim 1 (Независимый пункт): Описывает основной метод персонализации размещаемого контента.

  1. Система получает поисковый запрос от пользователя.
  2. Система получает доступ к профилю пользователя (User Profile), который основан, как минимум, на терминах из ранее отправленных запросов.
  3. Идентифицируется набор Placed Content, соответствующий запросу.
  4. Каждому элементу Placed Content присваивается оценка популярности (Popularity Score) на основе: профиля пользователя, ставки (Bid) и CTR.
  5. Присвоение оценки включает:
    1. Определение показателя сходства (Similarity Score) между профилем пользователя и профилем Placed Content.
    2. Объединение Similarity Score, CTR и Bid для определения Popularity Score.
  6. Набор Placed Content ранжируется в соответствии с Popularity Score.
  7. Система готовит к отображению подмножество Placed Content в определенном порядке.

Claim 3 (Зависимый от 1): Уточняет расчет Similarity Score.

Определение Similarity Score включает расчет математического расстояния между вектором профиля пользователя (пары категорий и весов) и вектором профиля Placed Content (пары категорий и весов).

Claim 4 и 5 (Зависимые от 1): Вводят понятие коэффициента масштабирования (Scaling Factor). Similarity Score ассоциируется с Scaling Factor или нормализуется для его создания.

Claim 6 (Зависимый от 4): Уточняет расчет Popularity Score.

Он рассчитывается путем умножения Scaling Factor, CTR и Bid.

Claim 7 (Зависимый от 6): Ключевое уточнение гибкости системы.

Scaling Factor, связанный с максимальным Similarity Score, может быть меньше, чем Scaling Factor, связанный со средним (mid-point) Similarity Score. Это означает, что система не всегда линейно повышает рекламу за максимальное сходство; она может предпочесть умеренное сходство.

Claim 8 (Зависимый от 4): Уточняет определение Scaling Factor.

Он может определяться на основе статистической информации, связывающей исторические Similarity Scores с реальными CTR.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, собранные на этапах индексирования и взаимодействия с пользователем, для влияния на финальный этап показа рекламы.

CRAWLING & INDEXING (Сканирование и Индексирование)
На этих этапах система собирает данные не только о веб-страницах, но и о Placed Content (рекламе). Для рекламы создаются профили (Placed Content Profile), аналогичные профилям документов, включающие термины и категории.

QUNDERSTANDING (Понимание Запросов) и RANKING (Ранжирование)
Система обрабатывает запрос и генерирует органические результаты. Параллельно идентифицируется набор релевантной рекламы.

METASEARCH & RERANKING (Метапоиск, Смешивание и Переранжирование)
Основное применение патента происходит на этом этапе, в момент определения порядка показа рекламы.

  1. Получение профиля: Система извлекает User Profile пользователя, отправившего запрос.
  2. Расчет сходства: Для каждой релевантной рекламы система сравнивает ее профиль с профилем пользователя, вычисляя Similarity Score.
  3. Корректировка рейтинга: Система вычисляет Scaling Factor и модифицирует стандартный рейтинг рекламы (например, CTR * Bid).
  4. Финальное ранжирование рекламы: Реклама переупорядочивается на основе персонализированных оценок (Popularity Score).
  5. Смешивание: Персонализированная реклама объединяется с органическими результатами поиска для показа пользователю.

Входные данные:

  • Исходный запрос пользователя.
  • User Profile (Term-based, Category-based, Link-based).
  • Набор релевантной рекламы (Placed Content).
  • Профили рекламы (Placed Content Profiles).
  • Стандартные метрики рекламы (CTR, Bid).

Выходные данные:

  • Упорядоченный список рекламы с пересчитанными персонализированными оценками (Popularity Score).

На что влияет

  • Типы контента: В первую очередь влияет на Placed Content (рекламные объявления) в результатах поиска.
  • Специфические запросы: Наибольшее влияние оказывается на запросы, по которым у пользователя есть сформированная история интересов и четкий профиль. Для новых тем или пользователей без истории влияние минимально.
  • Ниши и тематики: Влияет на все ниши, где используется контекстная реклама, особенно в конкурентных тематиках, где стандартные ставки и CTR могут быть близки, и персонализация становится решающим фактором для определения порядка показа.

Когда применяется

  • Условия работы: Алгоритм применяется при обработке запросов пользователей, для которых существует достаточно данных для формирования User Profile.
  • Триггеры активации: Активируется в момент, когда необходимо определить порядок показа рекламы, связанной с поисковым запросом или отображаемым документом.
  • Временные рамки: Применяется в реальном времени при каждом показе рекламы. Профили пользователей обновляются периодически или после каждой сессии взаимодействия.

Пошаговый алгоритм

Процесс А: Создание и обновление профиля пользователя (Офлайн / Фоновый режим)

  1. Сбор данных: Сбор информации о действиях пользователя: предыдущие запросы, посещенные URL, взаимодействие с документами (клики, время просмотра, скроллинг), личная информация.
  2. Извлечение контента (Paragraph Sampling): Анализ посещенных документов. Удаление нерелевантного контента (скрипты, комментарии). Выборка текста из длинных параграфов. При недостатке контента – использование заголовков, ALT-тегов, мета-тегов.
  3. Анализ контента (Context Analysis): Применение обученных контекстных шаблонов к извлеченному контенту для идентификации важных терминов и их весов.
  4. Построение профилей:
    1. Term-based: Агрегация важных терминов и их весов.
    2. Category-based: Классификация терминов и документов по иерархии категорий (например, ODP), присвоение весов категориям.
    3. Link-based: Идентификация часто посещаемых URL/хостов/доменов и присвоение им весов.
  5. Обновление и старение: Применение временного взвешивания (более свежие данные получают больший вес). Прунинг (удаление) старых или низковесных элементов профиля.

Процесс Б: Персонализация порядка рекламы (Реальное время)

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Получение профиля пользователя: Извлечение актуального User Profile.
  3. Идентификация рекламы: Определение набора Placed Content, релевантного запросу. Параллельно генерируются органические результаты.
  4. Сравнение профилей: Для каждого рекламного объявления:
    1. Извлечение профиля рекламы (Placed Content Profile).
    2. Сравнение профиля пользователя и профиля рекламы.
    3. Расчет показателя сходства (Similarity Score).
  5. Расчет коэффициента масштабирования: Преобразование Similarity Score в Scaling Factor (с использованием функции или таблицы соответствия).
  6. Модификация рейтинга: Расчет персонализированной оценки (Popularity Score). Например: Score = Scaling Factor * CTR * Bid.
  7. Ранжирование: Упорядочивание набора рекламы по Popularity Score.
  8. Отображение: Смешивание топовых рекламных объявлений с органическими результатами поиска.

Какие данные и как использует

Данные на входе

Патент описывает обширный набор данных, используемых для построения профиля пользователя:

  • Контентные факторы: Термины из посещенных документов, извлеченные с помощью Paragraph Sampling и Context Analysis. Заголовки документов, мета-теги, ALT-теги.
  • Ссылочные факторы: URL, идентифицированные в предыдущих запросах. Анкорные тексты (Anchor Text) этих URL. Предпочитаемые URL, хосты и домены (Link-based Profile).
  • Поведенческие факторы: История поисковых запросов (Previous Search Queries). Взаимодействие с документами (User's Activities): клики, время просмотра документа, активность скроллинга, печать, сохранение, добавление в закладки. Общие паттерны браузинга (Browsing Patterns).
  • Технические факторы: Общая информация о документах (формат: HTML, PDF, Word и т.д.).
  • Пользовательские факторы: Явно предоставленная личная информация (User's Personal Information): демография (возраст, образование, доход), география (местоположение), языковые предпочтения.
  • Временные факторы: Возраст данных в профиле (используется для взвешивания).

Какие метрики используются и как они считаются

  • Weight (Вес термина/категории/ссылки): Квантифицирует важность элемента для пользователя. Веса могут быть положительными (предпочтение) или отрицательными (избегание). Веса рассчитываются на основе частоты встречаемости, контекстного анализа и поведения пользователя.
  • Временное взвешивание: Веса элементов профиля корректируются в зависимости от их возраста (более старые данные получают меньший вес).
  • Similarity Score (Показатель сходства): Рассчитывается путем сравнения вектора профиля пользователя и вектора профиля рекламы. В патенте приводится пример формулы для категорий:

Выводы

  1. Глубокое профилирование пользователя: Патент раскрывает стремление Google строить многогранные профили пользователей (Term-based, Category-based, Link-based), используя широкий спектр сигналов: от истории запросов и кликов до анализа контента просмотренных страниц и поведения на них (время, скроллинг).
  2. Персонализация как модификатор стандартного ранжирования: В контексте рекламы персонализация не заменяет основные метрики (CTR и Ставка), а модифицирует их. Similarity Score преобразуется в Scaling Factor, который корректирует итоговый рейтинг.
  3. Важность категоризации интересов: Система активно использует категоризацию (например, иерархию ODP) для определения сходства между пользователем и контентом. Это подчеркивает важность понимания того, как Google классифицирует тематику сайтов и интересы аудитории.
  4. Нелинейное масштабирование: Система может использовать нелинейные функции для Scaling Factor. В патенте явно указано (Claim 7), что максимальное сходство не обязательно дает максимальное повышение. Это предполагает сложную логику оптимизации показа рекламы.
  5. Анализ контента для профилирования: Методы Paragraph Sampling и Context Analysis показывают, что Google анализирует содержание посещаемых страниц, чтобы понять интересы пользователя, фильтруя шум и фокусируясь на основном контенте длинных параграфов.
  6. Фундамент для органической персонализации: Хотя этот патент сфокусирован на рекламе, описанная инфраструктура профилирования является основой и для персонализации органического поиска (как описано в родительской заявке).

Практика

Best practices (это мы делаем)

Поскольку патент описывает механизмы профилирования пользователей для персонализации рекламы, прямые рекомендации касаются скорее Paid Search. Однако, понимание механизмов профилирования дает стратегические инсайты для органического SEO.

  • Фокус на формировании правильного профиля аудитории: SEO-стратегия должна быть направлена на привлечение целевой аудитории и стимулирование поведения, которое сформирует у пользователей четкий тематический профиль (Category-based Profile), связанный с вашей нишей. Это повышает вероятность того, что ваш контент (и реклама) будут показаны этим пользователям в будущем.
  • Оптимизация контента под Paragraph Sampling: Структурируйте контент так, чтобы основная мысль и ключевые термины находились в длинных, содержательных параграфах. Избегайте размещения важной информации только в коротких блоках или списках, которые могут быть отфильтрованы как шум при анализе контента для профилирования.
  • Построение Topical Authority для четкой категоризации: Развивайте сайт как авторитетный ресурс в определенной категории. Если Google четко классифицирует ваш сайт и свяжет его с определенными категориями в Category-based Profile пользователей, это улучшит видимость сайта для этой аудитории при последующих поисках (как органических, так и платных).
  • (Paid Search) Сегментация и таргетинг рекламы: При настройке рекламных кампаний учитывайте, что система будет сравнивать профиль вашей рекламы с профилем пользователя. Создавайте объявления, которые четко категоризированы и соответствуют долгосрочным интересам целевых сегментов, а не только сиюминутному запросу.

Worst practices (это делать не надо)

  • Привлечение нецелевого трафика (Clickbait): Привлечение пользователей по нерелевантным запросам или с помощью кликбейта «загрязняет» их профили. Это может привести к тому, что система перестанет ассоциировать этих пользователей с вашей тематикой, ухудшая персонализированное ранжирование в будущем.
  • Игнорирование структуры контента: Размещение ключевого контента в виде, который затрудняет его извлечение (например, только внутри изображений, или в виде очень коротких предложений, окруженных навигационным шумом), мешает системе понять интересы пользователя через ваш контент.
  • Смешивание несвязанных тематик на одном домене: Это может затруднить формирование четкого Category-based Profile как для сайта, так и для пользователей, которые его посещают, что негативно скажется на эффективности персонализации.

Стратегическое значение

Патент подтверждает, что персонализация является многофакторным процессом, основанным на долгосрочном профилировании пользователей. Для Google важно не только ответить на текущий запрос, но и понять контекст интересов пользователя. Стратегическое значение для SEO заключается в переходе от оптимизации под запросы к оптимизации под интересы и поведение аудитории. Долгосрочная стратегия должна фокусироваться на создании контента, который формирует четкий и последовательный профиль интересов у посетителей сайта.

Практические примеры

Сценарий: Повышение релевантности рекламы для пользователя с историей интересов.

  1. Профиль пользователя: Пользователь часто ищет информацию о походах, читает обзоры снаряжения на сайтах категории «Sports/Outdoors/Hiking». В его Category-based Profile эта категория имеет высокий вес (0.8).
  2. Текущий запрос: Пользователь вводит общий запрос «лучшие ботинки».
  3. Стандартное ранжирование рекламы: Реклама магазина модной обуви (А) имеет высокий общий CTR и ставку. Реклама магазина туристического снаряжения (Б) имеет более низкий CTR и ставку.
  4. Персонализация:
    1. Система анализирует профиль рекламы А (Категория: «Shopping/Fashion») и Б (Категория: «Sports/Outdoors/Hiking»).
    2. Рассчитывается Similarity Score. У рекламы Б сходство с профилем пользователя значительно выше.
    3. Система применяет Scaling Factor. Для рекламы Б он высок (например, 1.5), для А – низок (например, 0.7).
  5. Результат: Персонализированный рейтинг рекламы Б становится выше, чем у А (1.5 * CTR_Б * Ставка_Б > 0.7 * CTR_А * Ставка_А). Пользователю на первой позиции показывается реклама туристического снаряжения, несмотря на более низкую изначальную ставку.

Вопросы и ответы

Насколько детально Google профилирует пользователей согласно этому патенту?

Профилирование очень детальное. Система строит три типа профилей: Term-based (конкретные термины), Category-based (общие тематики и категории) и Link-based (предпочитаемые сайты/домены). Для этого анализируется история запросов, клики, контент посещенных страниц и даже поведение на странице (время, скроллинг, сохранение).

Патент фокусируется на рекламе. Как это влияет на органическое SEO?

Влияние косвенное, но значительное. Этот патент детально описывает инфраструктуру профилирования пользователей. Эти же самые профили используются Google для персонализации органической выдачи (что описано в родительской заявке патента). Понимая, как Google классифицирует интересы пользователей, SEO-специалисты могут лучше оптимизировать контент для привлечения и удержания целевой аудитории.

Что такое Paragraph Sampling и как оптимизировать под него контент?

Paragraph Sampling — это метод извлечения основного контента страницы для понимания ее темы и интересов пользователя. Он игнорирует короткие блоки текста, скрипты и шаблонные элементы, фокусируясь на длинных параграфах. Для оптимизации размещайте ключевую информацию и термины в содержательных, развернутых абзацах основного текста.

Учитывает ли система изменение интересов пользователя?

Да, учитывает. В патенте указано, что информация в профиле взвешивается в соответствии с ее возрастом. Более свежие данные имеют больший вес, а старые данные постепенно теряют влияние или удаляются. Это позволяет профилю адаптироваться к текущим интересам пользователя.

Что означает нелинейное масштабирование (Claim 7), когда максимальное сходство не дает максимального повышения?

Это означает, что система оптимизации показа рекламы сложнее, чем простое повышение за сходство. Возможно, Google обнаружил, что слишком точное попадание в профиль не всегда дает лучший результат по сравнению с умеренным сходством, или это используется для поддержания разнообразия. Система оставляет за собой гибкость в применении Scaling Factor.

Как рассчитывается Similarity Score между пользователем и рекламой?

Similarity Score рассчитывается как математическое расстояние между вектором профиля пользователя и вектором профиля рекламы. Например, система сравнивает, насколько близки категории интересов пользователя к категориям, к которым относится реклама, учитывая веса этих категорий в обоих профилях.

Может ли пользователь контролировать свой профиль?

Патент упоминает, что профиль может строиться как на основе неявных данных (поведение), так и явных (предоставленная пользователем информация). Также обсуждается возможность хранения профиля на стороне клиента для обеспечения приватности. Это закладывает основу для инструментов управления пользовательскими данными.

Влияет ли посещение моего сайта на профиль пользователя?

Да, напрямую влияет. Если пользователь посещает ваш сайт, система анализирует контент вашего сайта (используя Paragraph Sampling и Context Analysis) и поведение пользователя на нем. Эта информация обновляет профиль пользователя, связывая его интересы с тематикой вашего сайта.

Что важнее для профилирования: история запросов или контент посещенных страниц?

Патент рассматривает оба источника как важные и взаимодополняющие. История запросов дает прямые сигналы об интересах, а анализ контента посещенных страниц (особенно с учетом поведения на них) позволяет глубже понять контекст и детализировать профиль по терминам и категориям.

Как влияют на профилирование кликбейт и привлечение нецелевого трафика?

Это негативная практика. Если вы привлекаете пользователей, которые быстро покидают сайт или интересуются темами, не связанными с вашей основной нишей, вы «загрязняете» их профили. Это может ухудшить понимание системой вашей целевой аудитории и негативно сказаться на персонализированном ранжировании вашего контента в будущем.

Похожие патенты

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует результаты поиска в зависимости от сайта, с которого отправлен запрос
Google анализирует совокупные поисковые запросы и последующие клики пользователей, инициирующих поиск с определенного веб-сайта. На основе этих данных создается «Профиль Веб-сайта», отражающий коллективные интересы его аудитории. Этот профиль используется для переранжирования будущих результатов: один и тот же запрос, отправленный с разных сайтов, даст разную выдачу, адаптированную под контекст источника.
  • US8078607B2
  • 2011-12-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google персонализирует сниппеты в выдаче, используя профиль интересов пользователя
Google использует механизм для генерации сниппетов в поисковой выдаче, основанный не только на терминах запроса, но и на профиле интересов пользователя. Система анализирует документ, находит термины, соответствующие интересам пользователя, и выделяет их в сниппете. Это призвано повысить релевантность сниппета для конкретного пользователя и лучше отразить содержание документа в контексте его интересов.
  • US8631006B1
  • 2014-01-14
  • Персонализация

  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google персонализирует Sitelinks и сниппеты, используя интересы пользователя и тренды для прямого перехода на нужные страницы
Google использует механизм для динамического обогащения результатов поиска, особенно при навигационных запросах. Система анализирует сущности (продукты, категории) на целевом сайте и сравнивает их с известными интересами пользователя и текущими трендами. При совпадении Google отображает персонализированные прямые ссылки (например, динамические Sitelinks) на эти конкретные разделы или товары прямо в выдаче.
  • US20140188927A1
  • 2014-07-03
  • Персонализация

  • SERP

  • Ссылки

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток
Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.
  • US9465871B1
  • 2016-10-11
  • Антиспам

  • SERP

  • Ссылки

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

seohardcore