SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google персонализирует результаты поиска в зависимости от сайта, с которого отправлен запрос

GENERATING WEBSITE PROFILES BASED ON QUERIES FROM WEBSITES AND USER ACTIVITIES ON THE SEARCH RESULTS (Генерация профилей веб-сайтов на основе запросов с веб-сайтов и действий пользователей в результатах поиска)
  • US8078607B2
  • Google LLC
  • 2006-03-30
  • 2011-12-13
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует совокупные поисковые запросы и последующие клики пользователей, инициирующих поиск с определенного веб-сайта. На основе этих данных создается «Профиль Веб-сайта», отражающий коллективные интересы его аудитории. Этот профиль используется для переранжирования будущих результатов: один и тот же запрос, отправленный с разных сайтов, даст разную выдачу, адаптированную под контекст источника.

Описание

Какую проблему решает

Патент решает проблему контекстной слепоты стандартных поисковых систем, которые игнорируют происхождение запроса. Традиционно поисковая система выдает одинаковые результаты по запросу (например, "apple") независимо от того, отправлен ли он с технологического блога или с сайта продуктового магазина. Это снижает релевантность выдачи, так как интересы аудиторий этих сайтов различны. Изобретение позволяет адаптировать результаты поиска к контексту сайта (или веб-страницы), с которого был инициирован поиск.

Что запатентовано

Запатентована система и метод создания Website Profile (Профиля веб-сайта) на основе агрегированной истории поиска, исходящей с этого сайта. Этот профиль отражает коллективные интересы аудитории сайта. Система анализирует запросы, введенные разными пользователями на сайте, и их последующие действия (клики, время пребывания) в результатах поиска. Сгенерированный профиль используется для кастомизации ранжирования будущих запросов, поступающих с того же сайта.

Как это работает

Система работает в двух основных режимах: генерация профиля и применение профиля.

  • Генерация профиля: Система непрерывно собирает данные (Search History) о запросах, поступающих с сайта, и фиксирует активность пользователей (клики, dwell time). Эта история анализируется для выявления паттернов интересов. Профиль может быть основан на категориях (Category-based), терминах (Term-based) или предпочтительных ссылках/хостах (Link-based).
  • Применение профиля: Когда поступает новый запрос с сайта, поисковая система генерирует стандартный набор результатов с общими оценками ранжирования (Generic Ranking Score). Затем система применяет Website Profile для расчета Boost Factors (Повышающих коэффициентов) для каждого документа, основываясь на корреляции между контентом документа и профилем сайта. Результаты переранжируются на основе новых, зависимых от сайта оценок (Website-dependent Ranking Score).

Актуальность для SEO

Средняя/Высокая. Хотя патент подан в 2006 году, концепция контекстного поиска и персонализации остается фундаментальной. Описанные механизмы, вероятно, лежат в основе работы таких продуктов, как Google Custom Search Engine (CSE) и AdSense for Search (AFS). Понимание того, как Google профилирует сайты и интересы их аудитории на основе агрегированного поведения, критически важно для современной SEO-стратегии.

Важность для SEO

Влияние на SEO значительное (7/10), но специфическое. Патент в первую очередь описывает ранжирование для поиска, инициированного на сторонних сайтах (например, CSE), а не в основном поиске (google.com). Однако он раскрывает ключевые методы, которые Google использует для профилирования сайтов и интересов их аудитории (анализ категорий, терминов и ссылочного графа на основе поведения пользователей). Это дает глубокое понимание того, как Google оценивает тематическую направленность и контекст ресурса.

Детальный разбор

Термины и определения

Website Profile (Профиль веб-сайта)
Структура данных, характеризующая коллективные интересы пользователей конкретного веб-сайта. Генерируется на основе агрегированной истории поиска, исходящей с этого сайта. Может включать Category-based, Term-based и Link-based компоненты.
Webpage Profile (Профиль веб-страницы)
Аналогичен профилю сайта, но генерируется на основе истории поиска, инициированной с конкретной веб-страницы.
Search History (История поиска)
Данные, включающие поисковые запросы, отправленные пользователями с конкретного сайта, предоставленные результаты и активность пользователей по этим результатам (клики, время пребывания).
Website Profiler (Профилировщик веб-сайтов)
Компонент системы, отвечающий за анализ Search History и генерацию/обновление Website Profiles.
Document Profile (Профиль документа)
Предварительно рассчитанная характеристика документа, основанная на его контенте и ссылочной структуре. Используется для сопоставления с Website Profile.
Category-based Profile (Профиль на основе категорий)
Компонент профиля, представляющий интересы в виде взвешенного списка категорий (например, из иерархии типа ODP/DMOZ).
Term-based Profile (Профиль на основе терминов)
Компонент профиля, представляющий интересы в виде взвешенного вектора ключевых терминов.
Link-based Profile (Профиль на основе ссылок)
Компонент профиля, идентифицирующий предпочтительные URL или хосты, часто посещаемые пользователями сайта.
Boost Factor (Повышающий коэффициент)
Метрика, рассчитываемая на основе корреляции между Document Profile и Website Profile. Используется для модуляции оценки ранжирования документа.
Generic Ranking Score (Общая оценка ранжирования)
Стандартная оценка ранжирования документа, не зависящая от контекста сайта-источника запроса (например, на основе PageRank и релевантности запросу).
Website-dependent Ranking Score (Оценка ранжирования, зависимая от сайта)
Итоговая оценка ранжирования, полученная путем применения Boost Factors к Generic Ranking Score.
Dwell Time (Время пребывания)
Время, проведенное пользователем за просмотром документа после клика по ссылке в результатах поиска.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления кастомизированных результатов поиска в зависимости от источника запроса.

  1. Система получает один и тот же поисковый запрос от двух разных веб-сайтов (Сайт А и Сайт Б), отличных от самой поисковой системы.
  2. Идентифицируется набор информационных элементов (документов), релевантных запросу.
  3. В ответ на запрос с Сайта А система предоставляет результаты в Порядке 1.
  4. В ответ на запрос с Сайта Б система предоставляет результаты в Порядке 2, отличном от Порядка 1.
  5. Порядок 1 определяется Профилем Сайта А, а Порядок 2 – Профилем Сайта Б.
  6. Профили сайтов связаны с историей поиска (search history) этих сайтов, которая включает запросы, отправленные множеством пользователей (multiple users) с этих сайтов, и активность этих пользователей в результатах поиска.

Ядро изобретения — использование агрегированного профиля сайта (а не индивидуального профиля пользователя) для кастомизации результатов поиска в зависимости от того, откуда пришел запрос.

Claim 4 (Независимый пункт): Применяет ту же логику, что и Claim 1, но на уровне отдельных веб-страниц одного сайта.

Система получает один и тот же запрос с двух разных веб-страниц (Страница А и Страница Б) одного сайта. Результаты ранжируются по-разному на основе Профиля Страницы А и Профиля Страницы Б. Это позволяет учитывать более узкий контекст внутри сайта (например, раздел внутренних новостей против раздела международных новостей).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, собранные в процессе взаимодействия с пользователем, и влияя на финальное ранжирование или понимание запроса.

CRAWLING & DATA ACQUISITION – Сбор данных
Система требует постоянного сбора и логирования данных о взаимодействии пользователей с поиском, исходящим с конкретных сайтов. Это включает логирование запроса, идентификатора сайта-источника (Website ID), предоставленных результатов и последующих действий пользователя (клики, dwell time). Эти данные сохраняются в Search History Database.

INDEXING & FEATURE EXTRACTION – Индексирование и извлечение признаков
На этом этапе Document Profiler анализирует контент и ссылочную структуру документов для создания Document Profiles. Эти профили необходимы для последующего сопоставления с профилями сайтов. Также в офлайн-режиме Website Profiler обрабатывает собранную историю поиска для генерации Website Profiles.

RANKING (RERANKING) – Ранжирование (Переранжирование)
Это основной сценарий применения (описанный в FIG. 9). После того как Search Engine сгенерировал результаты с Generic Ranking Scores, компонент Search Result Ranker извлекает Website Profile сайта-источника. Затем он рассчитывает Boost Factors для каждого документа путем сравнения Document Profile и Website Profile. Общие оценки модулируются для получения Website-dependent Ranking Scores, и происходит переранжирование.

QUNDERSTANDING – Понимание Запросов
Альтернативный сценарий применения (описанный в FIG. 11). Website Profile используется для модификации стратегии запроса (query strategy) до основного поиска. Например, в запрос могут быть добавлены релевантные термины из профиля сайта с определенными весами, создавая website-dependent query strategy.

Входные данные:

  • Поисковый запрос и идентификатор сайта/страницы-источника.
  • Search History (для генерации профиля).
  • Document Profiles и Generic Ranking Scores (для ранжирования).

Выходные данные:

  • Website Profile (после генерации).
  • Кастомизированный набор результатов поиска с Website-dependent Ranking Scores (после ранжирования).

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на многозначные запросы, интерпретация которых сильно зависит от контекста (например, "apple", "jaguar", "football").
  • Типы сайтов: Влияет на сайты, использующие сторонний поисковый движок для поиска по интернету (например, Google CSE или AFS). Особенно актуально для крупных порталов с разнообразной тематикой, где профилирование может применяться на уровне отдельных страниц или разделов.

Когда применяется

  • Условия применения: Алгоритм применяется, когда поисковая система получает запрос, содержащий идентификатор сайта или страницы-источника, для которого существует сгенерированный Website Profile или Webpage Profile.
  • Триггеры активации: Активация происходит в момент обработки запроса либо на этапе переранжирования (FIG. 9), либо на этапе понимания запроса (FIG. 11).

Пошаговый алгоритм

Процесс А: Генерация профиля веб-сайта (Website Profile Generation)

  1. Сбор данных: Идентификация поисковых запросов, отправленных с конкретного веб-сайта или страницы.
  2. Фиксация результатов и Мониторинг активности: Идентификация предоставленных результатов и фиксация активности пользователей по этим результатам (клики, dwell time, возможно, mouse hovering time).
  3. Фильтрация запросов (Опционально): Фильтрация истории поиска для исключения влияния "аномально" популярных, но нерелевантных запросов, а также слишком редких запросов (как показано на FIG. 4).
  4. Анализ выбранных документов: Извлечение или генерация Document Profiles для документов, на которые кликнули пользователи.
  5. Агрегация и взвешивание: Генерация Website Profile путем агрегации данных. Это включает:
    • Создание Category-based Profile: Сопоставление кликнутых документов или запросов с предопределенной иерархией категорий и присвоение весов.
    • Создание Term-based Profile: Извлечение ключевых терминов из запросов и/или кликнутых документов и присвоение весов.
    • Создание Link-based Profile: Идентификация часто кликаемых URL или хостов и присвоение им весов.
  6. Хранение и обновление: Сохранение профиля в Website Profile Database и его периодическое обновление.

Процесс Б: Применение профиля для ранжирования (Website-dependent Ranking - FIG. 9)

  1. Получение запроса: Система получает запрос и идентификатор сайта-источника.
  2. Генерация общих результатов: Поисковая система идентифицирует набор документов и присваивает им Generic Ranking Scores.
  3. Извлечение профиля сайта: Search Result Ranker извлекает Website Profile для данного сайта-источника.
  4. Расчет повышающих коэффициентов: Для каждого документа система извлекает его Document Profile и рассчитывает Boost Factors (TermBoostFactor, CategoryBoostFactor, LinkBoostFactor) путем определения корреляции (например, через скалярное произведение векторов) между профилем документа и профилем сайта.
  5. Расчет кастомизированной оценки: Присвоение документу Website-dependent Ranking Score. Например, по формуле: WebsiteScore=GenericScore∗BoostFactorsWebsiteScore = GenericScore * BoostFactorsWebsiteScore=GenericScore∗BoostFactors.
  6. Переранжирование: Сортировка документов в соответствии с новыми оценками и предоставление пользователю.

Какие данные и как использует

Данные на входе

Ключевыми данными для работы системы являются поведенческие факторы, агрегированные на уровне сайта.

  • Поведенческие факторы:
    • Поисковые запросы, отправленные с сайта.
    • Клики (selections) пользователей по результатам поиска.
    • Время пребывания (dwell time) на выбранных документах (рассчитывается как время между кликом на ссылку и выходом из документа).
    • Время наведения курсора (mouse hovering time) на ссылки в результатах поиска (упоминается как возможный сигнал интереса).
  • Контентные факторы: Содержимое документов, на которые кликали пользователи. Используется для генерации Document Profiles.
  • Ссылочные факторы: Ссылочная структура документов (используется для расчета PageRank и генерации Link-based Profiles).

Какие метрики используются и как они считаются

  • Веса в Website Profile: Веса для категорий, терминов и ссылок. Рассчитываются на основе частоты их встречаемости в Search History и релевантности (например, с учетом dwell time). Патент упоминает, что недавняя история поиска может играть более важную роль, чем старая.
  • Пороги популярности запросов: Используются для фильтрации запросов при генерации профиля (FIG. 4). Запросы делятся на "аномально популярные" (возможно, нерелевантные контексту сайта), "разумно популярные" и "непопулярные".
  • GenericScore: Общая оценка ранжирования. Упоминается формула: GenericScore=QueryScore∗PageRankGenericScore = QueryScore * PageRankGenericScore=QueryScore∗PageRank.
  • Boost Factors: TermBoostFactor, CategoryBoostFactor, LinkBoostFactor. Рассчитываются как корреляция (например, скалярное произведение) между соответствующими компонентами профиля документа и профиля сайта.
  • WebsiteScore: Зависимая от сайта оценка. Упоминаются варианты расчета, например: WebsiteScore=GenericScore∗(TermBoostFactor+CategoryBoostFactor+LinkBoostFactor)WebsiteScore = GenericScore * (TermBoostFactor + CategoryBoostFactor + LinkBoostFactor)WebsiteScore=GenericScore∗(TermBoostFactor+CategoryBoostFactor+LinkBoostFactor).

Выводы

  1. Контекст источника запроса имеет значение: Патент демонстрирует механизм, позволяющий Google динамически изменять ранжирование в зависимости от того, с какого сайта (или страницы) пришел пользователь. Ранжирование не универсально, а контекстуально.
  2. Профилирование на основе агрегированного поведения: Website Profile представляет собой коллективный интерес аудитории сайта, а не отдельного пользователя. Он строится на основе анализа того, что ищут и на что кликают все пользователи, инициирующие поиск на этом сайте.
  3. Поведенческие сигналы как основа профиля: Клики (click rate) и время пребывания (dwell time) являются прямыми входными данными для генерации профиля интересов сайта.
  4. Многомерное профилирование: Google использует сложный подход к профилированию, включающий анализ тем (категорий), ключевых слов (терминов) и предпочтительных ресурсов (ссылок). Это позволяет точно настроить выдачу.
  5. Механизмы кастомизации: Кастомизация может достигаться двумя путями: переранжированием стандартных результатов с помощью Boost Factors (основной сценарий) или модификацией самого запроса до начала поиска (альтернативный сценарий).
  6. Защита от искажений: Система предусматривает фильтрацию аномально популярных или слишком редких запросов (FIG. 4), чтобы избежать искажения профиля нерелевантным шумом.

Практика

Best practices (это мы делаем)

Хотя патент в первую очередь описывает работу поиска на сторонних сайтах (CSE/AFS), он дает критически важные инсайты о том, как Google профилирует сайты и их аудиторию в целом.

  • Укрепление тематической направленности (Topical Authority): Необходимо обеспечить четкую тематическую фокусировку сайта. Патент показывает, что Google стремится понять коллективный интерес аудитории сайта (Website Profile). Чем четче фокус сайта, тем более определенным будет его профиль в системах Google.
  • Фокус на удовлетворении интента и поведенческих факторах: Поскольку профили строятся на основе кликов и dwell time, критически важно создавать контент, который полностью удовлетворяет запросы пользователей и удерживает их на сайте. Хорошие поведенческие метрики способствуют формированию сильного профиля сайта.
  • Использование таксономий и категоризации: Патент активно использует Category-based Profiles. Создание контента, который четко соответствует известным категориям и сущностям, помогает Google правильно классифицировать сайт и его контент (Document Profiles).
  • Анализ внутреннего поиска (если применимо): Если на сайте используется встроенный поиск (особенно Google CSE), необходимо тщательно анализировать логи запросов и кликов. Это дает прямое представление о том, как формируется Website Profile вашего сайта.

Worst practices (это делать не надо)

  • Размытие тематики сайта: Создание сайта "обо всем" без четкой аудитории и фокуса приводит к размытому Website Profile. Это усложняет для Google понимание контекста сайта.
  • Игнорирование качества контента и UX: Контент, ведущий к низкому dwell time и быстрым отказам, негативно влияет на формирование профиля сайта, так как эти сигналы используются для оценки релевантности и интереса.
  • Привлечение нецелевого трафика: Привлечение пользователей, которые ищут информацию, не связанную с тематикой сайта, может «загрязнить» Website Profile нерелевантными терминами и категориями.

Стратегическое значение

Патент подтверждает стратегический приоритет Google на понимание контекста и интересов аудитории. Он показывает, что Google не просто индексирует контент, но и активно профилирует сайты на основе агрегированного поведения пользователей. Это подчеркивает важность построения Тематического Авторитета (Topical Authority) и работы над E-E-A-T. Сильный, четко определенный профиль сайта, отражающий реальные интересы целевой аудитории, является активом в долгосрочной SEO-стратегии.

Практические примеры

Сценарий 1: Контекстное ранжирование многозначного запроса

Рассмотрим запрос "Jaguar".

  1. Сайт А (Автомобильный форум): Пользователи часто ищут "jaguar repair", "jaguar f-type review" и кликают на сайты автопроизводителя.
    • Website Profile Сайта А: Высокие веса в категориях "Автомобили", терминах "ремонт, обзор".
  2. Сайт Б (Сайт зоопарка): Пользователи часто ищут "jaguar habitat", "jaguar speed" и кликают на статьи в Wikipedia и National Geographic.
    • Website Profile Сайта Б: Высокие веса в категориях "Животные, Наука", терминах "среда обитания, хищник".
  3. Обработка запроса "Jaguar":
    • Запрос с Сайта А: Система применяет Профиль А. Документы об автомобилях получают высокий Boost Factor и поднимаются в топ выдачи.
    • Запрос с Сайта Б: Система применяет Профиль Б. Документы о животном получают высокий Boost Factor и поднимаются в топ выдачи.

Сценарий 2: Профилирование на уровне страницы (Webpage Profile)

Спортивный портал имеет разделы "Спорт США" и "Мировой спорт".

  1. Профилирование: Пользователи раздела "Спорт США" ищут [football] и кликают на результаты об NFL. Пользователи раздела "Мировой спорт" ищут [football] и кликают на результаты о соккере.
  2. Обработка запроса [football]:
    • Запрос из раздела "Спорт США": Используется профиль этой страницы. Результаты об NFL получают буст.
    • Запрос из раздела "Мировой спорт": Используется профиль этой страницы. Результаты о соккере получают буст.

Вопросы и ответы

Описывает ли этот патент персонализацию для конкретного пользователя?

Нет, этот патент описывает контекстную адаптацию выдачи на основе профиля сайта-источника (Website Profile), а не профиля отдельного пользователя (User Profile). Профиль сайта строится на основе агрегированного поведения всех пользователей этого сайта. Любой пользователь, отправивший запрос с этого сайта, получит одинаково адаптированную выдачу, даже если он посещает сайт впервые.

Как Google определяет профиль сайта (Website Profile)?

Профиль сайта генерируется путем анализа истории поиска (Search History), исходящей с этого сайта. Система анализирует, какие запросы вводят пользователи и на какие результаты они затем кликают, а также учитывает время пребывания (dwell time). На основе этих данных создается взвешенный профиль, включающий релевантные категории, термины и предпочтительные ссылки.

Влияет ли описанный механизм на ранжирование моего сайта в основном поиске Google (google.com)?

Напрямую этот механизм не влияет на ранжирование в основном поиске. Он предназначен для кастомизации результатов, когда поиск инициируется со стороннего сайта (например, через Google CSE). Однако методы профилирования, описанные в патенте (анализ поведения пользователей, категоризация), дают представление о том, как Google в целом оценивает тематику и интересы аудитории сайта, что косвенно связано с оценкой авторитетности (E-E-A-T).

Что такое Category-based, Term-based и Link-based профили?

Это три компонента Website Profile. Category-based определяет тематические интересы аудитории (например, Спорт, Финансы). Term-based определяет ключевые слова и фразы, важные для аудитории. Link-based определяет предпочтительные сайты или хосты, которые часто посещает аудитория. Все они используются для расчета Boost Factors.

Может ли Google профилировать отдельные страницы сайта?

Да, Claim 4 патента явно описывает применение этого механизма на уровне отдельных веб-страниц (Webpage Profile). Это означает, что запрос, отправленный из поисковой строки в разделе "Футбол", может дать иные результаты, чем тот же запрос, отправленный из раздела "Баскетбол" на том же спортивном сайте.

Использует ли Google фильтрацию запросов при построении профиля сайта?

Да, патент предлагает фильтровать запросы (FIG. 4). Система может игнорировать или понижать вес "аномально популярных" запросов, которые не соответствуют тематике сайта (например, запрос о поп-звезде на сайте о гольфе), а также слишком редкие запросы. Это делается для того, чтобы профиль точно отражал основные интересы аудитории.

Насколько важен Dwell Time (время пребывания) в этом патенте?

Dwell time является важным сигналом для генерации Website Profile. Он используется как показатель удовлетворенности пользователя и релевантности кликнутого документа. Более длительное время пребывания на документе может увеличивать вес соответствующих категорий, терминов или ссылок в профиле сайта.

Что такое Boost Factor и как он рассчитывается?

Boost Factor (Повышающий коэффициент) – это множитель, применяемый к общей оценке ранжирования документа (Generic Ranking Score). Он рассчитывается путем определения корреляции (например, через скалярное произведение) между профилем документа (Document Profile) и профилем сайта (Website Profile). Если документ хорошо соответствует интересам аудитории сайта, он получает высокий Boost Factor.

Может ли этот механизм использоваться для выбора рекламы?

Да, в патенте упоминается, что Website Profiles могут использоваться для выбора и ранжирования рекламы (advertisements) аналогично тому, как они используются для ранжирования документов. Реклама, соответствующая профилю сайта, может быть продвинута.

Что делать SEO-специалисту, исходя из этого патента?

Основной вывод – необходимо фокусироваться на создании четкого тематического авторитета и удовлетворении интента аудитории. Патент подтверждает, что Google профилирует сайты на основе агрегированного поведения пользователей. Работа над качеством контента, улучшением поведенческих факторов (удержание пользователя) и четкой тематической структурой поможет сформировать сильный профиль сайта в системах Google.

Похожие патенты

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует выдачу, понижая результаты, которые пользователь исторически игнорирует или быстро покидает
Google использует историю поиска пользователя для выявления результатов, которые пользователь систематически пропускает или считает нерелевантными (например, быстро возвращается на выдачу). Такие результаты идентифицируются как «нежелательные» (User-Disfavored) и активно понижаются в персональной выдаче для этого пользователя, даже если их общий рейтинг высок.
  • US7827170B1
  • 2010-11-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя
Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.
  • US9443022B2
  • 2016-09-13
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании
Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.
  • US8719276B1
  • 2014-05-06
  • Антиспам

  • Ссылки

  • Техническое SEO

Как Google алгоритмически вычисляет и ранжирует экспертов по темам на основе анализа их контента
Google использует систему для автоматического определения экспертности авторов (Identities) в конкретных темах (Topics). Система анализирует корпус документов, оценивая, насколько сильно автор связан с документом (Identity Score) и насколько документ релевантен теме (Topic Score). Эти оценки перемножаются и суммируются по всем документам, формируя итоговый рейтинг экспертности автора в данной области.
  • US8892549B1
  • 2014-11-18
  • EEAT и качество

  • Семантика и интент

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google использует гибридную классификацию и данные о кликах пользователей для точного определения тематики контента
Google использует многоэтапный процесс для классификации контента в детальные иерархические категории. Система комбинирует традиционные методы классификации с анализом поисковых запросов и кликов пользователей (подтвержденных результатов поиска). Это позволяет точно определить узкоспециализированную тематику документа, фильтруя нерелевантные категории и взвешивая релевантность на основе TF-IDF и глубины иерархии.
  • US8145636B1
  • 2012-03-27
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google выбирает каноническую (основную) версию документа, основываясь на авторитетности источника и полноте контента
Google использует систему для выбора канонической (основной) версии документа среди его дубликатов. Система присваивает «приоритет авторитетности» каждой версии, основываясь на источнике (например, официальный издатель) и праве публикации. Основной версией выбирается та, которая имеет высокий авторитет и является полной. При отсутствии идеального варианта выбирается версия с наибольшим объемом информации (например, самая длинная или с наибольшим PageRank).
  • US8095876B1
  • 2012-01-10
  • EEAT и качество

  • Техническое SEO

  • Ссылки

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи
Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.
  • US8538970B1
  • 2013-09-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

seohardcore