
Google анализирует совокупные поисковые запросы и последующие клики пользователей, инициирующих поиск с определенного веб-сайта. На основе этих данных создается «Профиль Веб-сайта», отражающий коллективные интересы его аудитории. Этот профиль используется для переранжирования будущих результатов: один и тот же запрос, отправленный с разных сайтов, даст разную выдачу, адаптированную под контекст источника.
Патент решает проблему контекстной слепоты стандартных поисковых систем, которые игнорируют происхождение запроса. Традиционно поисковая система выдает одинаковые результаты по запросу (например, "apple") независимо от того, отправлен ли он с технологического блога или с сайта продуктового магазина. Это снижает релевантность выдачи, так как интересы аудиторий этих сайтов различны. Изобретение позволяет адаптировать результаты поиска к контексту сайта (или веб-страницы), с которого был инициирован поиск.
Запатентована система и метод создания Website Profile (Профиля веб-сайта) на основе агрегированной истории поиска, исходящей с этого сайта. Этот профиль отражает коллективные интересы аудитории сайта. Система анализирует запросы, введенные разными пользователями на сайте, и их последующие действия (клики, время пребывания) в результатах поиска. Сгенерированный профиль используется для кастомизации ранжирования будущих запросов, поступающих с того же сайта.
Система работает в двух основных режимах: генерация профиля и применение профиля.
Search History) о запросах, поступающих с сайта, и фиксирует активность пользователей (клики, dwell time). Эта история анализируется для выявления паттернов интересов. Профиль может быть основан на категориях (Category-based), терминах (Term-based) или предпочтительных ссылках/хостах (Link-based).Generic Ranking Score). Затем система применяет Website Profile для расчета Boost Factors (Повышающих коэффициентов) для каждого документа, основываясь на корреляции между контентом документа и профилем сайта. Результаты переранжируются на основе новых, зависимых от сайта оценок (Website-dependent Ranking Score).Средняя/Высокая. Хотя патент подан в 2006 году, концепция контекстного поиска и персонализации остается фундаментальной. Описанные механизмы, вероятно, лежат в основе работы таких продуктов, как Google Custom Search Engine (CSE) и AdSense for Search (AFS). Понимание того, как Google профилирует сайты и интересы их аудитории на основе агрегированного поведения, критически важно для современной SEO-стратегии.
Влияние на SEO значительное (7/10), но специфическое. Патент в первую очередь описывает ранжирование для поиска, инициированного на сторонних сайтах (например, CSE), а не в основном поиске (google.com). Однако он раскрывает ключевые методы, которые Google использует для профилирования сайтов и интересов их аудитории (анализ категорий, терминов и ссылочного графа на основе поведения пользователей). Это дает глубокое понимание того, как Google оценивает тематическую направленность и контекст ресурса.
Category-based, Term-based и Link-based компоненты.Search History и генерацию/обновление Website Profiles.Website Profile.Document Profile и Website Profile. Используется для модуляции оценки ранжирования документа.PageRank и релевантности запросу).Boost Factors к Generic Ranking Score.Claim 1 (Независимый пункт): Описывает основной метод предоставления кастомизированных результатов поиска в зависимости от источника запроса.
search history) этих сайтов, которая включает запросы, отправленные множеством пользователей (multiple users) с этих сайтов, и активность этих пользователей в результатах поиска.Ядро изобретения — использование агрегированного профиля сайта (а не индивидуального профиля пользователя) для кастомизации результатов поиска в зависимости от того, откуда пришел запрос.
Claim 4 (Независимый пункт): Применяет ту же логику, что и Claim 1, но на уровне отдельных веб-страниц одного сайта.
Система получает один и тот же запрос с двух разных веб-страниц (Страница А и Страница Б) одного сайта. Результаты ранжируются по-разному на основе Профиля Страницы А и Профиля Страницы Б. Это позволяет учитывать более узкий контекст внутри сайта (например, раздел внутренних новостей против раздела международных новостей).
Изобретение затрагивает несколько этапов поиска, используя данные, собранные в процессе взаимодействия с пользователем, и влияя на финальное ранжирование или понимание запроса.
CRAWLING & DATA ACQUISITION – Сбор данных
Система требует постоянного сбора и логирования данных о взаимодействии пользователей с поиском, исходящим с конкретных сайтов. Это включает логирование запроса, идентификатора сайта-источника (Website ID), предоставленных результатов и последующих действий пользователя (клики, dwell time). Эти данные сохраняются в Search History Database.
INDEXING & FEATURE EXTRACTION – Индексирование и извлечение признаков
На этом этапе Document Profiler анализирует контент и ссылочную структуру документов для создания Document Profiles. Эти профили необходимы для последующего сопоставления с профилями сайтов. Также в офлайн-режиме Website Profiler обрабатывает собранную историю поиска для генерации Website Profiles.
RANKING (RERANKING) – Ранжирование (Переранжирование)
Это основной сценарий применения (описанный в FIG. 9). После того как Search Engine сгенерировал результаты с Generic Ranking Scores, компонент Search Result Ranker извлекает Website Profile сайта-источника. Затем он рассчитывает Boost Factors для каждого документа путем сравнения Document Profile и Website Profile. Общие оценки модулируются для получения Website-dependent Ranking Scores, и происходит переранжирование.
QUNDERSTANDING – Понимание Запросов
Альтернативный сценарий применения (описанный в FIG. 11). Website Profile используется для модификации стратегии запроса (query strategy) до основного поиска. Например, в запрос могут быть добавлены релевантные термины из профиля сайта с определенными весами, создавая website-dependent query strategy.
Входные данные:
Search History (для генерации профиля).Document Profiles и Generic Ranking Scores (для ранжирования).Выходные данные:
Website Profile (после генерации).Website-dependent Ranking Scores (после ранжирования).Website Profile или Webpage Profile.Процесс А: Генерация профиля веб-сайта (Website Profile Generation)
dwell time, возможно, mouse hovering time).Document Profiles для документов, на которые кликнули пользователи.Website Profile путем агрегации данных. Это включает: Category-based Profile: Сопоставление кликнутых документов или запросов с предопределенной иерархией категорий и присвоение весов.Term-based Profile: Извлечение ключевых терминов из запросов и/или кликнутых документов и присвоение весов.Link-based Profile: Идентификация часто кликаемых URL или хостов и присвоение им весов.Website Profile Database и его периодическое обновление.Процесс Б: Применение профиля для ранжирования (Website-dependent Ranking - FIG. 9)
Generic Ranking Scores.Search Result Ranker извлекает Website Profile для данного сайта-источника.Document Profile и рассчитывает Boost Factors (TermBoostFactor, CategoryBoostFactor, LinkBoostFactor) путем определения корреляции (например, через скалярное произведение векторов) между профилем документа и профилем сайта.Website-dependent Ranking Score. Например, по формуле: WebsiteScore=GenericScore∗BoostFactors.Ключевыми данными для работы системы являются поведенческие факторы, агрегированные на уровне сайта.
dwell time) на выбранных документах (рассчитывается как время между кликом на ссылку и выходом из документа).mouse hovering time) на ссылки в результатах поиска (упоминается как возможный сигнал интереса).Document Profiles.PageRank и генерации Link-based Profiles).Search History и релевантности (например, с учетом dwell time). Патент упоминает, что недавняя история поиска может играть более важную роль, чем старая.TermBoostFactor, CategoryBoostFactor, LinkBoostFactor. Рассчитываются как корреляция (например, скалярное произведение) между соответствующими компонентами профиля документа и профиля сайта.Website Profile представляет собой коллективный интерес аудитории сайта, а не отдельного пользователя. Он строится на основе анализа того, что ищут и на что кликают все пользователи, инициирующие поиск на этом сайте.click rate) и время пребывания (dwell time) являются прямыми входными данными для генерации профиля интересов сайта.Boost Factors (основной сценарий) или модификацией самого запроса до начала поиска (альтернативный сценарий).Хотя патент в первую очередь описывает работу поиска на сторонних сайтах (CSE/AFS), он дает критически важные инсайты о том, как Google профилирует сайты и их аудиторию в целом.
Website Profile). Чем четче фокус сайта, тем более определенным будет его профиль в системах Google.dwell time, критически важно создавать контент, который полностью удовлетворяет запросы пользователей и удерживает их на сайте. Хорошие поведенческие метрики способствуют формированию сильного профиля сайта.Category-based Profiles. Создание контента, который четко соответствует известным категориям и сущностям, помогает Google правильно классифицировать сайт и его контент (Document Profiles).Website Profile вашего сайта.Website Profile. Это усложняет для Google понимание контекста сайта.dwell time и быстрым отказам, негативно влияет на формирование профиля сайта, так как эти сигналы используются для оценки релевантности и интереса.Website Profile нерелевантными терминами и категориями.Патент подтверждает стратегический приоритет Google на понимание контекста и интересов аудитории. Он показывает, что Google не просто индексирует контент, но и активно профилирует сайты на основе агрегированного поведения пользователей. Это подчеркивает важность построения Тематического Авторитета (Topical Authority) и работы над E-E-A-T. Сильный, четко определенный профиль сайта, отражающий реальные интересы целевой аудитории, является активом в долгосрочной SEO-стратегии.
Сценарий 1: Контекстное ранжирование многозначного запроса
Рассмотрим запрос "Jaguar".
Website Profile Сайта А: Высокие веса в категориях "Автомобили", терминах "ремонт, обзор".Website Profile Сайта Б: Высокие веса в категориях "Животные, Наука", терминах "среда обитания, хищник".Boost Factor и поднимаются в топ выдачи.Boost Factor и поднимаются в топ выдачи.Сценарий 2: Профилирование на уровне страницы (Webpage Profile)
Спортивный портал имеет разделы "Спорт США" и "Мировой спорт".
Описывает ли этот патент персонализацию для конкретного пользователя?
Нет, этот патент описывает контекстную адаптацию выдачи на основе профиля сайта-источника (Website Profile), а не профиля отдельного пользователя (User Profile). Профиль сайта строится на основе агрегированного поведения всех пользователей этого сайта. Любой пользователь, отправивший запрос с этого сайта, получит одинаково адаптированную выдачу, даже если он посещает сайт впервые.
Как Google определяет профиль сайта (Website Profile)?
Профиль сайта генерируется путем анализа истории поиска (Search History), исходящей с этого сайта. Система анализирует, какие запросы вводят пользователи и на какие результаты они затем кликают, а также учитывает время пребывания (dwell time). На основе этих данных создается взвешенный профиль, включающий релевантные категории, термины и предпочтительные ссылки.
Влияет ли описанный механизм на ранжирование моего сайта в основном поиске Google (google.com)?
Напрямую этот механизм не влияет на ранжирование в основном поиске. Он предназначен для кастомизации результатов, когда поиск инициируется со стороннего сайта (например, через Google CSE). Однако методы профилирования, описанные в патенте (анализ поведения пользователей, категоризация), дают представление о том, как Google в целом оценивает тематику и интересы аудитории сайта, что косвенно связано с оценкой авторитетности (E-E-A-T).
Что такое Category-based, Term-based и Link-based профили?
Это три компонента Website Profile. Category-based определяет тематические интересы аудитории (например, Спорт, Финансы). Term-based определяет ключевые слова и фразы, важные для аудитории. Link-based определяет предпочтительные сайты или хосты, которые часто посещает аудитория. Все они используются для расчета Boost Factors.
Может ли Google профилировать отдельные страницы сайта?
Да, Claim 4 патента явно описывает применение этого механизма на уровне отдельных веб-страниц (Webpage Profile). Это означает, что запрос, отправленный из поисковой строки в разделе "Футбол", может дать иные результаты, чем тот же запрос, отправленный из раздела "Баскетбол" на том же спортивном сайте.
Использует ли Google фильтрацию запросов при построении профиля сайта?
Да, патент предлагает фильтровать запросы (FIG. 4). Система может игнорировать или понижать вес "аномально популярных" запросов, которые не соответствуют тематике сайта (например, запрос о поп-звезде на сайте о гольфе), а также слишком редкие запросы. Это делается для того, чтобы профиль точно отражал основные интересы аудитории.
Насколько важен Dwell Time (время пребывания) в этом патенте?
Dwell time является важным сигналом для генерации Website Profile. Он используется как показатель удовлетворенности пользователя и релевантности кликнутого документа. Более длительное время пребывания на документе может увеличивать вес соответствующих категорий, терминов или ссылок в профиле сайта.
Что такое Boost Factor и как он рассчитывается?
Boost Factor (Повышающий коэффициент) – это множитель, применяемый к общей оценке ранжирования документа (Generic Ranking Score). Он рассчитывается путем определения корреляции (например, через скалярное произведение) между профилем документа (Document Profile) и профилем сайта (Website Profile). Если документ хорошо соответствует интересам аудитории сайта, он получает высокий Boost Factor.
Может ли этот механизм использоваться для выбора рекламы?
Да, в патенте упоминается, что Website Profiles могут использоваться для выбора и ранжирования рекламы (advertisements) аналогично тому, как они используются для ранжирования документов. Реклама, соответствующая профилю сайта, может быть продвинута.
Что делать SEO-специалисту, исходя из этого патента?
Основной вывод – необходимо фокусироваться на создании четкого тематического авторитета и удовлетворении интента аудитории. Патент подтверждает, что Google профилирует сайты на основе агрегированного поведения пользователей. Работа над качеством контента, улучшением поведенческих факторов (удержание пользователя) и четкой тематической структурой поможет сформировать сильный профиль сайта в системах Google.

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
SERP

Персонализация
Поведенческие сигналы
Свежесть контента

Персонализация
Поведенческие сигналы
SERP

Антиспам
Ссылки
Техническое SEO

EEAT и качество
Семантика и интент

Семантика и интент
Индексация
Мультимедиа

Семантика и интент
Поведенческие сигналы

SERP
Поведенческие сигналы

Поведенческие сигналы
Индексация
Семантика и интент

EEAT и качество
Техническое SEO
Ссылки

Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

SERP
Поведенческие сигналы
Семантика и интент
