
Google использует методы для ограничения результатов поиска на основе заданного контекста (например, набора URL-адресов или категории). Патент детализирует, как система определяет «связанность» между документами, используя такие методы, как анализ совместного цитирования (co-citation), анализ текста, окружающего ссылки в цитирующих документах, и анализ корреляции паттернов доступа пользователей.
Патент решает проблему ограниченности традиционных поисковых систем, которые обычно позволяют уточнять поиск только с помощью ключевых слов или ограничения по домену/хосту. Изобретение направлено на улучшение релевантности результатов путем предоставления механизма, который позволяет ограничить выдачу только теми результатами, которые связаны с заранее определенным набором информации (контекстом), например, с набором конкретных URL-адресов или тематической категорией.
Запатентована система для выполнения «контекстного поиска» (In-Context Searching). Суть изобретения заключается в фильтрации стандартного набора поисковых результатов на основе context information (например, набора URL-адресов, текущей просматриваемой страницы или списка избранного). Система определяет, связан ли кандидат в результаты с этим контекстом, используя различные методы оценки схожести, и предоставляет пользователю только отфильтрованный набор связанных результатов.
Система работает в несколько этапов:
context information. Это может быть URL текущей страницы, список избранного пользователя, выбранная категория в директории или набор URL, определенный автором сайта.relatedness): Classification-based similarity (схожесть на основе классификации).Access-based similarity (схожесть на основе паттернов доступа пользователей).Text-based similarity (текстовая схожесть).Link-based similarity (схожесть на основе ссылок, например, co-citation).Реализация может происходить как на стороне клиента (через Browser Assistant), так и на стороне сервера (Enhanced Search Engine).
Средняя. Патент подан в 2000 году. Описанные пользовательские интерфейсы (например, Browser Assistant/тулбары) и зависимость от внешних директорий устарели. Однако базовые концепции определения связанности документов (relatedness), описанные в патенте, остаются фундаментальными для работы поисковых систем. Методы, такие как co-citation, анализ текста вокруг ссылок и использование паттернов доступа пользователей, являются критически важными компонентами современных алгоритмов ранжирования и определения тематического авторитета.
Патент имеет высокое стратегическое значение для SEO (7.5/10). Его ценность заключается не в описании устаревшей функции контекстного поиска, а в детальном описании механизмов, которые Google использует для определения связанности между документами. Понимание этих механизмов (особенно Link-based similarity, Access-based similarity и их комбинаций с анализом текста) критически важно для построения тематического авторитета, стратегий линкбилдинга и оптимизации внутренней перелинковки.
topic classifiers).on-topic) и негативные (off-topic) примеры.Патент содержит несколько независимых пунктов, которые описывают общий процесс контекстного поиска, но защищают разные методы определения связанности.
Claim 1 (Независимый пункт): Описывает метод ограничения результатов поиска и защищает использование поведенческих данных.
correlation of user access patterns) к документам результатов и документам контекста (Access-based Similarity).Этот пункт защищает использование данных о поведении пользователей (трафике) для определения связанности между документами.
Claim 15 (Независимый пункт): Защищает метод агрегации различных сигналов связанности.
Classification-based similarity.Access-based similarity.Text-based similarity.Link-based similarity.resultant score).Этот пункт защищает метод объединения ссылочных, текстовых, поведенческих и тематических сигналов в единую метрику связанности.
Claim 16 (Независимый пункт): Защищает усовершенствованный метод ко-цитирования, учитывающий контекст вокруг ссылок.
text near the citations) для определения схожести между контекстом ссылок.Этот пункт защищает метод использования анализа околоссылочного текста в цитирующем документе для более точного определения семантической связанности между цитируемыми документами.
Изобретение затрагивает несколько этапов поиска, но его основная ценность заключается в механизмах, рассчитываемых на этапе индексирования и применяемых во время ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходят ключевые вычисления, необходимые для работы системы:
Link-based similarity (co-citation).Text-based similarity и анализа текста вокруг исходящих ссылок.topic classifiers для определения тематики документов и вычисления Classification-based similarity.Access-based similarity.QUNDERSTANDING – Понимание Запросов
На этом этапе система должна распознать намерение пользователя выполнить контекстный поиск, обработав ввод из интерфейса расширенного поиска или получив данные от Browser Assistant.
RANKING – Ранжирование (Отбор кандидатов) / RERANKING – Переранжирование
Описанная система фильтрации применяется для сокращения набора результатов. Если активирован контекстный поиск, система отбирает или переранжирует только те документы, которые не только соответствуют запросу, но и имеют достаточный уровень relatedness к заданному контексту.
Входные данные:
Context URLs или Категория).Выходные данные:
relatedness) влияют на все ниши, так как они являются фундаментальными методами оценки тематической связи между сайтами и страницами.Алгоритм контекстного поиска применяется при выполнении следующих условий:
Browser Assistant или интерфейс Advanced Search, ИЛИ поиск инициируется со страницы, автор которой предопределил набор Context URLs.Context Information (URL, список избранного, категория и т.д.).Механизмы расчета схожести (Similarity) применяются постоянно на этапе индексирования для всех документов в базе.
Патент описывает два основных варианта реализации: на стороне клиента и на стороне сервера.
Вариант А: Реализация на стороне клиента (Browser Assistant)
Browser Assistant определяет набор Context URLs (текущий URL, список избранного, список предпочтений или категории директории).Browser Assistant отправляет его стандартной поисковой системе.Browser Assistant.Browser Assistant фильтрует список, отбрасывая ссылки, не связанные с набором Context URLs. Для определения связанности используется один или несколько методов (Link-based, Text-based, Access-based, Classification-based Similarity). Фильтрация может происходить локально или с помощью запроса к серверу.Browser Assistant представляет отфильтрованный список пользователю.Вариант Б: Реализация на стороне сервера (Enhanced Search Engine)
Context URLs (через интерфейс Advanced Search или автоматически от стороннего сервера).Система использует несколько типов данных для вычисления различных метрик схожести:
Link-based similarity. Требуется информация о том, какие документы ссылаются на какие (ссылочный граф), чтобы определить co-citation (совместное цитирование).Text-based similarity. Требуется полный текст документов. Также используется текст, окружающий ссылки (text near the citations), для уточнения Link-based similarity.Access-based similarity. Требуются данные о доступе пользователей к документам (логи доступа), чтобы определить корреляцию посещений между разными документами.Classification-based similarity. Требуются результаты работы классификаторов тем (topic classifiers), которые относят документы к определенным темам или категориям.Патент определяет четыре основные метрики схожести и методы их комбинирования:
Link-based similarity (co-citation) взвешивается (повышается или понижается) на основе анализа ключевых слов вокруг ссылок (околоссылочного текста) в совместно цитирующем документе. Это позволяет системе различать контекст цитирования.Link-based similarity взвешивается на основе схожести классификаций текста цитат в совместно цитирующем документе.Relatedness) между документами: ссылки (co-citation), текст, поведение пользователей (паттерны доступа) и тематическая классификация.Link-based similarity) как ключевого индикатора связанности. Документы, на которые часто ссылаются вместе, считаются связанными.text near the citations). Связанность подтверждается, только если околоссылочный текст семантически схож. Это механизм для борьбы с нерелевантным совместным цитированием.Access-based similarity (Claim 1) явно указывает на использование корреляции пользовательского трафика для определения связанности. Если пользователи часто посещают два документа в рамках схожих информационных потребностей, эти документы считаются связанными.Resultant Score) для надежного определения связанности.Link-based similarity и тематический авторитет. Анализируйте, кто ссылается на ваших конкурентов, и стремитесь получить ссылки с тех же страниц.Access-based similarity. Создавайте контент и структуру сайта (включая внутреннюю перелинковку), которые способствуют естественным паттернам навигации между связанными страницами. Это усиливает корреляцию доступа и сигнализирует о связанности страниц.Text-based), добивайтесь четкой тематической классификации (Classification-based), привлекайте релевантный трафик (Access-based) и стройте качественный ссылочный профиль (Link-based).Link-based similarity.Access-based similarity.Этот патент подтверждает, что связанность между документами и сайтами является многофакторной концепцией. Стратегическое SEO должно выходить за рамки простого анализа текста и обратных ссылок. Оно должно учитывать, как сайт встроен в тематическую экосистему интернета через паттерны совместного цитирования, контекст этих цитирований и поведение пользователей. Понимание этих механизмов критически важно для построения долгосрочного тематического авторитета.
Сценарий 1: Усиление тематического авторитета через оптимизацию исходящих ссылок и Co-citation (Claim 16)
Задача: Повысить авторитет обзорной статьи о лучших моделях кофемашин.
Сценарий 2: Использование Access-based Similarity для внутренней оптимизации
Access-based similarity). Это сигнализирует поисковой системе о сильной связанности этих страниц.Что такое Access-based Similarity и почему это важно для SEO?
Access-based similarity (Claim 1) – это метод определения связанности двух документов на основе корреляции паттернов доступа пользователей. Если пользователи, которые посещают документ А, также часто посещают документ Б, система считает их связанными. Для SEO это означает, что Google использует данные о поведении пользователей для понимания связей между сайтами. Важно привлекать качественный, целевой трафик и оптимизировать внутренние пути пользователя для усиления связи между тематически близкими страницами.
Как патент предлагает уточнять Co-citation (Link-based similarity)?
Патент предлагает не просто учитывать факт совместного цитирования (когда страница С ссылается на А и Б), но и уточнять его с помощью анализа текста (Claim 16). Система анализирует текст, окружающий ссылки на А и Б на странице С (text near the citations). Если этот текст семантически схож или подтверждает контекст, связанность между А и Б усиливается. Если контекст разный, связанность может быть аннулирована.
Насколько важен околоссылочный текст для исходящих ссылок согласно этому патенту?
Он критически важен. Околоссылочный текст используется для валидации и определения контекста связи между цитируемыми документами (механизм Link + Text). Размещение исходящих ссылок в релевантном текстовом окружении помогает поисковой системе правильно интерпретировать тематику вашей страницы и ее связь с экосистемой авторитетных ресурсов.
Что такое Classification-based Similarity?
Это метод, при котором два документа считаются связанными, если они отнесены к одной и той же теме или категории с помощью автоматических классификаторов тем (topic classifiers). Это подчеркивает важность создания контента с четкой тематической направленностью, чтобы помочь системам правильно классифицировать ваш сайт.
Патент описывает "Browser Assistant". Актуально ли это сегодня?
Нет, конкретная реализация через клиентские тулбары (Browser Assistant), описанная в патенте 2000 года, устарела. Современные реализации контекстного поиска и фильтрации происходят преимущественно на стороне сервера (Enhanced Search Engine), как также описано в патенте.
Что такое Preferences List с позитивными и негативными примерами?
Это механизм, позволяющий пользователю создать список URL-адресов, которые являются хорошими примерами (on-topic) или плохими примерами (off-topic) для его информационной потребности. Система использует эти примеры для более точной фильтрации результатов. Хотя этот UI устарел, концепция использования позитивных и негативных примеров часто применяется в машинном обучении для тренировки алгоритмов ранжирования.
Как система комбинирует разные типы схожести?
Согласно Claim 15, система рассчитывает отдельные оценки для Link-based, Text-based, Access-based и Classification-based схожести. Затем эти оценки комбинируются (агрегируются) в единую результирующую оценку (Resultant Score). Если эта оценка превышает определенный порог, документы считаются связанными.
Может ли автор сайта определить контекст для поиска?
Да, патент описывает сценарий, когда автор документа может предопределить (например, жестко закодировать) список Context URLs. Когда пользователь инициирует поиск с этой страницы, этот контекст автоматически передается поисковой системе для фильтрации результатов. Это похоже на реализацию функционала "Поиск по этому сайту" или "Поиск по связанным ресурсам".
Влияют ли описанные методы схожести на обычное ранжирование?
Патент описывает их применение для фильтрации результатов в рамках контекстного поиска. Однако эти методы (co-citation, анализ околоссылочного текста, паттерны доступа) являются фундаментальными для понимания связей между документами. Логично предположить, что эти же механизмы используются Google и в основном алгоритме ранжирования для определения тематического авторитета и релевантности.
Как использовать инсайты из этого патента при линкбилдинге?
Сфокусируйтесь на получении ссылок со страниц, которые уже ссылаются на другие авторитетные сайты в вашей нише (усиление Co-citation). Также убедитесь, что ссылка на ваш сайт размещена в релевантном текстовом окружении на странице донора, чтобы максимизировать эффект от механизма Link + Text (Claim 16). Качество и контекст размещения ссылки важнее её количества.

Ссылки
SERP

Семантика и интент
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Ссылки
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

EEAT и качество
Свежесть контента
Семантика и интент

Поведенческие сигналы

Индексация
Поведенческие сигналы
Семантика и интент

Local SEO
Антиспам
Поведенческие сигналы

Семантика и интент
Персонализация
SERP

Семантика и интент
EEAT и качество
SERP

Персонализация
Поведенческие сигналы
Семантика и интент

Антиспам
Ссылки
SERP

Антиспам
SERP
Ссылки

Поведенческие сигналы
SERP
Мультимедиа
