Как Google выполняет последовательные поиски для уточнения результатов в рамках конкретного сайта или группы страниц

Google может использовать многоэтапный процесс поиска. Сначала система выполняет поиск по первой части запроса. Затем результаты этого поиска определяют ограниченную область (например, конкретный веб-сайт, домен или связанные страницы) для выполнения второго поиска по второй части запроса. Это позволяет итеративно уточнять результаты.

Описание

Какую задачу решает

Патент решает задачу повышения точности и эффективности поиска путем предоставления механизма для последовательного уточнения (search refinement) или поиска в заданной области (scoped search). Он позволяет пользователям (или самой системе) находить специфическую информацию в рамках более широкого контекста, уже идентифицированного предыдущим поиском. Например, если пользователь ищет «Отели Лас-Вегаса», а затем хочет найти информацию о «буфетах» именно на сайтах этих отелей.

Что запатентовано

Запатентован метод выполнения последовательных связанных поисков. Ключевым механизмом является использование результатов первого поиска для динамического определения корпуса документов (области поиска или scope) для второго поиска. Система обрабатывает запрос, состоящий из нескольких частей, используя первую часть для широкого поиска, а вторую – для поиска в ограниченном наборе контента, определенном на предыдущем этапе.

Как это работает

Система работает итеративно:

Получение запроса: Система получает запрос, состоящий из нескольких частей (полученных одновременно или последовательно).
Первый поиск: Выполняется поиск по первой части запроса в общем индексе (first plurality of content items).
Определение области: Search Results Analyzer анализирует результаты первого поиска и определяет область для второго поиска (second plurality of content items). Эта область может включать сайты из результатов, связанные с ними страницы (по ссылкам) или активы внутри найденных страниц.
Второй поиск: Выполняется поиск по второй части запроса, но только в рамках определенной на предыдущем шаге ограниченной области.
Представление результатов: Результаты (часто в комбинированном или вложенном виде) предоставляются пользователю.

Актуальность для SEO

Средняя. Конкретные реализации пользовательского интерфейса, описанные в патенте (например, функция «Поиск в топ-10 результатов»), устарели и не являются стандартными для Google Поиска в 2025 году. Однако базовая концепция итеративного, контекстно-зависимого и уточняющего поиска является фундаментальной для Information Retrieval. Эти идеи лежат в основе реализации операторов (например, site:) и могут использоваться во внутренних процессах системы при обработке сложных запросов.

Важность для SEO

Низкое влияние (3.5/10). Этот патент описывает инфраструктуру выполнения запросов и функциональность поиска, а не основные алгоритмы ранжирования. Он не вводит новые факторы ранжирования и не описывает, как Google определяет качество контента. Его ценность для SEO заключается в понимании важности информационной архитектуры сайта для обеспечения эффективного поиска информации внутри ресурса.

Детальный разбор

Термины и определения

Assets (Активы): Компоненты единицы контента (например, веб-страницы). Включают текст, графику, метаданные, ссылки, мультимедиа и скрипты. Могут выступать областью для второго поиска.
Content Item (Единица контента): Документ, веб-страница или другой ресурс, который может быть проиндексирован и найден.
Domain Name (Доменное имя): Часть веб-адреса (URL). Используется как один из способов определения области для второго поиска (например, все страницы в одном домене).
First/Second Portion of the Search Query (Первая/Вторая часть поискового запроса): Разделенные части одного запроса или последовательные запросы, используемые для выполнения многоэтапного поиска.
First/Second plurality of content items (Первое/Второе множество элементов контента): Корпус документов или область поиска (scope). Первое множество – это обычно общий индекс. Второе множество – это ограниченная область, определенная на основе результатов первого поиска.
Query Analyzer (Анализатор запросов): Компонент системы, отвечающий за обработку входящего запроса и, возможно, его автоматическое разделение на части для последовательных поисков.
Search Results Analyzer (Анализатор результатов поиска): Ключевой компонент. Обрабатывает результаты поиска и определяет множество элементов контента (область), по которому будет проводиться следующий поиск.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод выполнения многоэтапного поиска.

Система получает поисковый запрос.
Выполняется первый поиск по первому множеству контента (Corpus 1), используя первую часть запроса. Идентифицируется первый набор результатов.
На основе результатов первого поиска определяется второе множество контента (Corpus 2) для выполнения второго поиска. Важное уточнение: Corpus 2 включает элементы контента, которые НЕ были идентифицированы в первом наборе результатов (например, другие страницы того же сайта, которые не ранжировались по первому запросу).
Выполняется второй поиск по второму множеству контента (Corpus 2), используя вторую часть запроса.

Claims 6-9 (Зависимые): Определяют различные методы формирования второго множества контента (Corpus 2) на основе конкретного результата (First Result) из первого поиска.

Claim 6: Corpus 2 состоит из веб-страниц, чьи адреса имеют то же доменное имя (Domain Name), что и First Result. (Реализация поиска по сайту).
Claim 7: Corpus 2 состоит из веб-страниц, на которые ссылается (исходящие ссылки) First Result.
Claim 8: Corpus 2 состоит из веб-страниц, которые ссылаются на (входящие ссылки) First Result.
Claim 9: Corpus 2 состоит из активов (Assets), содержащихся внутри веб-страницы First Result. (Поиск внутри страницы).

Claims 11, 13, 14 (Зависимые): Описывают варианты пользовательского интерфейса (UI) для ввода запросов.

Claim 11: GUI содержит несколько текстовых полей для одновременного ввода разных частей запроса.
Claim 13: GUI содержит одно текстовое поле. Система автоматически идентифицирует первую и вторую части запроса из введенной строки.
Claim 14: Последовательный ввод. Сначала интерфейс для ввода первой части и отображение результатов, затем второй интерфейс для ввода второй части (например, функция «Поиск в результатах»).

Где и как применяется

Изобретение представляет собой методологию обработки запросов и выполнения поиска, затрагивающую несколько этапов.

QUNDERSTANDING – Понимание Запросов
На этом этапе Query Analyzer определяет, следует ли применять многоэтапный поиск. Это может происходить путем анализа одного сложного запроса на предмет его разделения на части (Claim 13) или путем обработки последовательных действий пользователя в интерфейсе (Claims 11, 14).

RANKING – Ранжирование (включая Retrieval/Отбор кандидатов)
На этом этапе выполняется первый поиск (Stage 1) по общему индексу для получения первоначального набора результатов.

METASEARCH – Метапоиск / Специализированный поиск
Основное применение патента. После получения результатов первого поиска активируется Search Results Analyzer. Он определяет ограниченную область (Corpus 2) для второго поиска. Затем Search Engine выполняет второй поиск (Stage 2) в рамках этой области. Это может быть реализовано как повторный запрос к индексу с применением фильтров области (например, ограничение по домену или URL).

Входные данные:

Поисковый запрос (первая и вторая части).
Первое множество контента (общий индекс).
Структурные данные (доменные имена, ссылочный граф, активы страниц).

Выходные данные:

Второй (уточненный) набор результатов поиска.

На что влияет

Специфические запросы: Наибольшее влияние оказывается на составные запросы, где пользователь хочет найти пересечение двух тем или найти специфическую информацию в рамках более широкого контекста (например, «[Объект] [Характеристика]» или «[Модель телефона] [Решение проблемы]»).
Типы контента: Влияет на обнаружение глубокого контента (например, конкретных товаров, статей в подразделах) на сайтах, которые ранжируются по более общим запросам.

Когда применяется

Алгоритм применяется в следующих сценариях:

Явное уточнение пользователем: Когда пользователь использует функцию «Искать среди результатов», интерфейс с несколькими полями ввода или аналогичные интерфейсы для сужения поиска после получения первичной выдачи (Claims 11, 14).
Автоматическая обработка (Потенциально): Когда Query Analyzer интерпретирует запрос как многоэтапный и решает применить последовательный поиск для повышения точности (Claim 13).

Пошаговый алгоритм

Процесс выполнения многоэтапного поиска:

Получение запроса: Система получает по крайней мере часть поискового запроса от пользователя. (Может быть весь запрос сразу или только первая часть).
Выполнение первого поиска: Система выполняет первый поиск на основе первой части поискового запроса по общему корпусу документов (Первое множество контента).
Анализ результатов: Search Results Analyzer обрабатывает результаты первого поиска.
Определение параметров второго поиска: Система определяет параметры второго поиска на основе результатов первого поиска и второй части поискового запроса (если она не была получена ранее, система может ее запросить). Ключевой шаг – определение области поиска (Второе множество контента).
Методы определения области:
- Ограничение по домену результата (Claim 6).
- Ограничение по связанным страницам (входящие/исходящие ссылки) (Claims 7, 8).
- Ограничение активами внутри найденных страниц (Claim 9).
Выполнение второго поиска: Система выполняет второй поиск, используя вторую часть запроса и ограничиваясь определенной областью.
Передача результатов: Система передает результаты поиска пользователю (обычно результаты второго поиска, возможно, в контексте первого).

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании структурных данных для определения области поиска, а не на факторах ранжирования.

Технические факторы: URL и Доменные имена (Domain Name) критически важны. Они используются для реализации ограничения поиска по сайту (Claim 6).
Ссылочные факторы: Входящие и исходящие ссылки явно указаны как механизмы для определения области второго поиска (Claims 7 и 8). Система должна иметь доступ к графу ссылок.
Структурные/Контентные факторы: Система анализирует структуру документа для идентификации его активов (Assets) — текста, изображений, метаданных, если второй поиск выполняется внутри страницы (Claim 9).

Какие метрики используются и как они считаются

В патенте не указаны конкретные метрики ранжирования, формулы расчета релевантности, оценки качества или пороговые значения. Он описывает исключительно инфраструктурный механизм определения области (scope) для последовательных поисков.

Выводы

Инфраструктурный механизм, а не алгоритм ранжирования: Патент описывает технический метод выполнения последовательных (каскадных) поисков для уточнения результатов. Он не описывает, как Google определяет качество или релевантность контента.
Динамическое сужение области поиска (Dynamic Scoping): Ключевая идея — использование результатов первого (общего) поиска для определения области второго (уточняющего) поиска. Важно, что второй поиск ищет новые результаты в связанной области, а не просто фильтрует уже найденные.
Гибкость определения области: Патент защищает несколько способов сужения поиска: ограничение по домену (поиск внутри сайта), поиск по связанным ресурсам (входящие/исходящие ссылки) и поиск по активам документа (поиск внутри страницы).
Реализация функций уточнения: Этот механизм лежит в основе функций типа «Искать среди результатов» или реализации оператора site:.
Важность структуры сайта: Для SEO этот патент косвенно подчеркивает важность того, как организован контент. Структура сайта и ссылочный граф используются системой для определения логических границ контента.

Практика

Этот патент носит преимущественно инфраструктурный характер. Прямых практических выводов для влияния на ранжирование в органическом поиске мало, но он дает контекст для важности базовых SEO-практик.

Best practices (это мы делаем)

Обеспечение четкой и логичной структуры сайта и URL: Это критически важно для функции поиска внутри сайта (Claim 6). Логичная структура гарантирует, что система сможет легко идентифицировать все страницы, принадлежащие домену, и включить их в область уточняющего поиска.
Глубокая проработка тематики (Topical Depth): Сайт должен быть готов к тому, что пользователь, найдя его по общему запросу (Первый Поиск), захочет найти уточняющую информацию (Второй Поиск) внутри ресурса. Необходимо иметь контент, отвечающий на эти детализированные запросы.
Оптимизация внутренней перелинковки: Патент упоминает использование ссылок для определения области поиска (Claims 7 и 8). Структурированная перелинковка помогает системе понять взаимосвязи между страницами, что полезно для любой формы контекстного или ограниченного поиска.
Использование понятной разметки (Assets): Если второй поиск выполняется по активам внутри страницы (Claim 9), четкая структура контента (заголовки, списки, оптимизированные изображения) помогает системе идентифицировать конкретные ответы внутри документа.

Worst practices (это делать не надо)

Размещение связанного контента на разных хостах/поддоменах: Если система ограничивает второй поиск строго по доменному имени, найденному в первом поиске (Claim 6), контент на не связанных поддоменах может быть исключен из области уточняющего поиска.
Обфускация структуры и ссылок: Использование сложных URL без иерархии или методов перелинковки, скрывающих граф ссылок от поисковых систем, может помешать механизмам определения области поиска, основанным на структуре и ссылках.
Скрытие контента от индексации: Если часть контента на сайте закрыта от индексации, механизм поиска внутри сайта не сможет ее найти, даже если основная страница хорошо ранжируется.

Стратегическое значение

Патент имеет низкое стратегическое значение для современных SEO-стратегий, ориентированных на ранжирование. Он подтверждает, что структурные элементы (домены, ссылки) используются не только для ранжирования, но и для обеспечения функциональных возможностей поисковой системы. Он подчеркивает важность построения авторитетных ресурсов с сильной информационной архитектурой, которые поддерживают дальнейшее уточнение запроса внутри ресурса.

Практические примеры

Сценарий: Уточнение поиска на сайте ритейлера (Применение Claim 6)

Первый Запрос (Part 1): «Винтажная одежда».
Первый Поиск: Система ищет по всему интернету.
Результат Первого Поиска: В топе находится сайт www.rustyzipper.com.
Интерфейс уточнения: Пользователь видит опцию (например, поле в SERP) «Искать в результатах» и вводит уточнение.
Второй Запрос (Part 2): «Джинсы».
Определение области: Система определяет область второго поиска как все страницы на домене www.rustyzipper.com (согласно Claim 6).
Второй Поиск: Система ищет «джинсы» только на сайте www.rustyzipper.com.
Результат: Пользователю показываются результаты с сайта www.rustyzipper.com, релевантные запросу «джинсы», часто в контексте исходного результата.

Вопросы и ответы

Описывает ли этот патент новый алгоритм ранжирования?

Нет. Патент полностью сосредоточен на методологии выполнения последовательных поисков, где результаты одного поиска определяют область (scope) для следующего. Он не обсуждает, как именно система определяет релевантность или качество результатов в рамках этих поисков.

Второй поиск просто фильтрует результаты первого поиска?

Нет, это ключевое отличие. В Claim 1 указано, что второе множество контента (область второго поиска) включает элементы, которые НЕ были идентифицированы в первом наборе результатов. Это означает, что система запускает новый поиск в связанной области, а не просто фильтрует уже найденное.

Как именно Google определяет область для второго поиска?

Патент предлагает четыре основных метода, основанных на результатах первого поиска: 1) Ограничение по домену (поиск внутри сайта, Claim 6). 2) Ограничение по страницам, на которые ссылается результат (исходящие ссылки, Claim 7). 3) Ограничение по страницам, которые ссылаются на результат (входящие ссылки, Claim 8). 4) Ограничение по активам внутри найденного документа (Claim 9).

Отличается ли механизм, описанный в патенте, от использования оператора site:?

Оператор site: является одной из реализаций логики, описанной в Claim 6 (ограничение по домену). Однако патент описывает более широкую систему, которая может использовать другие методы ограничения (ссылки, активы) и делать это итеративно на основе результатов поиска, а не только по явному указанию домена пользователем.

Как система решает, как разделить запрос на первую и вторую части?

Патент предусматривает несколько вариантов. Пользователь может явно ввести части в разные поля (Claim 11) или последовательно (Claim 14). Также Query Analyzer может автоматически разделить запрос, введенный в одно поле (Claim 13), хотя конкретные методы автоматического разделения не описаны.

Актуален ли этот патент сегодня? Я не вижу функции «Поиск в результатах» в Google.

Хотя конкретный пользовательский интерфейс (UI), показанный в патенте, устарел, сама концепция многоэтапного уточняющего поиска остается актуальной. Она может использоваться во внутренних механизмах системы, при реализации операторов поиска или в диалоговых системах.

Как этот патент влияет на стратегию внутренней перелинковки?

Патент подтверждает, что Google анализирует ссылочный граф для понимания взаимосвязей между страницами (Claims 7 и 8). Хотя это не связано с ранжированием в данном контексте, это подчеркивает необходимость логичной и доступной для сканирования структуры ссылок, чтобы система могла корректно определять связанные области контента для выполнения поиска.

Что такое «Активы» (Assets) страницы и как они используются?

Активы — это компоненты страницы: текст, графика, метаданные, ссылки. Патент (Claim 9) описывает возможность выполнения второго поиска исключительно внутри этих активов. Это соответствует функции поиска информации внутри конкретного документа, найденного на первом этапе.

Стоит ли специально оптимизировать сайт под этот патент?

Специальных действий не требуется. Однако, поскольку механизм часто используется для поиска внутри сайта, наличие хорошей структуры, полной индексации и качественного контента на всех страницах (Topical Depth) гарантирует, что пользователи, применяющие функции уточнения к вашему сайту, найдут релевантную информацию.

Какова основная ценность этого патента для Senior SEO?

Основная ценность заключается в понимании инфраструктуры и основ Information Retrieval. Патент дает представление о том, как Google использует структурные связи (домен, ссылки, активы) для выполнения сложных, многоэтапных поисковых задач, что является основой для современных систем понимания запросов и улучшения пользовательского опыта.