
Google анализирует контент страниц, ранжирующихся в топе по исходному запросу, чтобы понять его контекст. На основе этого контекста система находит похожие запросы из своей базы данных. Затем она фильтрует эти запросы, оставляя только те, которые лексически отличаются от исходного, чтобы предложить пользователю разнообразные и релевантные альтернативы для исследования темы.
Патент решает проблему генерации полезных и неизбыточных поисковых подсказок (query suggestions). Часто пользователи не выбирают оптимальные ключевые слова. Существующие системы часто предлагают варианты, которые лексически слишком похожи на исходный запрос (например, предложение "star wars movie" на запрос "star wars") и не несут новой ценности. Изобретение направлено на то, чтобы предложить пользователю контекстуально релевантные, но при этом лексически разнообразные альтернативы.
Запатентована система генерации предлагаемых запросов, использующая контекстную информацию, извлеченную из результатов поиска. Суть изобретения в двух механизмах: 1) Понимание контекста запроса путем анализа контента топовых результатов и создания вектора запроса (Centroid). 2) Применение строгого фильтра лексического разнообразия (lexical diversity filter) к потенциальным подсказкам, чтобы гарантировать их существенное отличие от исходного запроса.
Система работает следующим образом:
Query Vector (или Centroid). Этот вектор представляет контекст запроса.Query Vector с базой данных ранее вычисленных центроидов (Centroid Repository) других запросов.Dot Product), которые преобразуются обратно в текстовые запросы (Candidate Queries).Высокая (концептуально). Принципы, заложенные в патенте — использование результатов поиска для понимания контекста запроса и необходимость разнообразия в подсказках (например, в блоках "Related Searches") — фундаментальны для современных поисковых систем. Хотя конкретные методы, такие как Centroids и Dot Product, вероятно, были заменены более продвинутыми нейросетевыми эмбеддингами (BERT, MUM), общая концепция остается крайне актуальной.
Патент имеет умеренно-высокое значение для SEO (6.5/10). Он не описывает алгоритмы ранжирования напрямую, но критически важен для понимания того, как Google определяет контекст темы и как он направляет поисковый путь пользователя. Патент подчеркивает, что контент, который ранжируется в топе, напрямую формирует понимание запроса системой и влияет на то, какие связанные запросы будут предложены.
Query Vector и центроидом из репозитория).Candidate Queries для выбора финального набора предложений.Centroid, сгенерированный на лету для текущего запроса пользователя. Он создается путем объединения Term Vectors из Топ-N результатов поиска по этому запросу.Claim 1 (Независимый пункт): Описывает полный процесс генерации контекстуальных и разнообразных подсказок.
Term Vector (наиболее взвешенные термины).Term Vectors генерируется search query centroid (Query Vector), представляющий собой наиболее общие термины среди векторов.Centroid Repository для нахождения ранее сохраненных центроидов, совпадающих с текущим.Dot Product для определения степени сходства.Candidate Queries.Claim 2 (Зависимый от 1): Определяет точную формулу для фильтра разнообразия (шаг 10).
Кандидат (qj) добавляется в набор предложений (Z), только если выполняется условие: ((∣qj∣−∣qj∩z∣>0.5∣z∣∀z∈(Z∪{u})). Где {u} – это исходный запрос.
Это означает, что кандидат должен отличаться более чем на половину своих терминов от исходного запроса И от любого другого запроса, уже добавленного в набор предложений Z. Это обеспечивает строгое лексическое разнообразие.
Claim 4 (Зависимый от 1): Уточняет метод поиска в репозитории (шаг 5).
Система генерирует Disjunction (объединение через OR) наиболее взвешенных терминов из текущего search query centroid. Этот дизъюнктивный запрос используется для эффективного поиска совпадающих центроидов в репозитории.
Изобретение затрагивает несколько этапов поиска, связывая данные индексирования с процессом понимания запроса и финальным представлением результатов.
INDEXING – Индексирование и извлечение признаков
На этом этапе для документов вычисляются и сохраняются Term Vectors (наиболее взвешенные термины), которые позже используются для генерации центроидов.
QUNDERSTANDING – Понимание Запросов (Офлайн)
Система заранее анализирует логи запросов, выполняет их и генерирует Centroid Repository. Это офлайн-процесс создания базы данных контекстов запросов.
RANKING – Ранжирование
Система выполняет исходный запрос пользователя и генерирует первичный набор результатов (SERP). Топ-N результатов этого этапа используются для дальнейшего анализа.
QUNDERSTANDING – Понимание Запросов (Онлайн) / METASEARCH – Метапоиск
Основное применение патента происходит после генерации первичной выдачи:
Query Vector (Centroid) для определения контекста запроса.Query Vector сравнивается с Centroid Repository, генерируются и ранжируются Candidate Queries.Входные данные:
Term Vectors для этих результатов.Centroid Repository (предварительно вычисленный).Выходные данные:
Процесс А: Обработка запроса и генерация подсказок в реальном времени
Term Vector (Топ-M наиболее взвешенных терминов).Term Vectors объединяются для создания Centroid (Vuq), представляющего контекст запроса.Disjunction из наиболее взвешенных терминов Vuq (например, Топ-3 термина через OR).Centroid Repository с использованием этой дизъюнкции.Dot Product) между Vuq и найденными центроидами.Процесс Б: Офлайн-генерация Репозитория Центроидов
real-world queries).Centroid Repository.Centroid Repository строится на основе анализа логов предыдущих пользовательских запросов.Term Vectors. Определяют значимость термина в документе.Query Vector и центроидами в репозитории. Более высокое значение указывает на большее сходство контекста.Centroid (контекстный вектор) на основе Топ-N результатов.Centroid) данного запроса. Если ваш контент ранжируется высоко, он влияет на то, как Google интерпретирует тему.Centroids или современные эмбеддинги) для сравнения контекстов различных запросов, даже если они не имеют общих ключевых слов.Centroids) всей темы, а не только отдельных запросов.Centroid через "highest-weighted terms".Centroid). Убедитесь, что ваш контент покрывает эти связанные области для укрепления релевантности.Centroid.Centroid, даже если попадет в Топ-N.Патент подтверждает стратегическую важность понимания контекста на уровне темы, а не отдельного запроса. Он показывает механизм, с помощью которого Google использует уже ранжирующийся контент для калибровки своего понимания запросов. Для SEO это означает, что стратегия должна быть направлена на доминирование в тематическом контексте. Влияние на подсказки — это не только источник дополнительного трафика, но и индикатор того, насколько сильно ваш сайт ассоциируется с темой в системах Google.
Сценарий: Анализ и фильтрация подсказок (Пример из патента)
Что такое Centroid (Центроид) в контексте этого патента?
Centroid — это векторное представление, которое суммирует контекст запроса. Он создается путем анализа Топ-N результатов поиска по этому запросу и извлечения из них наиболее значимых и часто встречающихся терминов (highest-weighted terms). По сути, это тематический отпечаток того, о чем говорится на страницах, которые хорошо ранжируются по данному запросу.
Как именно контент моего сайта влияет на генерацию этих подсказок?
Если ваш сайт стабильно находится в Топ-N результатов (например, Топ-50, как указано в патенте) по определенному запросу, контент вашей страницы напрямую участвует в генерации Centroid для этого запроса. Значимые термины с вашей страницы становятся частью этого контекстного вектора. Чем авторитетнее и семантически богаче ваш контент, тем сильнее вы влияете на определение контекста темы в Google.
Почему Google просто не предлагает самые контекстуально похожие запросы?
Потому что самые похожие запросы часто являются лексически почти идентичными исходному запросу (например, изменение окончаний, добавление стоп-слов). Патент направлен на устранение этой избыточности. Система использует строгий фильтр разнообразия, требующий, чтобы предложенный запрос отличался более чем на 50% терминов от исходного.
Что означает формула фильтрации (|qj| - |qj ∩ z| > 0.5|z|)?
Эта формула гарантирует лексическое разнообразие. Она проверяет, что количество уникальных терминов в предлагаемом запросе (qj) по сравнению с существующим запросом (z, который может быть исходным запросом или уже выбранной подсказкой) превышает половину длины существующего запроса. Это математический способ сказать: "предлагай только те запросы, которые существенно отличаются по написанию".
Что такое Centroid Repository и как он создается?
Это база данных, хранящая предварительно вычисленные контекстные векторы (Centroids) для миллионов запросов. Он создается офлайн путем анализа исторических логов поиска. Система обрабатывает эти запросы, анализирует их результаты и сохраняет полученные центроиды для быстрого доступа в будущем.
Использует ли Google этот механизм сейчас, учитывая возраст патента (подача 2005 г.)?
Концептуально — да. Принципы использования результатов поиска для понимания контекста и обеспечения разнообразия подсказок остаются ключевыми. Однако техническая реализация, скорее всего, изменилась. Вместо Centroids на основе TF-IDF и Dot Product, современные системы (BERT, MUM) используют плотные нейросетевые эмбеддинги для более глубокого понимания контекста и сходства.
Как использовать этот патент для улучшения SEO-стратегии?
Ключевой вывод — необходимость фокусироваться на Topical Authority и семантической глубине. Чтобы влиять на контекст темы, нужно постоянно присутствовать в Топ-N результатах с контентом, который содержит богатый набор релевантных терминов. Анализируйте предлагаемые Google подсказки как индикатор текущего контекста и расширяйте свой контент для его покрытия.
Что такое "Term Vector" и чем он отличается от "Query Vector"?
Term Vector — это представление отдельного документа, содержащее его самые важные термины. Query Vector (или Centroid запроса) — это агрегированное представление, созданное путем объединения Term Vectors нескольких топовых документов, ранжирующихся по данному запросу. Первый описывает документ, второй — контекст запроса.
Что такое "Disjunction" и зачем она используется?
Disjunction — это способ ускорить поиск похожих центроидов. Вместо сравнения текущего Query Vector со всеми векторами в базе данных, система берет Топ-3 (например) самых важных термина из Query Vector и ищет в базе только те центроиды, которые содержат хотя бы один из этих терминов (Term1 OR Term2 OR Term3). Это сужает пространство поиска.
Влияет ли этот патент на ранжирование моего сайта?
Напрямую — нет. Патент описывает механизм генерации подсказок, а не ранжирования документов. Однако он влияет косвенно: формируя контекст запроса (Centroid), он определяет "идеальное" тематическое направление для контента по этому запросу. Кроме того, он влияет на поисковый путь пользователя, направляя его на связанные запросы, где ваш сайт может получить дополнительный трафик.

Семантика и интент
SERP
Поведенческие сигналы

Персонализация
Поведенческие сигналы
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Мультимедиа
Семантика и интент
SERP

Семантика и интент
SERP
Персонализация

Поведенческие сигналы
EEAT и качество

SERP
Поведенческие сигналы
Семантика и интент

Структура сайта
SERP
Ссылки

SERP
EEAT и качество
Персонализация

Ссылки
SERP
EEAT и качество

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

Local SEO
Поведенческие сигналы
Семантика и интент

Структура сайта
SERP
Ссылки

Поведенческие сигналы
Индексация
Семантика и интент
