
Google использует метод классификации запросов, который анализирует не сам текст запроса, а контент (URL, заголовки, сниппеты) страниц, находящихся в топе выдачи по этому запросу. Сравнивая набор терминов из этих результатов с эталонными профилями разных тематик или типов контента (Новости, Видео, Картинки), система определяет интент пользователя и решает, какие вертикали поиска активировать.
Патент решает проблему точной и своевременной классификации поисковых запросов, особенно коротких, неоднозначных или новых (трендовых). Он устраняет зависимость от традиционных методов, основанных на исторических логах запросов (query logs), которые медленно обновляются и дороги в поддержке. Изобретение позволяет динамически определять интент пользователя, опираясь на актуальное состояние веба, а не на устаревшие данные.
Запатентована система классификации запросов, которая определяет класс запроса (тематику или тип контента) путем анализа результатов поиска (SERP), которые этот запрос генерирует. Система заранее создает эталонные векторы признаков (Classification Feature Vectors) для известных классификаций. При поступлении нового запроса система анализирует его выдачу, создает вектор результатов поиска (Search Result Vector) и сравнивает его с эталонными векторами. Ближайший эталон определяет классификацию, которая затем используется для запуска вертикального поиска.
Механизм работает в два этапа:
Training Queries). По ним получаются результаты поиска. Из контента этих результатов (URL, заголовки, сниппеты) извлекаются и взвешиваются ключевые термины (например, на основе частоты, позиции в выдаче, CTR). Этот взвешенный набор формирует эталонный Classification Feature Vector.Search Result Vector. Этот вектор сравнивается (используя скалярное произведение – dot product) со всеми эталонными векторами. Запросу присваивается классификация, чей вектор оказался наиболее близким.Высокая. Понимание интента запроса и динамическое формирование универсальной выдачи (Universal Search) критически важны для Google. Описанный метод позволяет классифицировать запросы на лету, опираясь на "консенсус SERP" (то, какие результаты ранжируются в данный момент), что крайне важно для обработки трендов, новостей и неоднозначных запросов, даже при наличии современных NLP-моделей.
Патент имеет высокое значение для SEO (8/10). Он показывает, что классификация запроса (и, следовательно, активация вертикалей поиска) напрямую зависит от контента страниц, которые уже ранжируются в топе. Это подчеркивает важность анализа терминологии лидеров SERP (особенно в Titles и Snippets) и необходимость соответствия этому семантическому профилю для правильной интерпретации интента поисковой системой.
Training Queries. Состоит из взвешенных терминов, характерных для данной классификации.Search Result Vector и Classification Feature Vector. Более высокое значение указывает на большее сходство.Corpus (например, блок Новостей).Claim 1 (Независимый пункт): Описывает полный цикл работы системы от обучения до применения классификации для запуска вертикального поиска.
training queries), репрезентативных для конкретной классификации.Classification Feature Vector. Значение элемента вектора представляет частоту термина (term frequency) в этих результатах.Search Result Vector для нового запроса.Search Result Vector наиболее близок к Classification Feature Vector конкретной классификации.Vertical Content Type в соответствии с этой классификацией из определенного Corpus.Claim 3 (Зависимый): Уточняет источники извлечения терминов для генерации векторов. Это URL (Uniform Resource Locators), заголовки (titles) или сниппеты (snippets) результатов поиска.
Claims 4, 5, 6 (Зависимые): Описывают методы взвешивания терминов при генерации векторов. Вес термина может зависеть от:
estimated click through rate) результата поиска (Claim 5).corpus-specific weight), из которого был получен результат (Claim 6).Claim 8 (Зависимый): Уточняет метод определения близости векторов. Используется вычисление скалярного произведения (dot product), и выбирается вектор с наивысшим значением.
Изобретение в первую очередь работает на этапах понимания запроса и формирования смешанной выдачи.
QUNDERSTANDING – Понимание Запросов
Основной этап применения. Система использует этот механизм для интерпретации интента и определения категории запроса. Это происходит как офлайн (обучение Feature Vectors), так и в рантайме (классификация нового запроса путем анализа его SERP).
RANKING – Ранжирование
Этот этап предоставляет входные данные для классификатора. Система должна сначала сгенерировать предварительный набор результатов поиска, чтобы проанализировать их и создать Search Result Vector.
METASEARCH – Метапоиск и Смешивание
Результат классификации используется здесь. Как указано в Claim 1, определенная классификация служит триггером для получения результатов vertical content type из соответствующего corpus (например, запуск поиска по Новостям) и последующего смешивания их в универсальную выдачу.
Входные данные (Рантайм):
Classification Feature Vectors.Выходные данные (Рантайм):
Feature Vectors остаются неизменными.Алгоритм состоит из двух процессов: Обучение и Классификация.
Процесс А: Обучение классификатора (Офлайн)
Training Queries.Term Frequency. К частотам применяются веса, основанные на: Classification Feature Vector. Веса могут быть нормализованы.Процесс Б: Классификация запроса (Рантайм)
Search Result Vector для входящего запроса.Dot Product) между Search Result Vector и каждым из предобученных Classification Feature Vectors.Dot Product.corpus и подмешивает результаты в выдачу.Система использует данные, извлеченные непосредственно из результатов поиска:
Titles) и Сниппетов (Snippets). Также упоминается возможность использования содержимого ресурсов.Uniform Resource Locators).estimated click through rate) результатов поиска используется как фактор взвешивания (Claim 5).Ranking) результата в выдаче (Claim 4) и тип корпуса (Corpus type) (Claim 6) используются для взвешивания.Search Result Vector для данного запроса. Ваш контент должен соответствовать этому профилю.Feature Vector этой вертикали. Например, для видео это могут быть слова "смотреть", "обзор", "онлайн" в заголовках.Search Result Vector и затрудняет правильную классификацию.Патент подтверждает, что понимание запроса (Query Understanding) — это не только лингвистический анализ, но и анализ экосистемы контента. Стратегически это означает, что SEO-специалисты, занимая позиции в ТОПе, коллективно влияют на то, как Google интерпретирует запрос. Долгосрочная стратегия должна быть направлена на формирование четкого и последовательного тематического сигнала, соответствующего языку лидеров ниши.
Сценарий: Классификация неоднозначного запроса "Python"
Feature Vector для "Животные" (термины: змея, рептилия, ареал) и Feature Vector для "Программирование" (термины: язык, код, tutorial, data science).Search Result Vector будет иметь высокие веса для "tutorial", "data science".Search Result Vector сравнивается с эталонными векторами. Он оказывается значительно ближе к вектору "Программирование".Search Result Vector изменится, и классификация может временно сместиться к "Новости" или "Животные".Что такое Feature Vector в контексте этого патента?
Feature Vector (Вектор признаков классификации) — это эталонный профиль для определенной категории (например, «Фильмы» или «Новости»). Он представляет собой набор взвешенных терминов, которые часто встречаются в результатах поиска по запросам этой категории. Этот вектор генерируется офлайн в процессе обучения системы.
Как система определяет, к какой категории отнести новый запрос?
Система анализирует результаты поиска (SERP) по новому запросу и генерирует Search Result Vector. Затем она сравнивает этот вектор со всеми эталонными Feature Vectors с помощью скалярного произведения (Dot Product). Запросу присваивается категория, чей эталонный вектор показал наибольшее сходство (наивысший Dot Product).
Откуда система берет данные для анализа при классификации запроса?
Патент явно указывает три основных источника (Claim 3): URL, Заголовки (Titles) и Сниппеты (Snippets) результатов поиска. Это подчеркивает критическую важность оптимизации этих элементов для того, как Google будет классифицировать запросы, ведущие на вашу страницу.
Все ли результаты в SERP одинаково важны для классификации?
Нет. Патент описывает взвешивание (Claims 4 и 5). Термины из результатов, находящихся выше в ранжировании (например, ТОП-3), получают больший вес. Также больший вес могут получать термины из результатов с более высоким оценочным CTR. Это означает, что лидеры выдачи оказывают наибольшее влияние на классификацию запроса.
Может ли классификация запроса измениться со временем?
Да, абсолютно. Поскольку классификация основана на анализе текущих результатов поиска (SERP), она является динамической. Если SERP изменится из-за трендов или обновления алгоритмов, то и Search Result Vector для запроса изменится, что может привести к его переклассификации без необходимости переобучения модели.
Заменяет ли этот механизм анализ исторических логов запросов?
Да, одно из ключевых преимуществ этого метода — устранение зависимости от исторических логов (query logs). Это позволяет системе быстрее адаптироваться к новым событиям и классифицировать запросы, по которым еще нет накопленной истории поведения пользователей.
Как этот патент влияет на работу с неоднозначными запросами (например, «Apple»)?
Этот механизм идеально подходит для таких случаев. Система анализирует текущий SERP. Если в заголовках и сниппетах доминируют термины, связанные с технологиями («iPhone», «MacBook»), запрос будет классифицирован как «Технологии». Если доминируют термины «fruit», «recipe» — как «Еда». Классификация зависит от консенсуса веба.
Какова основная цель этой классификации согласно патенту?
Основная цель, описанная в Claim 1, — это активация вертикального поиска. Если запрос классифицирован, например, как «Новости», система инициирует поиск в новостном корпусе (Corpus) и предоставляет пользователю соответствующие вертикальные результаты (Vertical Content Type), такие как блок «Главные новости».
Что делать SEO-специалисту, если запрос классифицируется неправильно с его точки зрения?
Поскольку классификация определяется консенсусом SERP, единственный способ изменить ее — это изменить сам SERP. Необходимо создавать и продвигать в ТОП контент, который содержит четкие сигналы (в Title, Snippet, URL), соответствующие желаемой классификации. Когда достаточное количество таких страниц займет лидирующие позиции, Search Result Vector изменится.
Заменяет ли этот патент NLP-модели, такие как BERT?
Нет, он их дополняет. NLP-модели фокусируются на лингвистическом анализе текста запроса и контента. Описанный механизм фокусируется на анализе совокупности результатов поиска как мета-сигнала. В реальной системе эти подходы, вероятно, комбинируются для максимально точного понимания интента пользователя.

Семантика и интент
Мультимедиа
Индексация

SERP
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Семантика и интент

Семантика и интент
SERP

Семантика и интент
Поведенческие сигналы
Персонализация

Local SEO
Антиспам
Поведенческие сигналы

Ссылки
SERP
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Антиспам
Ссылки
Техническое SEO

Поведенческие сигналы
Индексация
Техническое SEO

Поведенческие сигналы
Мультиязычность
Персонализация

SERP
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Семантика и интент
