
Google идентифицирует связанные запросы, анализируя схожесть их исторических трендов популярности, а не только семантику. Система преобразует данные об объеме запросов в многомерные изображения и применяет вейвлет-анализ для извлечения ключевых характеристик трендов. Сравнение этих характеристик позволяет находить запросы с похожими паттернами роста или падения интереса.
Патент решает задачу идентификации связанных поисковых запросов за пределами их текстуального или семантического сходства. Цель — выявить запросы, которые демонстрируют схожие паттерны пользовательского интереса во времени (например, схожие подъемы или спады популярности), что указывает на скрытую связь в поведении пользователей, даже если ключевые слова различаются.
Запатентована система и метод идентификации связанных запросов путем анализа временных рядов их объемов (Query Volume). Суть изобретения заключается в преобразовании данных об объеме запросов в многомерные представления (изображения) и применении техник обработки изображений, в частности, вейвлет-анализа (Wavelet Analysis). Схожесть между запросами определяется путем сравнения извлеченных характеристик трендов.
Система работает в несколько этапов:
Relative Volume (доли трафика).Top Wavelets (с высокими коэффициентами магнитуды), которые отражают ключевые характеристики тренда.Top Wavelets сжимаются в компактные сигнатуры (Signatures), например, с помощью квантования или алгоритма Min-Hash.Locality-Sensitive Hashing, LSH) для эффективного поиска запросов со схожими временными паттернами.Средняя/Высокая. Концепция использования временной корреляции для понимания взаимосвязи запросов остается фундаментальной для Google (например, в Google Trends и Related Searches). Однако конкретные технические методы (вейвлет-анализ), описанные в патенте 2007 года, вероятно, были дополнены или заменены более современными подходами машинного обучения для анализа временных рядов.
Влияние на SEO умеренное (6/10). Патент не описывает алгоритмы ранжирования, но важен для понимания механизмов Query Understanding. Он влияет на формирование блоков «Похожие запросы» и анализ трендов. Для SEO-стратегии это подчеркивает важность анализа темпорального поведения аудитории и создания контент-плана, учитывающего сезонность и коррелирующие интересы.
Relative Volume.Top Wavelets) в компактную сигнатуру (Signature) с сохранением информации о схожести.Relative Volume путем деления объема конкретного запроса на общий объем всех запросов за тот же период. Нивелирует общие колебания трафика.Top Wavelets в сжатый формат, например, в бинарный вектор с ограниченным числом битов (например, 2 бита для обозначения положительного, отрицательного или незначительного коэффициента).Top Wavelets (например, через Квантование или Min-Hash).high magnitude coefficients), которые представляют наиболее значимые характеристики изображения (ключевые особенности тренда — пики и спады).Claim 1 (Независимый пункт): Описывает базовый метод сравнения двух разных запросов на основе анализа их объемов.
Top Wavelets) для каждого набора.Claim 3 и 4 (Зависимые): Уточняют критерии и данные.
Запросы связаны, если их представления демонстрируют схожие подъемы или спады (similar rises or decreases) объема (Claim 3). При этом используется нормализованный объем (Relative Volume) относительно объема всех запросов (Claim 4).
Claim 18 (Независимый пункт): Описывает применение метода в масштабе (для множества запросов).
Процесс аналогичен Claim 1, но применяется к множеству запросов: генерация представлений, вейвлетов, Top Wavelets и сигнатур для каждого запроса, с последующим сравнением сигнатур для выявления связей.
Claims 19, 20, 21 (Зависимые от 18): Детализируют механизмы масштабирования и эффективности.
Генерация сигнатур осуществляется с использованием алгоритма Min-Hash (Claim 19). Для эффективного поиска сигнатур, подлежащих сравнению, используется Locality Sensitive Hashing (LSH) (Claims 20, 21).
Изобретение применяется в основном на этапе анализа данных и понимания запросов, и не является частью real-time ранжирования контента.
CRAWLING (Data Acquisition)
Система требует сбора и хранения обширных исторических логов поисковых запросов (Query Logs), включая временные метки и метаданные (география, тип поиска).
QUNDERSTANDING – Понимание Запросов
Основное применение патента. Система анализирует логи запросов офлайн (в пакетном режиме) для построения моделей взаимосвязей между запросами на основе их темпорального поведения. Этот анализ помогает понять, как интересы пользователей эволюционируют и коррелируют во времени. Результаты используются для генерации предложений «Связанные запросы» (Related Searches) и в инструментах аналитики (Google Trends).
METASEARCH – Метапоиск и Смешивание (Косвенно)
В патенте упоминается (Claims 6, 7), что идентифицированные связанные запросы могут быть показаны пользователю, или результаты для связанного запроса могут быть предоставлены вместе с результатами исходного запроса. Это может влиять на финальное формирование SERP.
Входные данные:
Выходные данные:
Signatures) для каждого запроса, инкапсулирующие его тренд.blurring), либо за счет использования представлений без временной оси (например, География vs Тип запроса).Процесс идентификации связанных запросов:
Relative Volume для 'Q'. .Relative Volume. Например, оси: Неделя (X) и День Недели (Y).blurring, например, Гауссов фильтр) к изображению. Это сглаживает резкие края и помогает находить совпадения, даже если тренды немного смещены.Top Wavelets – коэффициентов, магнитуда которых превышает пороговое значение.Top Wavelets в бинарный вектор (например, 2 бита на коэффициент: положительный, отрицательный, незначительный).Min-Hash к набору Top Wavelets для создания компактной сигнатуры.Locality Sensitive Hashing (LSH) для группировки схожих сигнатур в общие корзины. Сравнение выполняется только внутри корзин для быстрого поиска связанных запросов. Запросы с наиболее похожими сигнатурами идентифицируются как связанные.Система использует исключительно данные из логов поисковой системы.
Query Logs). Анализируется частота ввода запросов пользователями с течением времени.Top Wavelets по пороговому значению.Min-Hash, LSH.Relative Volume (долю трафика), а не абсолютный объем. Это ключевой момент, позволяющий выявлять реальные тренды интереса к теме, игнорируя общие колебания поискового трафика.Min-Hash) и быстрого поиска похожих элементов (LSH).blurring), либо за счет использования представлений без временной оси.Патент подтверждает, что Google рассматривает поведение пользователей во времени как важный сигнал для понимания взаимосвязей в мире (Query Understanding). Для SEO это означает, что стратегия должна быть ориентирована не только на то, что ищут пользователи, но и на то, когда они это ищут, и что еще они ищут в это же время. Понимание темпоральной динамики спроса и создание комплексного контента, отвечающего коррелирующим интересам, является важной частью долгосрочной стратегии.
Сценарий 1: Планирование контента на основе сезонных корреляций (Пасха)
Signatures) этих запросов почти идентичны (резкий рост перед Пасхой). Система идентифицирует их как тесно связанные.Сценарий 2: Реакция на событие (Выход фильма)
Top Wavelets).Основан ли этот патент на семантической близости запросов?
Нет. Ключевая особенность этого патента в том, что он определяет связанность запросов исключительно на основе схожести их временных трендов (Query Volume patterns). Система может идентифицировать как связанные запросы, которые семантически различны, но демонстрируют схожие всплески популярности в одно и то же время (например, запросы, связанные с определенным праздником).
Что такое вейвлеты и зачем они используются?
Вейвлеты — это математический инструмент для анализа сигналов и изображений. В контексте патента они используются для разложения тренда популярности на компоненты на разных масштабах (multi-resolution analysis). Это позволяет обнаруживать как долгосрочные тренды (годовую сезонность), так и краткосрочные резкие всплески (события) и использовать эту информацию для сравнения запросов.
Почему Google нормализует объем запросов?
Нормализация (расчет Relative Volume) критически важна для выявления реальных трендов. Она позволяет определить долю конкретного запроса от общего числа поисков в данный момент. Это нивелирует общие колебания трафика (например, ночью ищут меньше). Система ищет рост интереса к теме, а не просто рост общего числа запросов.
Что такое Top Wavelets?
Top Wavelets – это вейвлет-коэффициенты с наибольшей магнитудой (величиной). Они представляют собой наиболее значимые характеристики временного тренда запроса (например, самые сильные пики или падения). Система фокусируется только на них при сравнении запросов, отбрасывая менее значимую информацию (шум).
Как система справляется со сравнением миллионов запросов?
Патент описывает механизмы масштабирования. Во-первых, Top Wavelets сжимаются в компактные сигнатуры (например, с помощью Min-Hash). Во-вторых, для быстрого поиска похожих сигнатур используется Locality Sensitive Hashing (LSH). LSH позволяет группировать похожие запросы вместе, избегая необходимости сравнивать каждый запрос с каждым.
Может ли система найти связанные запросы, тренды которых смещены во времени?
Да, в патенте предусмотрена такая возможность. Во-первых, предварительное размытие (blurring) изображения помогает находить схожие тренды с небольшим смещением. Во-вторых, если многомерное представление не использует время как одну из осей (например, География vs Тип поиска), система может идентифицировать схожие паттерны, даже если они произошли в разное время.
Как этот патент используется в поиске Google?
Этот патент не описывает алгоритм ранжирования. Он используется в системах Понимания Запросов (Query Understanding). Наиболее вероятные применения – это генерация блока «Связанные запросы» (Related Searches), анализ данных в Google Trends, а также потенциальное подмешивание результатов из связанных запросов в основную выдачу (как упомянуто в Claims 6, 7).
Какое значение этот патент имеет для SEO-стратегии?
Он подчеркивает важность темпоральной контент-стратегии. SEO-специалистам необходимо понимать не только ЧТО ищут пользователи, но и КОГДА, а также ЧТО ЕЩЕ они ищут в это же время. Необходимо синхронизировать создание и продвижение контента с временными паттернами спроса и охватывать смежные темы, которые трендят одновременно.
Учитывает ли система географию при анализе трендов?
Да, в патенте явно упоминается возможность добавления географических данных (например, страны происхождения запроса) как дополнительного измерения (оси) в многомерное представление. Это позволяет системе находить связанные запросы с учетом локальных трендов.
Что подразумевается под «многомерным представлением» или «изображением» объема запросов?
Это способ организации данных о популярности запроса. Например, можно создать 2D-изображение, где ось X – это недели года, а ось Y – дни недели. Значение в каждой ячейке (пикселе) – это Relative Volume запроса в этот день. Также можно использовать другие измерения, например, географию или тип вертикали поиска (Web, Images).

Индексация
Техническое SEO

Индексация

Мультимедиа
Индексация

Мультимедиа
Индексация

Мультимедиа

Персонализация
Поведенческие сигналы
SERP

Свежесть контента
Поведенческие сигналы
SERP

Поведенческие сигналы

Ссылки

Ссылки
Индексация
Мультимедиа

Поведенческие сигналы
Семантика и интент
Структура сайта

Персонализация
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Индексация
Техническое SEO

Поведенческие сигналы
Семантика и интент
Антиспам
