Google анализирует цепочки запросов пользователей в рамках поисковых сессий. Если пользователь начинает с общего или неточного запроса и уточняет его до тех пор, пока не найдет конкретный авторитетный ресурс, система связывает этот конечный ресурс с исходным запросом. В будущем этот авторитетный ресурс будет повышен в ранжировании по исходному запросу на основе коллективного поведения пользователей.
Описание
Какую задачу решает
Патент решает проблему неэффективных поисковых сессий, когда пользователи вводят широкие или неточные запросы и вынуждены многократно их уточнять, чтобы найти нужный высококачественный ресурс. Например, пользователь ищет «дискуссии», хотя на самом деле ему нужен «Usenet» (и сайт groups.google.com). Изобретение направлено на сокращение этого пути пользователя путем анализа коллективного опыта предыдущих поисковых сессий и предоставления конечного целевого ресурса сразу.
Что запатентовано
Запатентована система идентификации навигационных ресурсов на основе анализа последовательностей запросов (Query Sequences) в поисковых сессиях. Система выявляет паттерны, когда пользователи переходят от запроса с низкими показателями качества и навигационности (Candidate Query) к уточненному запросу (Revised Query) с высокими показателями. Найденный для уточненного запроса ресурс (Navigational Resource) затем ассоциируется с исходным запросом, что повышает его релевантность при будущих поисках.
Как это работает
Механизм (Revision Navigation Analyzer) анализирует логи запросов и кликов для выявления Query Sequences. Для каждого запроса вычисляются Quality Score (QS) и Navigation Score (NS).
- Идентификация Цели: Система ищет Revised Query в цепочке, у которого QS и NS превышают пороги (успешное завершение поиска).
- Идентификация Источника: Система ищет предшествующий Candidate Query в той же цепочке, у которого QS и NS ниже порогов.
- Валидация Связи: Проверяется, что переход от источника к цели не случаен (например, через условную вероятность P(RQ|CQ) > P(RQ)).
- Ассоциация: Navigational Resource (целевой сайт) уточненного запроса ассоциируется с исходным запросом и сохраняется в Navigation Store.
- Применение: При получении будущего запроса, совпадающего с исходным, система использует эту ассоциацию для повышения (boosting) релевантности Navigational Resource в выдаче.
Актуальность для SEO
Высокая. Понимание намерений пользователя на основе контекста сессии и коллективного поведения (Query Understanding) является центральным элементом современного поиска. Этот патент описывает конкретный механизм обучения на основе данных о ревизиях запросов для модификации интента и прямого выявления навигационных целей. Технология крайне актуальна для улучшения качества выдачи по широким и неоднозначным запросам.
Важность для SEO
Патент имеет критическое значение (9/10). Он описывает механизм, который напрямую влияет на ранжирование по широким запросам, отдавая предпочтение ресурсам, которые пользователи коллективно идентифицировали как конечную цель поиска (Navigational Resource). Это подчеркивает стратегическую важность брендинга и становления авторитетным источником в нише. Если сайт является таким источником, он может получить значительный буст по небрендовым запросам, которые пользователи часто уточняют до него.
Детальный разбор
Термины и определения
- Candidate Query (Кандидатный запрос)
- Запрос в Query Sequence, который предшествует Revised Query. Обычно имеет низкий Quality Score и низкий Navigation Score. Это запрос, с которым система стремится ассоциировать Navigational Resource.
- Click Logs (Логи кликов)
- Хранилище данных о действиях пользователей в ответ на результаты поиска (клики, CTR, long clicks, short clicks).
- Navigation Score (NS) (Оценка навигационности)
- Метрика, определяющая, насколько запрос направлен на конкретный ресурс. Основана на Navigational Metrics (например, Traffic Proportion, Cross linkage, CTR).
- Navigational Resource (Навигационный ресурс)
- Ресурс, который идентифицируется как конечная цель поиска для Revised Query. Обычно это ресурс, получающий значительную долю трафика (Traffic Proportion) по данному запросу.
- Navigation Store (Хранилище навигационных данных)
- База данных, хранящая ассоциации между Candidate Queries и Navigational Resources.
- Quality Score (QS) (Оценка качества)
- Метрика качества запроса и его результатов. Основана на Resource Metrics (например, Authority Score, CTR) и Revision Metrics (например, частота и время ревизии запроса).
- Query Sequence (Последовательность запросов)
- Набор запросов (исходный и один или более уточненных), введенных в определенном порядке в рамках одной поисковой сессии.
- Revised Query (Уточненный запрос)
- Запрос в Query Sequence, который следует за Candidate Query. В контексте патента, это запрос с высоким QS и высоким NS, который приводит к Navigational Resource.
- Revision Navigation Analyzer (Анализатор навигационных уточнений)
- Компонент системы, который анализирует логи запросов и кликов для выявления Navigational Resources и их ассоциации с Candidate Queries.
- Traffic Proportion (Доля трафика)
- Доля кликов, которую получает конкретный ресурс из общего объема трафика по результатам поиска, сгенерированным в ответ на запрос.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод идентификации и использования навигационных ресурсов.
- Выбирается Query Sequence из лога запросов.
- В этой последовательности выбирается Revised Query (RQ), у которого Quality Score > порога И Navigation Score > порога.
- В этой же последовательности выбирается предшествующий запрос.
- Определяется, является ли предшествующий запрос Candidate Query (CQ): его Quality Score < порога И Navigation Score < порога.
- Если ДА:
- Идентифицируется Navigational Resource (NR) для RQ.
- NR ассоциируется с CQ. Ассоциация сохраняется в Navigation Store.
- Применение в реальном времени: Система получает новый запрос и проверяет совпадения в Navigation Store.
- Если совпадение есть, поисковая операция использует ассоциацию для определения релевантности NR к полученному запросу (бустинг).
- Если совпадения нет, поисковая операция выполняется стандартно.
Claim 4 (Зависимый от 1): Добавляет критическое условие вероятности для валидации связи.
Предшествующий запрос считается Candidate Query, только если вероятность ревизии (перехода) от него к Revised Query больше, чем общая вероятность ввода Revised Query (P(RQ|CQ) > P(RQ)). Это условие необходимо, чтобы убедиться, что связь между запросами в сессии не случайна и отражает реальное уточнение поиска, а не смену темы.
Claim 5 (Зависимый от 1): Детализирует расчет Quality Score.
Quality Score определяется на основе Resource Metrics (например, Authority Score, CTR) и Revision Metrics (например, частота ревизий Revision Frequency, время ревизии Revision Time).
Claim 6, 7 и 8 (Зависимые от 1): Детализируют расчет Navigation Score и идентификацию Navigational Resource.
Navigation Score определяется на основе Navigational Metrics (например, Cross linkage score, CTR). Ключевым фактором является Traffic Proportion (доля трафика). Navigational Resource идентифицируется как ресурс, чья доля трафика превышает пороговое значение (Traffic Proportion Threshold).
Где и как применяется
Изобретение охватывает как офлайн-процессы анализа данных, так и онлайн-процессы ранжирования.
INDEXING – Индексирование и извлечение признаков
На этом этапе рассчитываются статические сигналы, необходимые для последующего анализа. В частности, рассчитываются Authority Scores (например, PageRank) и данные о перекрестных ссылках (Cross linkage).
QUNDERSTANDING – Понимание Запросов (Офлайн-анализ)
Основная логика патента реализуется здесь в режиме офлайн-обработки. Revision Navigation Analyzer обрабатывает Query Logs и Click Logs:
- Идентифицирует поисковые сессии и Query Sequences.
- Рассчитывает Quality Score и Navigation Score для запросов, используя данные из логов и индекса.
- Выявляет паттерны ревизий (от низкокачественных к высококачественным/навигационным запросам).
- Генерирует ассоциации и наполняет Navigation Store.
RANKING / RERANKING – Ранжирование и Переранжирование (Онлайн)
Применение результатов анализа происходит на этапе выполнения запроса.
- При получении запроса система проверяет Navigation Store.
- Если найдена ассоциация, система корректирует релевантность связанного Navigational Resource. Это может происходить либо путем интеграции сигнала в основной алгоритм ранжирования (RANKING), либо путем корректировки порядка результатов (RERANKING/Twiddlers). Патент описывает оба варианта.
Входные данные (Офлайн):
- Query Logs (последовательности запросов, временные метки).
- Click Logs (CTR, Traffic Proportion, long/short clicks).
- Индекс ресурсов (Authority Scores, Cross linkage данные).
Выходные данные (Офлайн):
- Navigation Store (ассоциации Candidate Query : Navigational Resource).
Входные данные (Онлайн):
- Запрос пользователя.
- Navigation Store.
Выходные данные (Онлайн):
- Скорректированные результаты поиска с повышенным рангом Navigational Resource.
На что влияет
- Специфические запросы: Наибольшее влияние оказывается на широкие, неоднозначные или информационные запросы, которые пользователи часто используют в начале сессии, но которые маскируют конкретное навигационное намерение.
- Конкретные типы контента: Способствует продвижению основных страниц авторитетных сайтов, брендов или известных ресурсов (Navigational Resources), которые являются частой конечной целью поиска.
- Конкретные ниши или тематики: Сильно влияет на ниши, где существуют четко выраженные авторитетные источники или бренды, к которым пользователи стремятся попасть (e-commerce, финансы, здоровье).
Когда применяется
- Триггеры активации (Офлайн): Алгоритм активируется при анализе Query Sequence, если обнаруживается переход от запроса с низкими оценками (ниже порогов QS и NS) к запросу с высокими оценками (выше порогов).
- Условие валидации (Офлайн): Применяется, только если вероятность перехода между этими запросами выше случайной (P(RQ|CQ) > P(RQ)).
- Триггеры активации (Онлайн): Механизм повышения ранга активируется, когда введенный пользователем запрос совпадает (точно или с учетом синонимов/опечаток) с Candidate Query, сохраненным в Navigation Store.
- Ограничения (Онлайн): Патент упоминает возможность ограничения повышения ранга (например, не выше 4-й позиции), чтобы не мешать пользователям, которые вводят информационный запрос и не ищут навигационный результат.
Пошаговый алгоритм
Процесс состоит из двух основных частей: офлайн-анализа для создания ассоциаций и применения этих ассоциаций в реальном времени.
Часть А: Офлайн-анализ и создание Navigation Store
- Сбор данных: Сбор Query Logs и Click Logs.
- Идентификация сессий: Группировка запросов в Query Sequences на основе идентификатора пользователя и временных меток (revision window time).
- Расчет метрик: Для каждого запроса вычисляются Quality Score (QS) и Navigation Score (NS).
- Обработка последовательностей: Для каждой Query Sequence:
- Выбор Уточненного Запроса (Revised Query — RQ): Выбирается запрос в цепочке, у которого QS и NS превышают пороги.
- Поиск Кандидатного Запроса (Candidate Query — CQ): Анализируются запросы, предшествующие RQ в этой цепочке.
- Проверка условий для CQ: Проверяется, имеет ли предшествующий запрос QS и NS ниже порогов.
- Валидация связи: Проверяется, что условная вероятность P(RQ|CQ) превышает базовую вероятность P(RQ).
- Идентификация Ресурса: Если условия выполнены, идентифицируется Navigational Resource (NR) для RQ (например, ресурс с наибольшей долей трафика).
- Сохранение Ассоциации: Ассоциация (CQ : NR) сохраняется в Navigation Store.
Часть Б: Применение в реальном времени (Ранжирование)
- Получение запроса: Система получает запрос от пользователя.
- Проверка Navigation Store: Система проверяет, совпадает ли полученный запрос с каким-либо CQ в Navigation Store.
- Генерация результатов и Корректировка:
- Система генерирует результаты поиска.
- Если совпадение найдено, система идентифицирует связанный NR и повышает его релевантность (boosting). Повышение может быть ограничено определенной позицией.
- Выдача результатов: Скорректированный набор результатов предоставляется пользователю.
Какие данные и как использует
Данные на входе
Система в значительной степени полагается на поведенческие данные, дополненные метриками авторитетности и техническими характеристиками.
- Поведенческие факторы (Ключевые):
- Query Logs и Click Logs: Последовательности запросов, временные метки сессий.
- Click-through rate (CTR): Используется для расчета как QS, так и NS.
- Traffic Proportion: Доля трафика на ресурс. Ключевой фактор для NS и идентификации Navigational Resource.
- Revision time: Время между запросами в сессии.
- Revision frequency: Как часто запрос уточняется дальше.
- Long clicks / Short clicks: Упоминаются как данные, которые могут храниться в логах кликов.
- Ссылочные факторы / Авторитетность:
- Authority Score: Метрика авторитетности ресурса (например, PageRank). Используется для расчета QS.
- Cross linkage: Перекрестные ссылки между ресурсами в выдаче. Используется для расчета NS.
- Технические факторы (Характеристики URL):
- Длина URL и глубина директории. Упоминаются как Resource Metrics для QS (короткие URL верхнего уровня предпочитаются).
Какие метрики используются и как они считаются
Система вычисляет две ключевые оценки для каждого запроса:
1. Quality Score (QS)
Рассчитывается на основе комбинации Resource Metrics и Revision Metrics. Может использоваться функция вида: QS = f1(f2(resource metrics), f3(revision metrics)).
- Resource Metrics: Authority scores, CTR, характеристики URL, базовые оценки релевантности (IR scores).
- Revision Metrics: Revision type (тип уточнения), Revision time, Revision frequency.
2. Navigation Score (NS)
Рассчитывается на основе Navigational Metrics.
- Navigational Metrics: Cross linkage, распределение Authority scores в выдаче, CTR, Traffic Proportion (ключевой фактор).
Методы расчета и условия:
- Машинное обучение: Патент упоминает, что QS и NS могут быть результатом работы моделей машинного обучения (регрессионные модели), обученных на данных с оценками асессоров.
- Пороговые значения: Используются Quality Score Threshold и Navigation Score Threshold для классификации запросов.
- Вероятностный анализ: Используется условная вероятность P(RQ|CQ) и базовая вероятность P(RQ) для валидации связи между запросами (Условие: P(RQ|CQ) > P(RQ)).
Выводы
- Коллективное поведение определяет интент: Патент демонстрирует, как Google использует агрегированные данные о поведении пользователей (уточнения запросов и клики) для определения истинного намерения, стоящего за широкими или неточными запросами. Система учится на прошлых поисковых путях пользователей.
- Автоматическое выявление навигационных целей: Система автоматически определяет, какие ресурсы являются конечной целью (Navigational Resource) для определенных цепочек запросов, основываясь на концентрации трафика (Traffic Proportion) и высоком CTR.
- Модификация ранжирования на основе истории сессий: Если достаточное количество пользователей переходит от запроса А к запросу Б и выбирает ресурс R, система начнет показывать ресурс R выше в ответ на запрос А, даже если он изначально не был оптимально релевантен запросу А.
- Важность статистической значимости (Неслучайные связи): Система использует вероятностный анализ (P(RQ|CQ) > P(RQ)), чтобы гарантировать, что ассоциация создается только тогда, когда уточнение запроса является закономерным, а не случайным переключением контекста.
- Многофакторная оценка запросов (QS и NS): Качество и навигационность запроса оцениваются комплексно, учитывая авторитетность ресурсов (Authority), поведение пользователей (CTR, Traffic Proportion) и характеристики самих ревизий (время, частота).
- Преимущество для авторитетов и брендов: Механизм явно благоприятствует сайтам, которые пользователи уже знают и часто ищут (Destination Sites). Это механизм усиления позиций лидеров рынка и авторитетных источников по общим запросам.
Практика
Best practices (это мы делаем)
- Стать «Пунктом Назначения» (Navigational Resource): Стратегическая цель — стать доминирующим ресурсом в своей нише. Необходимо стремиться к тому, чтобы пользователи завершали свои поисковые сессии на вашем сайте. Это требует сочетания сильного бренда, тематического авторитета (Topical Authority) и отличного пользовательского опыта.
- Максимизация CTR и Доли Трафика (Traffic Proportion): Работайте над привлекательностью сниппетов и обеспечением максимальной удовлетворенности пользователя (long clicks). Высокие показатели CTR и доли трафика по целевым запросам критически важны для повышения Navigation Score и Quality Score.
- Анализ путей пользователя (User Journeys): Изучайте данные (GSC, аналитика), чтобы понять, как пользователи уточняют запросы, чтобы добраться до вашего контента. Понимание этих паттернов (от Candidate Query к Revised Query) помогает оптимизировать стратегию.
- Укрепление авторитетности (Authority Building): Повышайте общую авторитетность сайта (Authority Score), так как это является компонентом Quality Score. Высококачественная выдача по вашим целевым запросам повышает вероятность активации механизма в вашу пользу.
- Техническая оптимизация URL: Патент явно упоминает характеристики URL (длина, глубина) как фактор Quality Score. Используйте короткие, чистые URL, расположенные ближе к корню домена для ключевых страниц.
Worst practices (это делать не надо)
- Быть «одним из многих»: Если ваш сайт не выделяется по доле трафика (низкий Traffic Proportion), он не будет классифицирован как Navigational Resource. Стратегии массового создания контента без фокуса на доминирование в конкретных интентах неэффективны в контексте этого патента.
- Игнорирование удовлетворенности пользователя: Если пользователи часто покидают ваш сайт и продолжают уточнять запрос (высокий Revision Frequency для ваших запросов), это снизит Quality Score этих запросов и уменьшит вероятность того, что ваш сайт будет признан Navigational Resource.
- Фокус только на широких запросах без построения бренда: Попытки ранжироваться по ВЧ общим запросам без сильного бренда рискованны, так как этот механизм будет активно продвигать устоявшиеся Navigational Resources выше вашего контента.
Стратегическое значение
Этот патент подтверждает стратегическую важность данных о поведении пользователей на уровне сессий. Он показывает, как Google переносит успешный опыт одних пользователей на будущие поисковые сессии других. Для SEO это означает, что оптимизация не ограничивается контентом и ссылками; она включает в себя формирование паттернов поведения и построение ресурса, который является очевидной конечной целью поиска в своей тематике. Лидеры рынка (Бренды и Авторитеты) получают дополнительное преимущество по общим запросам за счет этого механизма.
Практические примеры
Сценарий: Продвижение крупного интернет-магазина по общему запросу
- Паттерн поведения (Query Sequence):
- Запрос 1 (CQ): «купить телефон» (Низкий NS – выдача разнообразна).
- Запрос 2: «купить телефон онлайн отзывы».
- Запрос 3 (RQ): «М.Видео телефоны» (Высокий QS/NS – пользователи ищут конкретный магазин, высокий CTR на mvideo.ru).
- Анализ Google: Система фиксирует этот паттерн у тысяч пользователей. Проверяет, что P(RQ|CQ) > P(RQ).
- Действие системы: Google идентифицирует mvideo.ru как Navigational Resource для RQ и ассоциирует его с CQ («купить телефон»). Ассоциация сохраняется в Navigation Store.
- Результат: В будущем, когда пользователь вводит «купить телефон», сайт mvideo.ru получает значительный буст в ранжировании, так как система предполагает, что он является вероятной целью поиска.
Сценарий: Продвижение авторитетного медицинского портала
- Паттерн поведения (Query Sequence):
- Запрос 1 (CQ): «боль в спине причины» (Низкий NS).
- Запрос 2 (RQ): «WebMD back pain» (Высокий QS/NS).
- Действие системы: Google ассоциирует WebMD (Navigational Resource) с запросом «боль в спине причины».
- Результат: WebMD получает преимущество в ранжировании по общему информационному запросу, так как пользователи коллективно определили его как авторитетный источник, к которому они обращаются после общего поиска.
Вопросы и ответы
Что является главным условием для того, чтобы система связала исходный запрос с навигационным ресурсом?
Необходимо выполнение нескольких условий. Во-первых, должен быть зафиксирован переход от исходного запроса (Candidate Query) с низкими оценками QS/NS к уточненному запросу (Revised Query) с высокими оценками QS/NS в рамках одной сессии. Во-вторых, и это критически важно (Claim 4), вероятность этого перехода должна быть выше, чем случайная (P(RQ|CQ) > P(RQ)), что доказывает статистическую значимость связи между запросами.
Как рассчитывается Quality Score (QS) запроса согласно патенту?
Quality Score — это комплексная метрика. Она рассчитывается на основе Resource Metrics (авторитетность ресурсов в выдаче (Authority Score), их CTR, характеристики URL) и Revision Metrics (как часто этот запрос уточняют дальше (Revision Frequency) и как быстро происходит уточнение (Revision Time)). Высокий QS означает, что запрос ведет на качественные результаты и часто является конечным в сессии.
Что делает запрос «Навигационным» (High Navigation Score)?
Основной фактор навигационности — это концентрация трафика. Если значительная доля кликов (Traffic Proportion) по результатам запроса приходится на один конкретный ресурс, Navigation Score (NS) запроса будет высоким. Также учитываются перекрестные ссылки (Cross linkage) и наличие явно доминирующих авторитетных ресурсов в топе.
Как этот патент влияет на SEO для широких запросов (Head Terms)?
Он усложняет продвижение по широким запросам, если ваш сайт не является конечной целью для них. Если данные показывают, что пользователи, вводящие широкий термин, часто уточняют его до конкретного бренда или авторитетного ресурса, этот ресурс получит преимущество по исходному широкому запросу. Конкуренция смещается от текстовой релевантности к доминированию в интенте.
Может ли мой сайт получить трафик по запросам, под которые он не оптимизирован, благодаря этому механизму?
Да. Если ваш сайт является Navigational Resource для специфического запроса (Q2), а пользователи часто приходят к Q2 после ввода широкого запроса (Q1), система может ассоциировать ваш ресурс с Q1. В результате ваш сайт получит бустинг и трафик по запросу Q1, даже если он под него напрямую не оптимизирован, но соответствует конечному интенту пользователя.
Как определить, является ли мой ресурс «Navigational Resource»?
Проанализируйте свои ключевые запросы. Если по какому-то запросу ваш сайт получает подавляющую долю трафика по сравнению с конкурентами (высокая Traffic Proportion) и пользователи после перехода редко возвращаются в поиск для дальнейших уточнений (низкая Revision Frequency), вы, вероятно, являетесь Navigational Resource для этого запроса.
Что такое «Revision Window Time» и как он используется?
Это максимальный временной интервал между двумя последовательными запросами, позволяющий считать их частью одной поисковой сессии (Query Sequence). Если пользователь ввел следующий запрос позже этого окна (например, через 5 минут), система считает, что началась новая сессия. Это необходимо для корректного определения границ поискового пути и анализа уточнений.
Происходит ли анализ последовательностей запросов в реальном времени?
Нет. Анализ логов, расчет QS/NS и построение Navigation Store происходит в офлайн-режиме с помощью компонента Revision Navigation Analyzer. В реальном времени система только проверяет входящий запрос на наличие совпадений в уже готовом Navigation Store и применяет бустинг, если ассоциация найдена.
Какова роль CTR в этом патенте?
CTR используется при расчете обеих ключевых метрик. Высокий CTR способствует повышению как Quality Score (в рамках Resource Metrics), так и Navigation Score (в рамках Navigational Metrics). Это подчеркивает важность привлекательных сниппетов и релевантных заголовков для подтверждения качества и навигационности ресурса.
Как этот патент связан с E-E-A-T?
Патент напрямую связан с Авторитетностью (Authority). При расчете Quality Score используются «Authority Scores» ресурсов (например, PageRank). Сайты с высоким E-E-A-T с большей вероятностью будут иметь высокие Authority Scores и, следовательно, чаще будут классифицироваться как Navigational Resources и получать бустинг в рамках этой системы.