Google анализирует поведение пользователей на выдаче, создавая «Профили Взаимодействия». Система учитывает продолжительность кликов (Short/Long Clicks), их последовательность (Single/Multiple Clicks, Pogo-sticking) и уточнение запросов. Эти данные используются для оценки удовлетворенности пользователей, сравнения версий алгоритмов ранжирования и выявления манипулятивных результатов (спама).
Описание
Какую задачу решает
Патент решает проблему ненадежности использования простого показателя кликабельности (CTR) для оценки качества поисковой выдачи. CTR не отражает фактическую удовлетворенность пользователя после перехода на сайт и может быть объектом манипуляций (кликбейт, спам). Изобретение предлагает метод более точной оценки уровня удовлетворенности (level of satisfaction) через анализ детализированного поведения пользователя.
Что запатентовано
Запатентована система для создания и использования Interaction Profiles (Профилей Взаимодействия), также называемых Click Profiles. Суть изобретения заключается в анализе детализированных поведенческих метрик, выходящих за рамки факта клика: продолжительность клика (click-duration data), количество кликов за сессию (multiple-click data) и уточнение запроса (query-refinement data). Эти профили применяются для оценки качества алгоритмов и идентификации нежелательных результатов.
Как это работает
Система анализирует логи поведения пользователей (log files) и агрегирует данные по сессиям:
- Анализ сессий: Система идентифицирует клики и вычисляет их продолжительность, разделяя на short clicks (быстрый возврат на выдачу, неудовлетворенность) и long clicks (длительное пребывание, удовлетворенность).
- Вычисление метрик: Определяется тип сессии (single click или multiple clicks – pogo-sticking) и фиксируются случаи уточнения запроса.
- Создание профиля: Эти метрики агрегируются для создания Interaction Profile для «объекта» (например, URL, домена или версии алгоритма ранжирования).
- Применение: Профили сравниваются для определения относительного качества (relative quality) алгоритмов (A/B тестирование) или для выявления результатов с низкими показателями удовлетворенности (спам).
Актуальность для SEO
Критически высокая. Патент (и его предшественники с 2004 года) описывает фундаментальные механизмы использования поведенческих факторов. Анализ удовлетворенности пользователей, Dwell Time и борьба с «pogo-sticking» являются центральными элементами современных систем ранжирования Google и оценки качества контента.
Важность для SEO
Патент имеет критическое значение (95/100) для SEO. Он подтверждает, что оптимизация под CTR (кликбейт) без последующего удовлетворения интента пользователя контрпродуктивна. Система активно измеряет удовлетворенность. Для успешного SEO необходимо фокусироваться на обеспечении «long clicks» и «single clicks», что достигается за счет полного ответа на запрос пользователя и предотвращения его возврата к поисковой выдаче.
Детальный разбор
Термины и определения
- Interaction Profile (Профиль взаимодействия)
- Агрегированные данные, характеризующие взаимодействие пользователей с объектом. Включает метрики, указывающие на уровень удовлетворенности.
- Click Profile (Профиль кликов)
- Тип Interaction Profile, сфокусированный на данных о кликах (гистограмма типов и продолжительности).
- Object (Объект)
- Предмет анализа: результат поиска (URL), домен, набор результатов (SERP) или алгоритм ранжирования.
- Click-duration data (Данные о продолжительности клика)
- Время между кликом на результат и возвратом пользователя к поисковой выдаче.
- Short Click (Короткий клик)
- Клик с быстрым возвратом на SERP (например, <80 секунд). Индикатор неудовлетворенности.
- Long Click (Длинный клик)
- Клик с длительной задержкой перед возвратом на SERP (например, >200 секунд) или без возврата (Last Click). Индикатор удовлетворенности.
- Multiple-click data (Данные о множественных кликах)
- Метрики, отражающие сессии, где пользователь кликнул более чем на один результат (Pogo-sticking).
- Single Click (Одиночный клик)
- Сессия, в которой пользователь кликнул только на один результат.
- Query-refinement data (Данные об уточнении запроса)
- Фиксация случаев, когда пользователь вводит новый, уточненный запрос. Указывает на неудовлетворенность исходной выдачей.
- Manipulated Article (Манипулятивная статья/Спам)
- Страница, оптимизированная для привлечения кликов, но не представляющая ценности (например, кликбейт).
- P(good|observation) (Вероятность «хорошего» результата)
- Оценка вероятности того, что пользователь удовлетворен результатом, основываясь на его поведении (например, Long Click имеет высокую P(good)).
- Class of Queries (Класс запросов)
- Группа запросов со схожим интентом (например, навигационные, коммерческие), которые демонстрируют схожие паттерны взаимодействия.
Ключевые утверждения (Анализ Claims)
Патент US10387512B2 (продолжение более ранних заявок) фокусируется на оптимизации алгоритмов ранжирования путем сравнения их вариаций для разных классов запросов.
Claim 1 (Независимый пункт): Описывает метод сравнения и оптимизации вариаций алгоритма ранжирования.
- Идентификация классов поисковых запросов (Class of Queries).
- Сравнение Первой вариации (V1) и Второй вариации (V2) алгоритма для конкретного класса.
- Получение Профилей взаимодействия (Interaction Profiles) для результатов, сгенерированных V1 и V2.
- Извлечение ключевой метрики из профилей: ratio of single clicks to multiple clicks (отношение одиночных кликов к множественным).
- Сравнение: Определение того, что отношение для V1 больше, чем для V2.
- Оптимизация: Использование Вариации V1 для последующих запросов в этом классе.
Ядро изобретения здесь — использование метрики предпочтения единственных кликов над множественными как критерия качества для автоматического выбора лучшей версии алгоритма. Google стремится максимизировать количество сессий, где пользователь находит ответ с первого клика.
Claim 19 (Независимый пункт): Описывает схожий процесс оптимизации, но использует альтернативные метрики.
- Процесс аналогичен Claim 1.
- Извлекаемые метрики: number of clicks (количество кликов) ИЛИ number of refinements (количество уточнений запроса).
- Сравнение: Определяется, что для V1 количество кликов ИЛИ количество уточнений МЕНЬШЕ, чем для V2.
- Оптимизация: Использование Вариации V1.
Это подтверждает фокус на эффективности: меньшее количество уточнений запроса указывает на более высокую удовлетворенность исходной выдачей. Меньшее количество кликов также может указывать на более высокую эффективность поиска.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, связывая анализ поведения с ранжированием.
QUNDERSTANDING – Понимание Запросов
Система должна классифицировать запросы (Query Classification) на группы (например, навигационные, информационные), так как сравнение алгоритмов (Claims 1, 19) и интерпретация поведения проводятся на уровне Class of Queries.
RANKING – Ранжирование
Основное применение — оценка и сравнение различных алгоритмов ранжирования (A/B тестирование). Система анализирует, какая версия алгоритма обеспечивает более высокую удовлетворенность (например, больше Single Clicks, меньше Refinements).
RERANKING – Переранжирование
Interaction Profiles могут использоваться для корректировки ранжирования. Результаты с высоким P(good|observation) могут повышаться. Если результат идентифицирован как Manipulated Article (спам) из-за его поведенческого профиля (много Short Clicks), он может быть понижен.
Офлайн Анализ и Машинное Обучение
Большая часть работы происходит офлайн: анализ логов, генерация профилей, сравнение алгоритмов, обучение моделей вероятности P(good|observation) с использованием данных от асессоров (human-labeled result qualities).
Входные данные:
- Логи сервера: запросы, показанные результаты, клики, временные метки, идентификаторы сессий (IP/cookies).
- Оценки качества от асессоров (для обучения).
Выходные данные:
- Interaction Profiles для объектов (URL, домены, алгоритмы).
- Оценки эффективности алгоритмов ранжирования.
- Идентификаторы спамных/манипулятивных ресурсов.
- Вероятностные оценки качества результатов (P(good)).
На что влияет
- Специфические запросы: Влияет на все типы, но анализ адаптируется в зависимости от класса. Для навигационных запросов ожидается высокий процент Single Clicks; для информационных — допустимо больше Multiple Clicks.
- Конкретные ниши: Особенно важно в нишах с высоким уровнем спама или кликбейта. Система выявляет ресурсы, которые привлекают трафик, но не удовлетворяют интент.
- Языковые и географические ограничения: Патент упоминает, что поведение может зависеть от географических или культурных различий, что требует адаптации порогов (например, длительности клика) для разных регионов.
Когда применяется
- Сбор данных: Происходит непрерывно.
- Анализ и Оптимизация: При проведении A/B тестирования новых алгоритмов ранжирования. Периодически для анализа качества и выявления спама.
- Пороговые значения: Патент упоминает конкретные пороги для классификации кликов (например, Short Click < 80 сек, Long Click > 200 сек), а также пороги вероятности для определения «хорошего» результата.
Пошаговый алгоритм
Процесс А: Получение Профиля Взаимодействия (на основе FIG. 2)
- Сбор и Сортировка данных: Запись взаимодействий в логи и группировка по пользователям (IP/cookies).
- Идентификация сессий: Выделение последовательности действий пользователя в рамках одного сеанса.
- Анализ действий в сессии: Для каждого запроса и SERP отслеживаются действия:
- Клик и Возврат: Фиксируется результат, время клика и время возврата к выдаче.
- Расчет длительности: Вычисляется время между кликом и возвратом. Классификация клика (Short/Medium/Long/Last).
- Определение последовательности: Определение типа клика (Single/Multiple).
- Уточнение запроса: Фиксация ввода нового, похожего запроса.
- Агрегация данных: Сбор статистики по всем сессиям для интересующего объекта.
- Формирование профиля: Расчет агрегированных метрик (соотношение Long/Short, Single/Multiple кликов, частота уточнений).
Процесс Б: Сравнение алгоритмов по классам запросов (на основе FIG. 6 и Claims 1/19)
- Идентификация класса запросов: Определение группы запросов (например, «Коммерческие»).
- Сбор данных по алгоритмам: Получение данных о взаимодействии для Алгоритма V1 и Алгоритма V2 для этого класса.
- Генерация профилей: Расчет Interaction Profile для V1 и V2.
- Сравнение метрик: Сравнение показателей удовлетворенности. Например, у какой версии выше соотношение Single/Multiple Clicks (Claim 1) или ниже частота Query Refinements (Claim 19).
- Оптимизация: Выбор лучшей версии алгоритма для данного класса запросов и ее применение в продакшене.
Какие данные и как использует
Данные на входе
Система полагается почти исключительно на поведенческие факторы, извлеченные из логов поисковой системы.
- Поведенческие факторы:
- Факт клика по результату.
- Длительность клика (proxy для Dwell Time).
- Последовательность кликов в сессии (Click Sequence).
- Уточнения запроса (Query Refinements).
- Технические факторы:
- Временные метки (Timestamps).
- IP-адреса/Cookies (для идентификации сессий).
- Позиция результата в выдаче (для учета позиционного уклона).
- Внешние данные (для обучения):
- Оценки качества от асессоров (Human-labeled result qualities), используемые для калибровки поведенческих сигналов и обучения моделей P(good).
Какие метрики используются и как они считаются
- Классификация длительности клика: (Примеры порогов из патента)
- Short Click: < 80 секунд.
- Medium Click: 80-200 секунд.
- Long Click: > 200 секунд.
- Last Click: Возврата к выдаче не зафиксировано.
- Классификация последовательности клика:
- Single Click: Единственный клик в сессии.
- Multiple Click: Несколько кликов в сессии (Pogo-sticking).
- Агрегированные метрики профиля (Ключевые для оценки качества):
- Ratio of Long to Short Clicks: Высокое значение – позитивный сигнал.
- Ratio of Single to Multiple Clicks: Высокое значение – позитивный сигнал (используется в Claim 1).
- Rate of Query Refinements: Низкое значение – позитивный сигнал (используется в Claim 19).
- Вероятностная оценка качества (P(good|observation)): Оценивает вероятность того, что результат является «хорошим» при наблюдении определенного поведения. Например, согласно Таблице 1 патента, вероятность качества для Single Long Click составляет 0.9.
Выводы
- Удовлетворенность пользователя (Satisfaction) — главная метрика качества, а не CTR: Патент подтверждает, что Google систематически измеряет удовлетворенность пользователя после клика. CTR ненадежен и может быть объектом манипуляций.
- Ключевые поведенческие сигналы — Длительность и Последовательность: Long Clicks (длинные клики) и Single Clicks (единственные клики) интерпретируются как сильные признаки качества и удовлетворенности.
- Pogo-sticking — сильный негативный индикатор: Сессии с Multiple Clicks (множественными кликами) и Short Clicks (короткими кликами) указывают на то, что пользователь не нашел ответ и вынужден искать дальше. Это негативный сигнал для просмотренных страниц.
- Использование поведения для борьбы со спамом: Спам (Manipulated Articles) имеет характерный поведенческий профиль (привлекает клики, но генерирует короткие визиты). Система использует эти профили для выявления и пессимизации спама.
- Оптимизация алгоритмов зависит от контекста (Query Class): «Хорошее» поведение зависит от типа запроса. Алгоритмы ранжирования тестируются и оптимизируются отдельно для разных классов (например, навигационных vs. информационных), как описано в Claims 1 и 19.
- Эффективность поиска как цель: Google предпочитает алгоритмы, которые требуют меньше кликов и меньше уточнений запросов для решения задачи пользователя (Claim 19), что подчеркивает важность точности и эффективности выдачи.
Практика
Best practices (это мы делаем)
- Полное удовлетворение интента пользователя: Стратегическая цель — стать Long Single Click или Last Click. Контент должен быть исчерпывающим, чтобы у пользователя не было необходимости возвращаться в SERP для поиска альтернатив или уточнения запроса.
- Оптимизация вовлеченности и UX: Обеспечьте быструю загрузку, отличный UX/UI и качественный контент. Это увеличивает время пребывания пользователя на сайте (Dwell Time) и снижает вероятность быстрого возврата на SERP.
- Соответствие сниппетов контенту (Честность): Убедитесь, что Title и Description точно отражают содержание страницы. Привлечение нецелевого трафика приведет к генерации Short Clicks и ухудшению поведенческого профиля.
- Анализ поведения по классам запросов: Понимайте интент ваших запросов. Для информационных запросов дайте полный ответ; для навигационных – обеспечьте быстрый доступ к цели. Адаптируйте страницы под ожидаемое поведение для данного Class of Queries.
Worst practices (это делать не надо)
- Использование кликбейта (Clickbait): Тактики, максимизирующие CTR за счет вводящих в заблуждение заголовков. Система идентифицирует такие страницы как низкокачественные из-за высокого уровня Short Clicks.
- Создание тонкого контента (Thin Content): Страницы, которые не дают полного ответа на запрос, провоцируют pogo-sticking (Multiple Clicks) и уточнение запросов (Query Refinements).
- Игнорирование технических проблем и скорости загрузки: Плохой UX или медленная загрузка могут привести к быстрому отказу (Short Click), даже если контент релевантен.
Стратегическое значение
Этот патент является фундаментальным для понимания того, как Google измеряет качество поиска. Он подтверждает стратегический сдвиг от оценки релевантности к оценке удовлетворенности. Долгосрочная SEO-стратегия должна быть сфокусирована на качестве контента и пользовательском опыте (UX), чтобы генерировать положительные поведенческие сигналы (Long Clicks) и минимизировать негативные (pogo-sticking).
Практические примеры
Сценарий: Вытеснение кликбейта авторитетным контентом
- Запрос: «Как быстро выучить Python».
- Результат А (Кликбейт): Сайт с заголовком «Выучи Python за 24 часа! Гарантия!». Высокий CTR. Контент поверхностный.
- Результат Б (Качество): Детальный гайд на авторитетном образовательном ресурсе. Средний CTR.
- Поведение: Пользователи кликают на А, быстро разочаровываются, возвращаются на SERP через 45 сек (Short Click) и кликают на Б (Multiple Click). На Б проводят 15 минут (Long Click).
- Анализ Google:
- Профиль А: Доминирование Short Clicks, высокая частота Multiple Clicks. Низкая оценка P(good).
- Профиль Б: Доминирование Long Clicks. Высокая оценка P(good).
- Результат: Система понижает рейтинг Результата А (возможно, классифицируя как Manipulated Article) и повышает рейтинг Результата Б, основываясь на лучших показателях удовлетворенности.
Вопросы и ответы
В чем ключевое отличие «Interaction Profile» от CTR?
CTR показывает только частоту кликов относительно показов и не дает информации о том, что происходит после клика. Interaction Profile — это глубокий анализ поведения, включающий длительность клика, последовательность действий (был ли клик единственным или одним из многих) и уточнение запроса. Профиль измеряет удовлетворенность, а не только привлекательность сниппета.
Какой поведенческий сигнал является наиболее позитивным согласно патенту?
Самый сильный позитивный сигнал — это Long Single Click (Длинный Единственный Клик). Это означает, что пользователь перешел на сайт, провел там значительное время (например, более 200 секунд) и не возвращался к выдаче для поиска других результатов. Согласно вероятностной модели патента (Таблица 1), это дает высокую уверенность (0.9) в том, что результат является «хорошим».
Что такое pogo-sticking и как он влияет на ранжирование?
Pogo-sticking — это поведение, когда пользователь быстро переключается между SERP и сайтами (кликнул, вернулся, кликнул на другой). В терминах патента это регистрируется как Short Click и Multiple Clicks. Это сильный сигнал неудовлетворенности интента. Если страница регулярно генерирует такое поведение, ее Interaction Profile ухудшается, что может привести к понижению в ранжировании.
Как этот патент связан с Dwell Time и Bounce Rate?
Патент использует концепцию Click Duration (длительность клика) — время между кликом и возвратом в SERP, что является прямым измерением Dwell Time. Bounce Rate (показатель отказов в аналитике) менее точен для оценки удовлетворенности, так как отказ не всегда плох. Патент фокусируется именно на времени и последующих действиях в поиске.
Как Google использует эти профили для борьбы со спамом?
Спамные или манипулятивные ресурсы (Manipulated Articles) часто имеют высокий CTR, но генерируют много Short Clicks. Патент описывает метод сравнения профиля подозрительного ресурса с эталонным профилем спама. Если профиль ресурса имеет аномально низкие показатели удовлетворенности, он может быть пессимизирован.
Что означает оптимизация алгоритмов по «Классам запросов» (Query Class)?
Пользователи ведут себя по-разному в зависимости от типа запроса (например, навигационный vs информационный). Google разделяет запросы на классы и тестирует алгоритмы ранжирования отдельно для каждого класса (Claims 1 и 19). Это позволяет оптимизировать выдачу под специфический контекст и ожидаемое поведение пользователя.
Означает ли этот патент, что Google использует данные Google Analytics или Chrome для ранжирования?
Нет. Патент описывает анализ внутренних логов поисковой системы Google. Длительность и последовательность измеряются непосредственно через взаимодействие пользователя с SERP (клик на результат и возврат к SERP). Для этого не требуются данные сторонних систем аналитики или браузера.
Как SEO-специалист может улучшить «Профиль взаимодействия» своего сайта?
Необходимо максимизировать удовлетворенность пользователя: создавать исчерпывающий контент, который полностью отвечает на интент, обеспечивать отличный UX, высокую скорость загрузки и точное соответствие заголовков содержанию. Цель — сделать так, чтобы пользователь не захотел возвращаться к поиску альтернатив.
Claim 19 утверждает, что алгоритм лучше, если он генерирует меньше кликов. Как это понимать?
Это указывает на приоритет эффективности поиска. Если алгоритм предоставляет идеальный ответ сразу, пользователю требуется меньше кликов и меньше уточнений запроса для решения своей задачи. Это не означает, что нужно стремиться к нулевому трафику, а скорее к тому, чтобы каждый полученный клик был максимально качественным и завершал сессию пользователя.
Актуален ли этот патент, учитывая его возраст?
Да, абсолютно актуален. Хотя этот конкретный патент (B2) выдан в 2019 году, он является продолжением заявок, поданных начиная с 2004 года. Фундаментальные принципы, заложенные в нем — измерение удовлетворенности через длительность кликов и борьба с pogo-sticking — остаются ядром оценки качества поиска Google, хотя методы их реализации стали сложнее.