Google отслеживает, на какие типы специализированных результатов (Новости, Картинки, Карты, Видео и т.д.) пользователь нажимал в прошлом. На основе этой истории система строит вероятностную модель, чтобы предсказать, какие типы результатов заинтересуют пользователя в будущем. Эта модель используется для выбора, оценки и ранжирования специализированных блоков при формировании Универсальной выдачи.
Описание
Какую задачу решает
Патент решает задачу оптимизации смешивания результатов Универсального Поиска (Universal Search). Вместо того чтобы показывать стандартный набор специализированных блоков (например, Новости, Картинки, Карты) всем пользователям по одному и тому же запросу, система стремится показать те типы результатов, которые с наибольшей вероятностью заинтересуют конкретного пользователя, улучшая релевантность форматов контента.
Что запатентовано
Запатентована система персонализации результатов поиска, которая использует историю поведения пользователя для предсказания его интереса к различным типам специализированных результатов (Specialized Results). Система строит вероятностную модель (Probability Model), основанную на том, как часто пользователь взаимодействовал с определенными типами вертикалей (например, Изображениями или Новостями) в прошлом. Эта модель используется в реальном времени для выбора и ранжирования специализированных блоков в поисковой выдаче.
Как это работает
Механизм работает в несколько этапов:
- Отслеживание поведения: Система записывает взаимодействие пользователя со специализированными результатами, фиксируя, какие типы результатов он выбирает (кликает).
- Построение модели: На основе накопленных данных (в частности, количества прошлых выборов определенного типа) строится Probability Model. Модель оценивает вероятность того, что пользователь выберет определенный тип специализированного результата в будущем.
- Обработка запроса: При получении нового запроса система ищет результаты как в основном веб-индексе, так и в специализированных источниках (вертикалях).
- Персонализация смешивания: Система использует Probability Model пользователя для оценки вероятности выбора каждого доступного типа специализированного результата.
- Выбор и ранжирование: Специализированные результаты выбираются, оцениваются (scored) и ранжируются на основе этих вероятностей. Типы с более высокой вероятностью получают приоритет.
- Отображение: Выбранные специализированные результаты отображаются на видном месте (prominent position) в итоговой выдаче.
Актуальность для SEO
Высокая. Хотя патент является продолжением заявки от 2006 года, концепция Универсального Поиска и персонализации выдачи остается центральной для Google. Механизм адаптации выдачи под предпочтения пользователя в форматах контента (текст, видео, изображения) критически важен в современном поиске. Даже если конкретные статистические методы, упомянутые в патенте (например, логистическая регрессия), были заменены более сложными нейросетевыми моделями, базовый принцип использования истории поведения для управления смешиванием остается актуальным.
Важность для SEO
Влияние на SEO значительное (7.5/10). Патент описывает механизм, который напрямую влияет на видимость контента в вертикальных индексах (Images, News, Video, Shopping и т.д.). Это означает, что релевантности запросу недостаточно для показа в специализированном блоке; необходимо также, чтобы конкретный пользователь был склонен взаимодействовать с этим типом контента. Это усложняет анализ выдачи и подчеркивает важность комплексной оптимизации под все релевантные вертикали для охвата разных сегментов аудитории.
Детальный разбор
Термины и определения
- Corpus of documents (Корпус документов)
- Основной набор документов (например, веб-страниц), используемый для генерации стандартных результатов поиска.
- Probability Model (Вероятностная модель)
- Статистическая модель (например, логистическая регрессия, деревья регрессии), построенная на основе поведения пользователя. Используется для оценки вероятности того, что пользователь выберет определенный тип специализированного результата.
- Search Related Behavior (Поведение, связанное с поиском)
- Действия пользователя, которые отслеживаются системой для построения вероятностной модели. Включает историю запросов и взаимодействие с результатами.
- Specialized Results (Специализированные результаты)
- Результаты, полученные из специализированных источников информации (вертикалей). В контексте патента это результаты Универсального Поиска или блоки (SERP Features).
- Specialized Sources (Специализированные источники)
- Источники или индексы информации, отличные от основного корпуса документов. Примеры: новости, котировки акций, погода, музыка, фильмы, путешествия, карты, изображения, покупки, история поиска, определения, патенты, местное время, блоги и т.д.
- Type of specialized search result (Тип специализированного результата)
- Категория результата, соответствующая источнику (например, тип «Новости» или тип «Изображения»). Модель предсказывает вероятность выбора именно типа.
Ключевые утверждения (Анализ Claims)
Патент содержит несколько независимых пунктов (Claim 1, 7, 13), описывающих метод, систему и носитель информации. Суть изобретения сосредоточена в Claim 1.
Claim 1 (Независимый пункт): Описывает метод персонализации результатов.
- Построение вероятностной модели: Система создает Probability Model на основе информации о взаимодействии пользователя с результатами поиска.
- Цель модели: Оценить вероятность того, что пользователь выберет определенный тип специализированного результата.
- Основа модели (Критический элемент): Модель строится на основе количества прошлых выборов (quantity of past selections) пользователем результатов, принадлежащих к этому конкретному типу, в ответ на прошлые запросы.
- Получение нового запроса: Система получает новый запрос от пользователя.
- Поиск: Система ищет источники информации на основе запроса для определения набора результатов.
- Выбор (Персонализация): Система использует оцененную вероятность (полученную из модели), чтобы выбрать из набора результатов один или несколько результатов, которые относятся к этому определенному типу специализированных результатов.
- Вывод: Система предоставляет выбранные специализированные результаты пользователю.
Claim 6 (Зависимый): Уточняет способ отображения.
Выбранные специализированные результаты отображаются на видном месте (featured prominently) по отношению к дополнительным результатам (например, стандартной веб-выдаче).
Где и как применяется
Изобретение применяется на финальных этапах формирования поисковой выдачи, определяя ее композицию для конкретного пользователя.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна проиндексировать Specialized Sources. В патенте упоминается, что специализированные источники могут индексироваться отдельно от основного корпуса документов, позволяя проводить независимый поиск по каждой вертикали (например, отдельный индекс для Новостей, отдельный для Картинок).
RANKING – Ранжирование
Система выполняет параллельные поиски: один по основному Corpus of documents для генерации стандартных результатов, и несколько поисков по Specialized Sources для генерации наборов Specialized Results для каждой вертикали.
METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основной этап применения патента. Система должна решить, какие из сгенерированных Specialized Results включить в итоговую выдачу и как их ранжировать.
- Получение данных о пользователе: Система идентифицирует пользователя (например, через аккаунт Google, cookie или IP-адрес) и получает доступ к его Probability Model (которая строится офлайн на основе Search Related Behavior).
- Оценка вероятностей: Для каждого типа специализированных результатов, релевантных запросу, модель оценивает вероятность того, что пользователь выберет этот тип.
- Выбор и Оценка (Selection/Scoring): Система выбирает типы результатов с наивысшей вероятностью или присваивает им оценки (scores) на основе этих вероятностей.
- Смешивание (Blending): Выбранные/высоко оцененные специализированные результаты интегрируются в выдачу, часто на prominent position.
Входные данные:
- Запрос пользователя.
- Набор стандартных результатов поиска.
- Наборы специализированных результатов из разных вертикалей.
- Предварительно рассчитанная Probability Model пользователя.
Выходные данные:
- Итоговый документ с результатами поиска (SERP), включающий стандартные результаты и персонализированный набор специализированных результатов, размещенных на видных позициях.
На что влияет
- Конкретные типы контента и форматы: Напрямую влияет на видимость контента, который попадает в вертикальные индексы и отображается в виде блоков Универсального Поиска (Изображения, Видео, Новости, Карты, Товары и т.д.).
- Специфические запросы: Наибольшее влияние оказывается на запросы с множественным интентом, где релевантны сразу несколько типов специализированных результатов. Система решает, какой тип показать конкретному пользователю.
Когда применяется
- Условия применения: Алгоритм применяется, когда для запроса существуют релевантные результаты в одном или нескольких Specialized Sources, И когда у системы есть данные о поведении пользователя для применения Probability Model.
- Триггеры активации: Получение поискового запроса от идентифицированного пользователя.
Пошаговый алгоритм
Патент описывает два основных процесса: А) Построение модели и Б) Применение модели.
Процесс А: Построение/Обновление Вероятностной Модели (Офлайн или фоновый режим)
- Сбор данных: Система предоставляет пользователю выдачу, включающую специализированные результаты.
- Отслеживание взаимодействия: Отслеживание параметров, связанных с выбором пользователем специализированных результатов (например, клики на блок Новостей).
- Агрегация данных: Накопление данных о поведении (особенно количества прошлых выборов каждого типа, а также других параметров, таких как время запроса, длина запроса).
- Построение модели: Использование агрегированных данных для построения Probability Model (например, с помощью logistic regression). Модель оценивает будущую вероятность выбора каждого типа специализированных результатов этим пользователем.
Процесс Б: Применение Модели для Персонализации (Реальное время)
- Получение запроса: Система получает запрос от пользователя.
- Параллельный поиск: Поиск в основном корпусе документов для получения стандартных результатов. Одновременный поиск в Specialized Sources для получения наборов специализированных результатов.
- Оценка вероятностей: Использование ранее построенной Probability Model для оценки вероятности того, что пользователь выберет каждый доступный тип специализированного результата (например, P(News)=0.8, P(Images)=0.3).
- Выбор и Оценка (Selection/Scoring): Выбор специализированных результатов на основе оценок вероятности. Это может включать выбор Топ-N типов или присвоение оценки (Score) каждому результату как функции от его вероятности.
- Ранжирование и Отображение: Ранжирование выбранных специализированных результатов (если применяется оценка) и предоставление их пользователю на видном месте (prominent position) по отношению к стандартным результатам.
Какие данные и как использует
Данные на входе
Система фокусируется на использовании данных о поведении пользователя для персонализации смешивания.
- Поведенческие факторы (Search Related Behavior): Это ключевые данные для построения модели. Патент явно перечисляет следующие параметры, которые могут использоваться:
- Количество прошлых выборов определенного типа специализированной информации (number of past selections). (Это явно указано в Claim 1).
- Количество запросов на один выбор определенного типа (number of search queries per selection).
- Количество дней поисковых запросов на один выбор определенного типа.
- Средняя длина поискового запроса пользователя (average search query length).
- Среднее количество поисковых запросов в месяц.
- Процент выборов, происходящих в выходные дни (percentage of selections… that occur on weekends).
- Процент выборов, происходящих в будние дни.
- Пользовательские факторы: Данные для идентификации пользователя и привязки поведения к нему (например, аккаунт, cookie, IP-адрес). Также упоминается возможность агрегации поведения нескольких пользователей.
Какие метрики используются и как они считаются
- Probability Estimate (Оценка вероятности): Основная метрика. Вероятность того, что пользователь выберет определенный тип специализированного результата. Рассчитывается с помощью Probability Model.
- Score (Оценка результата): Метрика, присваиваемая специализированному результату на основе его Probability Estimate. Может использоваться для ранжирования специализированных результатов между собой. Патент предполагает, что оценка может быть функцией (например, линейной) от вероятности.
- Методы машинного обучения: Для построения Probability Model используются статистические методы, такие как логистическая регрессия (logistic regression) или деревья регрессии (regression trees).
Выводы
- Персонализация смешивания Универсального Поиска: Патент подтверждает, что выбор блоков Универсального Поиска (Новости, Изображения, Видео и т.д.) персонализируется. Два пользователя, вводящие один и тот же запрос, могут увидеть разные наборы специализированных блоков.
- История кликов определяет будущую выдачу: Ключевым фактором для персонализации является история взаимодействия пользователя с различными типами результатов (quantity of past selections). Если пользователь игнорирует определенный тип контента, система с меньшей вероятностью покажет его в будущем.
- Предсказание на уровне типа контента: Модель предсказывает вероятность интереса к типу (например, «Изображения»), а не к конкретному результату. Эта вероятность затем используется для выбора или оценки всех результатов данного типа.
- Влияние на видимость в вертикалях: Видимость сайта в специализированных блоках зависит не только от релевантности запросу и ранжирования внутри вертикали, но и от склонности конкретного пользователя потреблять данный тип контента.
- Многофакторная поведенческая модель: Хотя Claim 1 фокусируется на количестве прошлых выборов, описание патента включает множество других поведенческих сигналов (например, время запроса, длина запроса), которые могут использоваться для уточнения Probability Model.
Практика
Best practices (это мы делаем)
- Комплексная оптимизация под вертикали (Vertical SEO): Необходимо обеспечивать присутствие и высокие позиции во всех релевантных специализированных индексах (Images, Video, News, Shopping, Local). Поскольку видимость этих блоков зависит от предпочтений пользователя, отсутствие оптимизации под вертикаль гарантирует нулевую видимость для пользователей, предпочитающих этот тип контента.
- Стимулирование взаимодействия (Оптимизация CTR в вертикалях): Необходимо делать сниппеты в специализированных результатах максимально привлекательными. Высокий CTR может создать усиливающий эффект: чем чаще пользователи кликают на определенный тип вертикали, тем выше вероятность (согласно Probability Model), что эта вертикаль будет им показана снова.
- Анализ аудитории и ее предпочтений в форматах: Понимание того, какие форматы предпочитает ваша целевая аудитория, позволяет лучше расставлять приоритеты в контент-стратегии. Если ваша аудитория часто ищет изображения, инвестируйте в Image SEO.
- Использование структурированных данных: Обеспечение корректной разметки (Schema.org) для видео, статей, товаров и т.д. критически важно для попадания в Specialized Sources и корректной идентификации типа контента.
Worst practices (это делать не надо)
- Фокус только на стандартном веб-поиске: Игнорирование вертикального поиска (Image SEO, Video SEO) является ошибкой. Этот патент показывает, что для значительной части пользователей стандартные «синие ссылки» могут быть менее приоритетными, чем специализированные блоки.
- Анализ обезличенной выдачи как единственного источника истины: Оценка позиций только в режиме инкогнито не дает полной картины. Выдача персонализирована, и набор специализированных блоков может сильно отличаться у реальных пользователей.
Стратегическое значение
Патент подчеркивает важность концепции Универсального Поиска и роль персонализации в определении интента пользователя. Google не просто определяет тему запроса, но и персонализирует формат ответа. Для SEO это означает, что стратегия должна быть направлена на доминирование в теме по всем возможным форматам контента. Долгосрочная стратегия требует инвестиций в производство разнообразного контента (текст, видео, изображения) и его оптимизацию под соответствующие вертикальные индексы.
Практические примеры
Сценарий: Персонализация выдачи по запросу о продукте
Запрос: «Обзор Nikon Z9»
Пользователь А (Фотограф):
- История: Часто кликает на блоки Изображений (Images) и специализированные форумы. Редко смотрит Видео.
- Probability Model: P(Images) – Высокая, P(Video) – Низкая.
- Результат: Google покажет большой блок Specialized Results с Изображениями наверху выдачи. Блок Видео может отсутствовать или быть ниже.
Пользователь Б (Видеоблогер):
- История: Часто кликает на блоки Видео (Video) и результаты из YouTube.
- Probability Model: P(Images) – Средняя, P(Video) – Высокая.
- Результат: Google покажет карусель Видео на первой позиции (prominent position). Блок Изображений может быть меньше или ниже.
Действия SEO-специалиста: Чтобы максимизировать охват по запросу «Обзор Nikon Z9», необходимо:
- Оптимизировать изображения на сайте под Image Search (alt-теги, качество, скорость загрузки).
- Создать видеообзор, оптимизировать его на YouTube и встроить на сайт с использованием VideoObject Schema.
- Результат: Сайт сможет появиться в выдаче как у Пользователя А (через блок Изображений), так и у Пользователя Б (через блок Видео).
Вопросы и ответы
Означает ли этот патент, что стандартные результаты поиска («синие ссылки») больше не важны?
Нет, стандартные результаты остаются основой выдачи. Однако патент показывает, что специализированные результаты (Новости, Картинки, Видео и т.д.) часто занимают более заметные позиции (prominent position). Выбор того, какие именно блоки показать, персонализируется, чтобы соответствовать предпочтениям пользователя в форматах контента.
Как Google определяет, к какому типу относится результат?
Система индексирует различные Specialized Sources. Результаты, полученные из индекса Новостей, относятся к типу «Новости»; результаты из индекса Изображений — к типу «Изображения» и так далее. Также для этого могут использоваться структурированные данные на страницах (например, VideoObject Schema для видео).
Что является основным фактором в Probability Model?
Согласно Claim 1, ключевым фактором является количество прошлых выборов (quantity of past selections) пользователем результатов определенного типа. Если пользователь часто кликает на Изображения, вероятность показа блока Изображений для него возрастает.
Как это влияет на отслеживание позиций и анализ SERP?
Это значительно усложняет анализ. Обезличенная выдача (например, в режиме инкогнито) может не отражать то, что видит реальный пользователь. Для полноценного анализа необходимо учитывать возможность появления различных комбинаций специализированных блоков и анализировать ранжирование не только в веб-поиске, но и внутри ключевых вертикалей.
Может ли система использовать поведение других пользователей для персонализации моей выдачи?
Да. В описании патента указано, что Probability Model может также агрегировать поведение, связанное с несколькими разными пользователями, для оценки вероятностей того, что данный пользователь выберет определенные типы результатов. Это позволяет применять модель даже к новым пользователям или пользователям с недостаточной историей.
Влияет ли эта модель на ранжирование внутри специализированного блока?
Патент в первую очередь описывает выбор того, показывать ли блок определенного типа, и как ранжировать разные типы между собой. Ранжирование внутри блока (например, какая картинка будет первой в блоке Изображений) определяется алгоритмами соответствующей вертикали. Однако патент упоминает возможность присвоения оценки (scoring) результатам на основе вероятности, что может влиять на их итоговое положение в смешанной выдаче.
Как SEO-специалисту адаптировать стратегию под этот механизм?
Ключевая адаптация — переход от фокуса только на веб-поиске к комплексной стратегии Универсального Поиска. Необходимо оптимизировать контент под все релевантные вертикали (Image SEO, Video SEO, Local SEO, News), чтобы иметь возможность появиться в выдаче у пользователей с разными предпочтениями в форматах.
Какие поведенческие факторы, кроме кликов, учитывает модель?
В описании патента упоминаются такие факторы, как средняя длина запроса пользователя, частота запросов, соотношение запросов к кликам (number of search queries per selection), а также время активности (например, процент запросов в выходные или будние дни). Это позволяет модели адаптироваться к контексту поиска пользователя.
Если мой контент идеально релевантен запросу, но представлен в «непопулярном» формате, увидит ли его пользователь?
Это зависит от предпочтений конкретного пользователя. Если пользователь исторически игнорирует этот формат (например, видео), то Probability Model оценит вероятность взаимодействия как низкую, и система может предпочесть показать другой тип контента, даже если он чуть менее релевантен теме, но более интересен пользователю по формату.
Актуален ли этот патент, учитывая, что исходная заявка была подана в 2006 году?
Да, концептуально он очень актуален. Универсальный Поиск и персонализация являются фундаментальными аспектами современного Google. Патент был выдан в 2020 году как продолжение старой заявки, что подтверждает сохраняющуюся важность описанных механизмов для Google, даже если конкретные методы машинного обучения эволюционировали.