Патент Google описывает методы объединения результатов поиска из разных систем (например, стандартного веб-индекса и отдельного мобильного индекса), которые используют разные формулы ранжирования. Для создания единой выдачи система нормализует оценки, классифицирует запрос на наличие «мобильного интента» и модифицирует ранжирование, чтобы сделать разнородные результаты сопоставимыми.
Описание
Какую задачу решает
Патент решает фундаментальную проблему Метапоиска (Universal Search): как объединить результаты, полученные из разных корпусов данных (в данном случае, Generic Resources и Mobile Resources), которые обрабатываются разными поисковыми системами с разными алгоритмами ранжирования (different scoring formulas). Ключевая проблема в том, что их оценки качества (Search Result Quality Scores) несопоставимы напрямую. Изобретение предлагает механизмы для модификации этих оценок, чтобы сделать их соизмеримыми (commensurable) и сформировать единый, релевантный список результатов, особенно для мобильных пользователей.
Что запатентовано
Запатентована система (включающая компонент Results Mixer), которая смешивает результаты поиска путем классификации запроса и последующей модификации оценок релевантности. Система получает результаты из разных источников с разными алгоритмами ранжирования. На основе анализа запроса и свойств ресурсов система модифицирует Search Result Quality Scores (например, повышает оценки мобильных результатов при мобильном интенте или нормализует их на основе порогов), чтобы обеспечить корректное ранжирование в объединенной выдаче.
Как это работает
Система работает через компонент Results Mixer:
- Параллельный поиск: Запрос направляется одновременно в Generic Search Engine и Mobile Search Engine.
- Независимая оценка: Каждая система генерирует результаты и рассчитывает Search Result Quality Scores по собственным формулам.
- Анализ и Модификация: Results Mixer определяет, как модифицировать оценки. Это включает:
- Классификацию запроса как mobile query (например, по слову «ringtones») и повышение оценок мобильных результатов.
- Анализ свойств ресурсов (например, наличие загружаемого контента, язык) для дополнительной корректировки.
- Нормализацию оценок с использованием пороговых значений (Threshold Scores), откалиброванных по человеческим оценкам, чтобы сделать их сопоставимыми.
- Смешивание и Ранжирование: Модифицированные оценки используются для ранжирования всех результатов в едином порядке.
- Дедупликация: Удаляются дубликаты (например, веб и мобильная версия одной страницы), при этом приоритет отдается мобильной версии для мобильного пользователя.
Актуальность для SEO
Средняя/Низкая. Конкретная архитектура, описанная в патенте (отдельные Mobile Search Engine и Generic Search Engine, фокус на WML), устарела в связи с переходом на Mobile-First Indexing (MFI) и использованием единого индекса. Однако базовые принципы, описанные в патенте — необходимость нормализации оценок при смешивании результатов из разных корпусов (Universal Search), классификация интента запроса и контекстная дедупликация — остаются высоко актуальными для современных поисковых систем.
Важность для SEO
Влияние на современные SEO-стратегии ограничено (4/10). Патент описывает инфраструктурные механизмы смешивания в контексте устаревшей мобильной экосистемы (до MFI). Он не дает прямых тактических рекомендаций для современного SEO, но критически важен для понимания принципов работы Универсального Поиска: как Google сравнивает релевантность разных типов контента и как интент запроса влияет на модификацию оценок при формировании смешанной выдачи.
Детальный разбор
Термины и определения
- Commensurable (Сопоставимые)
- Состояние, при котором оценки ранжирования из разных систем модифицированы таким образом, что их можно напрямую сравнивать для формирования единого рейтинга.
- Evaluation Rating (Асессорская оценка)
- Рейтинг, присваиваемый людьми (асессорами) образцам результатов поиска по шкале (например, «точное совпадение», «полезно», «нерелевантно»). Используется для калибровки Threshold Scores.
- Generic Resources / Search Results (Стандартные ресурсы / результаты)
- Некатегоризированные веб-ресурсы (HTML, PDF и т.д.), индексируемые стандартным поисковым движком (Generic Search Engine).
- Mobile Query (Мобильный запрос)
- Запрос, классифицированный системой как направленный на поиск мобильных ресурсов (например, содержит слово «ringtones»). Классификация основана на терминах запроса.
- Mobile Resources / Search Results (Мобильные ресурсы / результаты)
- Ресурсы, адаптированные для мобильных устройств (например, WML, xHTML, cHTML), индексируемые мобильным поисковым движком (Mobile Search Engine).
- Results Mixer (Смеситель результатов)
- Компонент, отвечающий за анализ, модификацию оценок, смешивание, ранжирование и дедупликацию результатов из разных поисковых систем.
- Search Result Quality Score (Оценка качества результата поиска)
- Числовое значение, присваиваемое результату. Оценки из разных систем (Mobile и Generic) изначально несопоставимы, так как рассчитываются по разным формулам (different scoring formulas).
- Threshold Scores (Пороговые оценки)
- Предварительно определенные значения, используемые для нормализации Mobile Search Result Quality Scores. Определяются на основе корреляции между оценками системы и Evaluation Ratings.
Ключевые утверждения (Анализ Claims)
Анализ основан на Claim 1 патента US20130238613A1 (который является продолжением более ранних заявок).
Claim 1 (Независимый пункт): Описывает метод обработки поискового запроса и смешивания результатов из разных источников.
- Система получает поисковый запрос и множество результатов поиска (включая Mobile Search Results и Generic Search Results).
- Каждый результат имеет оценку качества (Search Result Quality Score).
- Ключевое условие: Мобильные и стандартные оценки были сгенерированы с использованием разных формул оценки (different scoring formulas).
- На основе одного или нескольких терминов в запросе система классифицирует запрос как mobile query.
- Как следствие этой классификации, система модифицирует одну или несколько оценок качества.
- Цель модификации — улучшить сортировку смешанного набора результатов.
Ядром изобретения является использование классификации запроса (определение мобильного интента по тексту запроса) в качестве триггера для модификации оценок ранжирования, чтобы обеспечить корректное смешивание результатов, полученных с помощью разных алгоритмов ранжирования.
Где и как применяется
Изобретение применяется на финальных этапах обработки запроса, обеспечивая работу Универсального Поиска.
QUNDERSTANDING – Понимание Запросов
Компонент Query Classifier (упомянутый в описании) анализирует запрос для определения интента. Он может использовать офлайн-анализ логов поиска (search logs) для обучения модели (например, naïve Bayes classifier), которая классифицирует запрос как mobile query в реальном времени.
RANKING – Ранжирование
Процесс запускается параллельно. Generic Search Engine и Mobile Search Engine независимо отбирают кандидатов и рассчитывают свои Search Result Quality Scores, используя разные алгоритмы.
METASEARCH – Метапоиск и Смешивание
Основное место применения патента. Компонент Results Mixer агрегирует результаты из двух поисковых систем и реализует логику модификации оценок.
RERANKING – Переранжирование
Results Mixer выполняет функции переранжирования:
- Нормализация: Модификация мобильных оценок, чтобы сделать их сопоставимыми (commensurable) со стандартными оценками (используя Threshold Scores).
- Модификация оценок (Twiddling): Повышение или понижение оценок на основе сигналов (классификация запроса, свойства ресурсов).
- Финальное ранжирование и Дедупликация: Сортировка объединенного списка и удаление дубликатов с приоритетом мобильной версии.
Входные данные:
- Поисковый запрос и его классификация (mobile query или нет).
- Наборы Generic и Mobile Search Results с их оценками.
- Свойства ресурсов (язык, контент, домен).
- Предопределенные Threshold Scores.
- Контекст пользователя (например, идентификация как mobile user).
Выходные данные:
- Единый смешанный (blended) список результатов поиска, отсортированный по модифицированным и сопоставимым оценкам.
На что влияет
- Специфические запросы: Наибольшее влияние на запросы, классифицированные как mobile queries (например, «ringtones»).
- Контекст пользователя: Алгоритм адаптирует выдачу, если система определяет, что запрос пришел от мобильного пользователя (mobile user).
- Типы контента: Влияет на видимость ресурсов, классифицированных как Mobile Resources (WML, xHTML) в смешанной выдаче.
Когда применяется
- Условие применения: Когда поисковый сервис выполняет поиск одновременно по мобильному и стандартному корпусам.
- Триггер смешивания (Опционально): Смешивание может активироваться, только если количество мобильных результатов превышает определенный порог (threshold number). Если их слишком мало, они могут быть исключены.
- Триггеры модификации оценок:
- Запрос классифицирован как mobile query.
- Мобильный ресурс обладает определенными свойствами (например, загружаемый контент, язык).
- Обнаружено совпадение домена между мобильным и стандартным результатом.
- Необходимость нормализации на основе Threshold Scores.
Пошаговый алгоритм
Процесс смешивания результатов поиска.
- Получение запроса: Фронтенд получает запрос (система может определить, что он исходит от мобильного пользователя).
- Параллельный поиск и Ранжирование: Запрос направляется в Generic Search Engine и Mobile Search Engine. Они возвращают результаты со своими Search Result Quality Scores (рассчитанными по разным формулам).
- Агрегация в Results Mixer: Результаты поступают в Results Mixer.
- Проверка порога активации (Опционально): Проверка, превышает ли количество мобильных результатов пороговое значение. Если нет, они могут быть исключены.
- Определение необходимости модификации и Модификация оценок:
- Классификация запроса: Если запрос классифицирован как mobile query, все мобильные оценки повышаются (например, умножаются на коэффициент).
- Анализ свойств ресурсов: Оценки модифицируются на основе свойств. Например, повышаются, если есть загружаемый контент (downloadable content); понижаются, если язык ресурса не совпадает с языком запроса.
- Анализ стандартных результатов: Если домен мобильного ресурса совпадает с доменом одного из стандартных результатов, оценка мобильного результата повышается.
- Нормализация по порогам: Оценки мобильных результатов модифицируются на основе Threshold Scores для достижения сопоставимости (commensurable) со стандартными оценками. Это может быть нелинейное преобразование.
- Ранжирование смешанных результатов: Система использует модифицированные мобильные оценки и исходные стандартные оценки для ранжирования всех результатов в едином порядке.
- Смешивание и Дедупликация: Формируется объединенный список. Удаляются дубликаты (одинаковый URL или разные версии одной страницы):
- Стандартный результат удаляется, мобильный сохраняется.
- Если удаленный стандартный результат имел более высокий ранг, мобильный результат перемещается на его позицию.
- Представление результатов: Финальный список предоставляется пользователю.
Какие данные и как использует
Данные на входе
Система использует следующие данные для принятия решений о смешивании и модификации оценок:
- Контентные факторы (Запрос): Термины в запросе используются для классификации как mobile query. Язык запроса используется для сравнения с языком ресурса. Длина запроса (query length) влияет на Threshold Scores.
- Контентные факторы (Ресурсы): Язык ресурса.
- Структурные/Технические факторы:
- Тип ресурса: Классификация как мобильного (например, WML) или стандартного.
- URL/Домен: Используется для повышения оценок (при совпадении доменов) и для дедупликации.
- Загружаемый контент: Наличие ссылок на downloadable content для мобильных устройств на странице.
- Пользовательские факторы: Определение того, что запрос пришел от мобильного пользователя (mobile user), вероятно, на основе источника запроса.
- Внешние данные: Логи поиска (search logs) используются офлайн для обучения классификатора запросов. Evaluation Ratings (оценки асессоров) используются офлайн для калибровки Threshold Scores.
Какие метрики используются и как они считаются
- Классификация Mobile Query: Определение интента запроса. Может использоваться наивный байесовский классификатор (naïve Bayes classifier) или другие ML модели, обученные на логах запросов.
- Порог количества результатов (Threshold number): Минимальное количество мобильных результатов, необходимое для активации смешивания.
- Threshold Scores (Пороговые оценки): Используются для нелинейной нормализации мобильных оценок. Они определяются путем корреляции оценок системы с Evaluation Ratings (например, сопоставление диапазонов оценок, соответствующих уровню «полезно» в разных системах). Упоминается, что для более длинных запросов пороги могут быть ниже.
- Множители модификации: Коэффициенты, применяемые к мобильным оценкам на основе классификации запроса, свойств ресурсов или в процессе нормализации.
Выводы
- Нормализация оценок — ключ к Метапоиску (Universal Search): Патент детально описывает проблему несопоставимости оценок из разных систем ранжирования и предлагает конкретные методы их нормализации (нелинейное масштабирование на основе порогов, бустинг на основе контекста), чтобы сделать их commensurable.
- Классификация интента запроса управляет смешиванием: Система активно классифицирует запросы. Если запрос идентифицирован как mobile query, это напрямую ведет к агрессивному повышению (бустингу) всех результатов из соответствующего корпуса.
- Калибровка по человеческим оценкам: Система полагается на Evaluation Ratings (оценки асессоров) для определения Threshold Scores. Это позволяет сопоставлять качество результатов из разных систем на основе человеческого восприятия.
- Контекст устройства и свойства ресурсов как факторы смешивания: Ранжирование модифицируется на основе контекста (мобильный пользователь) и специфических свойств ресурсов (загружаемый контент, язык, авторитетность домена).
- Приоритет оптимальной версии при дедупликации: При обнаружении дубликатов система отдает предпочтение версии, соответствующей устройству пользователя (мобильная версия), и эта версия наследует лучшую позицию из дубликатов.
Практика
Best practices (это мы делаем)
Хотя конкретная архитектура патента (раздельные индексы) устарела из-за Mobile-First Indexing (MFI), его принципы подтверждают следующие стратегии:
- Оптимизация под интент и контекст (Universal Search): Принципы смешивания актуальны для вертикалей (Видео, Картинки, Новости). Понимайте интент запросов, активирующих эти вертикали. Если запрос имеет сильный интент для вертикали (аналогично mobile query в патенте), результаты из этой вертикали могут быть агрессивно повышены после нормализации оценок.
- Обеспечение качественного мобильного опыта: Патент подчеркивает фокус на предоставлении релевантных результатов мобильным пользователям. В эпоху MFI это означает, что сайт должен быть идеально оптимизирован для мобильных устройств.
- Языковое таргетирование (Hreflang): Патент указывает, что несоответствие языка ресурса языку запроса приводит к понижению оценки при смешивании. Это подтверждает критическую важность корректной реализации мультиязычности.
- Улучшение авторитетности домена: Упоминается повышение оценки мобильного результата, если стандартный результат с того же домена также релевантен. Это подчеркивает важность общей авторитетности домена.
Worst practices (это делать не надо)
- Игнорирование мобильного опыта: Предоставление контента, который плохо адаптирован для мобильных устройств, противоречит цели системы — предоставить пользователю наиболее подходящие ресурсы для его контекста.
- Создание низкокачественного контента под специфические интенты: Попытка манипулировать запросами с сильным интентом (например, мобильным или видео) с помощью низкокачественного контента будет неэффективна, так как система использует сложные механизмы оценки качества, калиброванные через Evaluation Ratings.
- Использование раздельных мобильных URL (m-dot) без необходимости: Хотя патент описывает механизмы дедупликации и переноса ранга для m-dot сайтов, это создает дополнительную сложность для поисковой системы. Адаптивный дизайн является предпочтительным современным решением.
Стратегическое значение
Патент имеет важное стратегическое значение для понимания механики Универсального Поиска. Он демонстрирует технические сложности сравнения релевантности разных типов контента и методы их преодоления. Он показывает, что для создания смешанной выдачи необходима сложная система нормализации оценок и что эта нормализация часто нелинейна и сильно зависит от контекста запроса и устройства. Это подтверждает, что позиция в выдаче определяется не только базовой релевантностью, но и тем, насколько хорошо результат соответствует предполагаемому интенту и контексту.
Практические примеры
Сценарий 1: Классификация запроса и бустинг (Исторический контекст)
- Запрос: Мобильный пользователь вводит «скачать рингтоны».
- Обработка: Система классифицирует запрос как Mobile Query из-за термина «рингтоны».
- Действие: Все результаты из мобильного индекса (например, WML-страницы с загрузками) получают значительное повышение (бустинг) своих оценок перед смешиванием со стандартными веб-результатами.
- Результат: В смешанной выдаче мобильные сайты ранжируются выше стандартных веб-сайтов, обсуждающих рингтоны.
Сценарий 2: Дедупликация и наследование ранга
- Запрос: Мобильный пользователь вводит «BBC News».
- Обработка: Стандартный движок находит http://www.bbc.co.uk (Ранг 1). Мобильный движок находит http://www.bbc.co.uk/mobile (Ранг 3 по своим метрикам).
- Действие: Results Mixer идентифицирует их как дубликаты. Поскольку пользователь мобильный, стандартный результат удаляется.
- Наследование ранга: Мобильный результат (/mobile) перемещается на позицию удаленного результата (Ранг 1).
- Результат: Пользователь видит мобильную версию сайта на первой позиции.
Вопросы и ответы
Актуален ли этот патент в эпоху Mobile-First Indexing (MFI)?
Специфическая реализация (смешивание отдельных стандартного и мобильного веб-индексов) устарела, так как MFI использует единый индекс. Однако принципы, заложенные в патенте, — нормализация оценок из разных систем ранжирования, классификация интента запроса и контекстная дедупликация — остаются высоко актуальными для работы Универсального Поиска (смешивание веба, картинок, новостей и т.д.).
Что такое «несоизмеримые оценки» и почему это проблема?
Несоизмеримые оценки возникают, когда разные поисковые системы (вертикали) используют разные формулы и шкалы для ранжирования. Например, оценка 80 в мобильном поиске и оценка 3000 в веб-поиске не могут быть напрямую сравнены. Проблема в том, что без нормализации невозможно корректно отсортировать объединенный список результатов.
Как Google решает проблему несоизмеримых оценок согласно патенту?
Google использует два основных подхода. Первый — контекстные корректировки: если запрос имеет мобильный интент (mobile query), мобильные результаты получают бустинг. Второй — нелинейная нормализация на основе пороговых значений (Threshold Scores). Эти пороги калибруются с помощью человеческих оценок (Evaluation Ratings), чтобы сопоставить диапазоны оценок из разных систем, соответствующие одинаковому уровню качества.
Что такое Mobile Query и как он определяется?
Mobile Query — это запрос с намерением найти контент для мобильных устройств (например, «рингтоны»). Согласно патенту, это определяется с помощью классификатора запросов (Query Classifier), обученного на исторических логах поиска. Классификатор (например, naïve Bayes) анализирует термины в запросе для определения мобильного интента.
Как система обрабатывает дубликаты, если у сайта есть десктопная и мобильная версия (m-dot)?
Патент описывает агрессивную дедупликацию. Если пользователь использует мобильное устройство, система удаляет десктопную версию из выдачи. Мобильная версия сохраняется и наследует наилучшую позицию ранжирования из двух версий. Это гарантирует, что пользователь получит подходящий контент на высокой позиции.
Какие свойства контента могут привести к повышению его рейтинга при смешивании?
Мобильный результат может получить бустинг, если он содержит ссылки на загружаемый контент (downloadable content) для мобильных устройств. Также бустинг применяется, если мобильный результат находится на том же домене, что и один из релевантных стандартных веб-результатов, что указывает на авторитетность источника.
Влияет ли язык контента на смешивание результатов?
Да, влияет. Патент явно указывает, что система сравнивает язык запроса с языком найденного мобильного ресурса. Если языки не совпадают, оценка качества этого мобильного результата может быть понижена. Это подчеркивает важность корректного языкового таргетинга и реализации Hreflang.
Может ли система вообще не показать мобильные результаты, даже если они найдены?
Да. В патенте описан механизм проверки порога количества мобильных результатов (threshold number). Если найдено слишком мало мобильных результатов, система может принять решение не смешивать их со стандартной выдачей или понизить их оценки, предполагая низкую релевантность.
Используются ли асессорские оценки в этом процессе?
Да, они используются в офлайн-процессе для калибровки системы. Человеческие оценки (Evaluation Ratings) используются для определения пороговых значений (Threshold Scores), которые затем применяются Results Mixer для нормализации оценок ранжирования из разных поисковых движков.
На каком этапе поиска работает описанный механизм?
Основная работа происходит на этапах METASEARCH (Смешивание) и RERANKING (Переранжирование). Компонент Results Mixer агрегирует результаты после этапа RANKING, использует данные от QUNDERSTANDING для модификации оценок и формирует финальную выдачу.