SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя

PROVIDING RELEVANCE-ORDERED CATEGORIES OF INFORMATION (Предоставление категорий информации, упорядоченных по релевантности)
  • US7966309B2
  • Google LLC
  • 2007-01-17
  • 2011-06-21
  • Семантика и интент
  • Персонализация
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.

Описание

Какую проблему решает

Патент решает проблему эффективного представления результатов поиска из различных источников (вертикалей или категорий) в ответ на запрос пользователя, особенно в условиях ограниченного интерфейса мобильных устройств. Задача — предсказать, какая категория информации (например, Веб, Картинки, Новости, Локальные результаты) наиболее релевантна намерению пользователя, и отобразить эту категорию первой, минимизируя необходимость навигации пользователя между разными вкладками или разделами выдачи.

Что запатентовано

Запатентована система и метод для динамического упорядочивания категорий поисковых результатов (category-directed result sets). Система генерирует результаты из нескольких различных категорий (индексов) и определяет порядок их отображения на основе анализа самого запроса, агрегированных данных о поведении пользователей и индивидуального профиля пользователя. Цель — показать наиболее релевантную категорию первой.

Как это работает

Система работает следующим образом:

  • Множественный поиск: При получении запроса система выполняет поиск параллельно в разных индексах (Web, Images, News, Maps и т.д.), генерируя несколько наборов результатов.
  • Расчет релевантности категорий: Для каждой категории вычисляется Likelihood Value (Оценка Вероятности), которая предсказывает, насколько данная категория релевантна запросу.
  • Использование данных: Расчет Likelihood Value использует два основных источника данных:
    • Relevance Filter: Агрегированные данные о том, как другие пользователи взаимодействовали с категориями при вводе похожих запросов.
    • User Profile: История предыдущих взаимодействий конкретного пользователя с разными категориями.
  • Взвешивание: Система комбинирует данные из профиля и агрегированные данные с использованием весовых коэффициентов (weighting factors) для определения финальной оценки.
  • Упорядочивание и отображение: Категории сортируются по убыванию Likelihood Value. Результаты форматируются (например, в виде вкладок или модулей), и наиболее релевантная категория отображается первой.

Актуальность для SEO

Критически высокая. Описанный механизм является фундаментальной основой работы современного Универсального Поиска (Universal Search) и смешивания результатов (Blending). Определение интента запроса и выбор наиболее подходящего формата контента (вертикали) — центральная задача поисковых систем в 2025 году. Персонализация и учет контекста (например, мобильного устройства) также остаются ключевыми факторами.

Важность для SEO

Патент имеет критическое значение (95/100) для SEO. Он описывает механизм, который решает, будет ли ваш контент вообще видим в первичном представлении SERP. Понимание того, как Google классифицирует интент запроса и приоритизирует вертикали (Web, Images, Video, Local), напрямую влияет на стратегию создания контента. SEO-специалисты должны оптимизировать контент так, чтобы он соответствовал доминирующей категории, которую Google выбирает для конкретного кластера запросов.

Детальный разбор

Термины и определения

Category-directed result set (Набор результатов, ориентированный на категорию)
Набор поисковых результатов, полученных из определенного корпуса или индекса (например, Веб-индекс, Индекс Картинок, Индекс Новостей). Синоним термина "Вертикаль поиска".
Information Provider (Поставщик информации)
Система, которая принимает запросы, обрабатывает их и предоставляет результаты (например, Google).
Likelihood Value (Оценка Вероятности)
Вычисляемая метрика, которая представляет вероятность того, что конкретный набор результатов (категория) является релевантным для полученного запроса и пользователя.
Local Search (Локальный поиск)
Категория поиска, ориентированная на результаты в определенной географической области.
One Box
Специальный формат отображения результатов, часто представляющий собой сводку фактической информации, отвечающей на запрос (например, погода, расписание фильмов, локальные компании), отображаемый отдельно от стандартных списков результатов.
Profile Database / Profile Manager (База данных профилей / Менеджер профилей)
Компоненты, отвечающие за хранение и управление профилями пользователей (User Profiles). Профиль содержит историю взаимодействия пользователя с разными категориями поиска.
Relevance Filter / Relevance Data (Фильтр релевантности / Данные о релевантности)
Компонент, хранящий агрегированные данные о корреляции между запросами и категориями информации, основанные на поведении множества пользователей (а не одного конкретного).
Response Formatter (Форматтер ответов)
Компонент системы, который определяет порядок категорий на основе Likelihood Value и форматирует итоговую выдачу для отображения на устройстве пользователя.
Weighting Factors (Весовые коэффициенты)
Значения, используемые для определения относительного влияния данных из профиля пользователя и агрегированных данных при расчете Likelihood Value.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления упорядоченных результатов поиска.

  1. Система получает поисковый запрос от удаленного устройства.
  2. Генерируется несколько различных наборов результатов, ориентированных на категории (category-directed result sets).
  3. Определяется порядок для этих наборов результатов на основе поискового запроса.
  4. Наборы результатов передаются на удаленное устройство для отображения в определенном порядке.

Claim 3 (Зависимый от 1): Детализирует механизм определения порядка, вводя понятие профиля пользователя.

  1. Определение порядка включает вычисление Likelihood Value для каждого набора результатов.
  2. Это вычисление включает получение профиля, связанного с удаленным устройством.
  3. Профиль содержит распределение ранее определенных корреляций между прошлыми запросами с этого устройства и различными категориями информации.
  4. Это распределение учитывается при расчете Likelihood Value.

Claim 4 (Зависимый от 1): Детализирует механизм определения порядка, вводя понятие агрегированных данных.

  1. Вычисление Likelihood Value включает получение данных, связанных с другими запросами от других устройств, которые похожи на текущий запрос.
  2. Эти данные включают распределение корреляций между этими похожими запросами и категориями информации.
  3. Это распределение учитывается при расчете Likelihood Value.

Claim 6 (Зависимый от 1): Описывает комбинирование профиля и агрегированных данных.

  1. Расчет Likelihood Value включает:
    • Первый расчет на основе профиля пользователя (Результат 1).
    • Второй расчет на основе агрегированных данных по запросу (Результат 2).
    • Третий расчет, основанный на взвешенном вкладе (weighted contribution) Результата 1 и Результата 2.

Claim 12 (Независимый пункт): Описывает систему, реализующую метод.

  • Система включает search query processor (для приема и обработки запроса), search engine (для генерации результатов по категориям) и results ranker (для упорядочивания категорий).

Где и как применяется

Изобретение является ключевым компонентом этапа формирования финальной поисковой выдачи, определяя, какие вертикали поиска будут показаны пользователю и в каком порядке.

QUNDERSTANDING – Понимание Запросов
На этом этапе система анализирует запрос для определения его интента и потенциальной связи с различными категориями. Здесь могут применяться механизмы машинного обучения (упомянутые в патенте) и анализ исторических данных (Relevance Filter) для предсказания релевантности категорий.

RANKING – Ранжирование
Система параллельно запускает поиск в различных индексах (Web, Images, News, Local), чтобы сгенерировать category-directed result sets.

METASEARCH – Метапоиск и Смешивание (Universal Search & Blending)
Это основной этап применения патента. Response Formatter (или Results Ranker) выполняет следующие действия:

  1. Собирает результаты от разных движков ранжирования.
  2. Получает данные из Profile Manager и Relevance Filter.
  3. Вычисляет Likelihood Value для каждой категории, используя взвешенную комбинацию данных.
  4. Определяет финальный порядок отображения категорий (например, порядок вкладок или вертикальное расположение блоков).
  5. Форматирует выдачу, возможно, включая One Box результаты для высокорелевантных категорий.

Входные данные:

  • Поисковый запрос.
  • Идентификатор пользователя или устройства (для получения профиля).
  • Контекст запроса (например, тип устройства – мобильное/десктоп, местоположение, время суток).
  • Наборы результатов (category-directed result sets) от различных поисковых движков.

Выходные данные:

  • Упорядоченный набор категорий результатов, отформатированный для отображения на устройстве пользователя.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы с неоднозначным интентом или запросы, где интент сильно зависит от контекста (например, "Starbucks" может означать локальный поиск, новости или акции).
  • Мобильные устройства: Патент особо подчеркивает важность механизма для мобильных устройств, где пользователи чаще ищут локальную информацию и где ограничения интерфейса требуют точного предсказания интента.
  • Локальные запросы: Патент описывает специальные механизмы для определения локального интента, включая использование белых и черных списков запросов (whitelists/blacklists).
  • Все типы контента: Влияет на видимость всех категорий контента, включая веб-страницы, изображения, видео, новости, карты, товары, блоги и книги.

Когда применяется

Алгоритм применяется при обработке большинства поисковых запросов, для которых доступно более одной категории результатов.

  • Условия работы: Активируется, когда система определяет, что запрос может быть релевантен нескольким вертикалям поиска.
  • Триггеры: Интент запроса. Например, если запрос идентифицирован как имеющий сильный локальный интент (наличие локационных индикаторов или нахождение в белом списке локальных запросов), локальная категория получит приоритет.
  • Исключения: Если для запроса существует только одна релевантная категория или если качество результатов в определенной категории слишком низкое, эта категория может быть исключена из выдачи.

Пошаговый алгоритм

Основной процесс обработки запроса (Упорядочивание категорий)

  1. Получение запроса: Пользователь генерирует и отправляет запрос с устройства.
  2. Выполнение поиска: Поисковая система получает запрос и выполняет его параллельно по нескольким индексам (Web, Images, News и т.д.).
  3. Сбор результатов: Response Formatter получает несколько наборов результатов (category-directed result sets).
  4. Получение профиля пользователя: Response Formatter запрашивает и получает профиль пользователя у Profile Manager. Профиль содержит историю предпочтений категорий этим пользователем.
  5. Получение данных о релевантности: Response Formatter запрашивает и получает агрегированные данные у Relevance Filter. Эти данные содержат корреляции между текущим запросом (или похожими) и различными категориями на основе поведения всех пользователей.
  6. Расчет Оценки Вероятности (Likelihood Value): Для каждой категории вычисляется Likelihood Value. Расчет представляет собой взвешенную сумму данных из профиля пользователя и агрегированных данных о релевантности. Могут учитываться дополнительные факторы, такие как тип устройства (мобильное/десктоп).
  7. Упорядочивание результатов: Наборы результатов сортируются на основе рассчитанных Likelihood Values. Категория с наивысшей оценкой ставится первой.
  8. Фильтрация (Опционально): Категории с очень низким Likelihood Value или низким качеством результатов могут быть исключены.
  9. Форматирование: Результаты форматируются для отображения на устройстве (например, в виде вкладок, модулей или One Box).
  10. Передача и отображение: Упорядоченные и отформатированные результаты передаются на устройство пользователя.

Вспомогательный процесс определения Локального Интента

  1. Анализ запроса на наличие локации: Система проверяет, содержит ли запрос явные индикаторы местоположения (название города, почтовый индекс).
  2. Проверка наличия локации по умолчанию: Если явных индикаторов нет, система проверяет, сохранена ли локация по умолчанию для данного пользователя/устройства.
  3. Генерация индикатора локальности: Система определяет, насколько запрос коррелирует с локальным поиском. Для этого используются:
    • Белые списки (Whitelist): Запросы, часто используемые для локального поиска.
    • Черные списки (Blacklist): Запросы, редко используемые для локального поиска.
  4. Определение порядка отображения: Индикатор локальности используется для определения позиции локальных результатов относительно других категорий. При высокой корреляции локальные результаты могут быть показаны первыми, возможно, в формате One Box.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Индивидуальные): История поисковых запросов пользователя и его взаимодействие с различными категориями результатов (User Profile). Учитывается, какие категории пользователь выбирал в прошлом.
  • Поведенческие факторы (Агрегированные): Журналы запросов (Query Logs) от множества пользователей. Анализируется, как пользователи реагируют на результаты по схожим запросам — например, если пользователи часто переключаются на вкладку "Картинки" после ввода определенного запроса (Relevance Data).
  • Контентные/Лингвистические факторы: Термины в запросе. Они используются для поиска в индексах и для сопоставления с данными в Relevance Filter, а также с белыми и черными списками для локального поиска.
  • Географические факторы: Явные индикаторы местоположения в запросе (город, индекс), местоположение пользователя по умолчанию или предполагаемое местоположение устройства.
  • Пользовательские факторы (Контекст): Тип устройства (мобильное или нет). В патенте указано, что могут поддерживаться отдельные распределения релевантности для мобильных и немобильных устройств. Также может учитываться время суток.

Какие метрики используются и как они считаются

  • Likelihood Value (Оценка Вероятности): Ключевая метрика патента. Она рассчитывается для каждой категории (INFOTYPE) для данного пользователя (USER) и запроса (QUERY).
  • Формула расчета (Описательная): Патент предлагает формулу (Equation 1), которая является взвешенной суммой трех компонентов:

    LIKELIHOOD = (Вес Профиля * Данные Профиля) + (Вес Не-мобильного Распределения * Данные Не-мобильного Распределения) + (Вес Мобильного Распределения * Данные Мобильного Распределения)

    • Данные Профиля (PROFILE): Частота, с которой пользователь обращается к данной категории.
    • Данные Распределения (NMDIST/MDIST): Частота, с которой данный запрос глобально коррелирует с данной категорией для не-мобильных/мобильных устройств.
    • Веса (WEIGHT): Константы, определяющие влияние каждого компонента.
  • Машинное обучение: Патент упоминает, что предсказание может быть сделано с использованием правил, сгенерированных системой машинного обучения, обученной на исторических данных поиска. Система анализирует признаки (features) запроса (термины, язык, локация) и генерирует правила для ранжирования категорий.
  • Локальный Индикатор (Location Indicia): Метрика, определяющая степень корреляции запроса с локальным поиском. Может быть дискретной (например, основанной на попадании в Whitelist/Blacklist) или непрерывной.
  • Качество результатов: Упоминается, что порядок может также зависеть от качества фактических результатов в категории. Если качество низкое, категория может быть понижена или исключена.

Выводы

  1. Приоритет интента над ключевыми словами: Патент подтверждает, что Google стремится понять намерение пользователя и предоставить наиболее подходящий *формат* контента (категорию), а не только текстовую релевантность. Система активно решает, какая вертикаль должна доминировать в выдаче.
  2. Ранжирование вертикалей: Существует отдельный слой ранжирования, который оценивает не документы, а целые категории (Web, Images, News, Local). Этот слой использует Likelihood Value для сортировки вертикалей.
  3. Персонализация и агрегация: Определение релевантности категории — это гибридный процесс. Он учитывает как общие тенденции (что ищут все пользователи по этому запросу), так и индивидуальное поведение (что обычно ищет этот конкретный пользователь). Система использует веса для балансировки этих факторов.
  4. Важность контекста (Мобильность и Локальность): Контекст пользователя, особенно использование мобильного устройства и географическое положение, играет значительную роль в определении приоритета категорий. Локальный поиск имеет специальные механизмы определения интента (Whitelists/Blacklists).
  5. Качество как фильтр: Даже если категория признана релевантной интенту, она может быть понижена или скрыта, если качество результатов в ней низкое.

Практика

Best practices (это мы делаем)

  • Таргетирование интента через формат контента: Необходимо анализировать SERP по целевым запросам, чтобы понять, какие категории Google считает наиболее релевантными (имеющими наивысший Likelihood Value). Если доминируют изображения или видео, необходимо создавать и оптимизировать соответствующий контента для этих вертикалей.
  • Комплексная оптимизация под Универсальный Поиск: Не фокусируйтесь только на веб-результатах. Обеспечьте присутствие бренда в релевантных вертикалях (Local/Maps, Images, Video, News), так как любая из них может быть показана первой в зависимости от контекста и профиля пользователя.
  • Усиление локальных сигналов для мобильного трафика: Учитывая особое внимание патента к мобильному контексту и локальному поиску, необходимо тщательно прорабатывать локальные сигналы (Google Business Profile, локальные цитирования, контент с привязкой к местности), чтобы повысить шансы на отображение в локальной категории, особенно для пользователей мобильных устройств.
  • Создание контента под "Белые списки" локальных запросов: Хотя мы не знаем точного содержания Whitelists, мы можем предполагать, что запросы, связанные с услугами, товарами повседневного спроса, ресторанами и т.д., имеют высокий локальный интент. Контент должен быть оптимизирован для быстрого предоставления локальной информации по таким запросам.

Worst practices (это делать не надо)

  • Игнорирование доминирующей вертикали: Попытка ранжироваться в веб-поиске по запросу, для которого Google явно предпочитает другую категорию (например, пытаться продвинуть текстовую статью по запросу, где интент — это изображения или видео). Это приведет к низкой видимости, так как веб-категория будет иметь низкий Likelihood Value.
  • Фокус только на десктопной выдаче: Игнорирование того факта, что система может использовать разные распределения (MDIST/NMDIST) и веса для мобильных и десктопных устройств. Оптимизация должна учитывать различия в поведении пользователей на разных устройствах.
  • Манипуляции с локальным интентом: Создание контента, который пытается выглядеть локально релевантным для запросов из Blacklist (запросы, не связанные с локальным поиском), вероятно, будет неэффективным, так как система активно фильтрует такие случаи.

Стратегическое значение

Этот патент описывает архитектуру современного поиска, где классический "веб-поиск" — это лишь одна из многих категорий, конкурирующих за внимание пользователя. Стратегическое значение заключается в переходе от "оптимизации сайта" к "оптимизации присутствия в экосистеме поиска". SEO-стратегия должна быть мультиформатной и ориентированной на интент. Понимание того, как Google балансирует персонализацию и общие тенденции, помогает прогнозировать изменения в SERP и адаптировать контент-стратегию.

Практические примеры

Сценарий: Оптимизация для запроса с сильным визуальным интентом

  1. Анализ запроса: SEO-специалист анализирует запрос "идеи дизайна гостиной".
  2. Наблюдение SERP: В выдаче на первом месте (или в доминирующей позиции) отображается категория "Изображения". Это указывает на то, что Likelihood Value для категории Images выше, чем для Web или News.
  3. Стратегическое решение: Вместо создания длинной текстовой статьи, основной фокус делается на создании галереи высококачественных, уникальных изображений.
  4. Действия по оптимизации: Изображения оптимизируются (alt-текст, заголовки, окружающий текст, скорость загрузки, структурированные данные для изображений), чтобы повысить их шансы на ранжирование внутри вертикали Images.
  5. Результат: Сайт получает видимость в доминирующей категории, что приводит к увеличению релевантного трафика, даже если веб-страница сама по себе не занимает ТОП-1 в вертикали Web.

Сценарий: Адаптация под мобильный локальный интент

  1. Анализ запроса: Анализируется запрос "купить кроссовки Nike".
  2. Наблюдение SERP (Десктоп vs Мобайл): На десктопе доминирует категория Web (сайты интернет-магазинов). На мобильных устройствах доминирует категория Local/Maps (One Box с ближайшими магазинами).
  3. Интерпретация: Система использует разные веса и распределения (MDIST) для мобильных устройств, определяя сильный локальный интент.
  4. Действия по оптимизации: Для ритейлера с физическими магазинами приоритетом становится оптимизация Google Business Profile, управление локальными запасами (Local Inventory Ads), и обеспечение актуальности адресов и часов работы.
  5. Результат: Ритейлер получает приоритетное отображение на мобильных устройствах в тот момент, когда пользователь готов совершить покупку поблизости.

Вопросы и ответы

Что такое «Likelihood Value» и почему это важно для SEO?

Likelihood Value — это оценка вероятности того, что определенная категория поиска (Web, Images, News, Local) наиболее релевантна запросу пользователя. Это критически важно для SEO, потому что эта оценка определяет, какая вертикаль будет показана первой в выдаче. Если ваш контент находится в категории с низким Likelihood Value для данного запроса, он будет скрыт или понижен, даже если он хорошо ранжируется внутри своей вертикали.

Как Google определяет, какая категория наиболее релевантна запросу?

Google использует комбинацию трех основных факторов: агрегированные данные о поведении всех пользователей по этому запросу (Relevance Filter), индивидуальную историю поиска пользователя (User Profile) и контекст запроса (например, мобильное устройство или десктоп). Эти факторы комбинируются с использованием весовых коэффициентов для расчета финальной оценки Likelihood Value для каждой категории.

Насколько сильно персонализация (User Profile) влияет на порядок категорий?

Влияние значительно, но патент предполагает, что это взвешенный подход. Система не полагается исключительно на профиль пользователя; она также учитывает общие тенденции (агрегированные данные). Конкретные веса (Weighting Factors) определяют баланс между персонализацией и общей релевантностью, и эти веса могут меняться в зависимости от контекста или типа запроса.

Что такое «Relevance Filter»?

Relevance Filter — это компонент, который хранит агрегированные данные о том, как пользователи взаимодействуют с поисковой выдачей. Например, если большинство пользователей, вводящих запрос "Мона Лиза", переключаются на вкладку "Картинки", Relevance Filter зарегистрирует высокую корреляцию между этим запросом и категорией "Изображения".

Как этот патент связан с Универсальным Поиском (Universal Search)?

Этот патент описывает фундаментальный механизм, лежащий в основе Универсального Поиска. Он предоставляет алгоритм для смешивания (blending) и, что более важно, ранжирования различных вертикалей поиска. Это технология, которая позволяет Google формировать единую страницу выдачи из разных источников данных.

Почему в патенте уделяется особое внимание мобильным устройствам?

Патент подан в период активного роста мобильного поиска. На мобильных устройствах экранное пространство ограничено, а ввод данных сложнее. Поэтому критически важно сразу показать пользователю наиболее релевантную категорию, чтобы минимизировать необходимость навигации. Кроме того, поведение пользователей на мобильных устройствах часто отличается (например, выше доля локальных запросов).

Что такое Whitelist и Blacklist для локального поиска, упомянутые в патенте?

Это списки запросов, используемые для определения локального интента. Whitelist содержит запросы, которые статистически часто связаны с локальным поиском (например, "ресторан"). Blacklist содержит запросы, которые редко связаны с локальным поиском (например, "скачать драйвер"). Они помогают системе быстро классифицировать интент запроса.

Как SEO-специалист может использовать информацию из этого патента на практике?

Ключевое применение — это анализ интента и выбор правильного формата контента. Необходимо изучать SERP по целевым запросам на разных устройствах, определять доминирующую категорию и фокусировать усилия на создании и оптимизации контента именно для этой вертикали (будь то видео, изображения, локальные страницы или веб-текст).

Может ли категория быть понижена, даже если она релевантна запросу?

Да. Патент упоминает, что помимо Likelihood Value, система может учитывать качество результатов в категории. Если качество результатов низкое (например, мало результатов или они имеют низкие оценки ранжирования внутри вертикали), категория может быть понижена или исключена из выдачи.

Что такое «One Box» в контексте этого патента?

One Box — это специальный формат отображения для высокорелевантных результатов, часто используемый для локального поиска, погоды или фактоидов. Если система определяет очень высокую вероятность того, что определенная категория отвечает на запрос (например, локальный интент), она может отобразить результаты в виде One Box, который более удобен для восприятия, чем стандартный список ссылок.

Похожие патенты

Как Google формирует универсальную выдачу (Universal Search), смешивая и ранжируя результаты из разных вертикалей поиска
Патент описывает фундаментальный механизм "Универсального Поиска". Google одновременно ищет информацию по запросу в разных категориях (Веб, Новости, Товары, Картинки). Система ранжирует не только документы, но и сами категории по релевантности запросу, определяя, какие результаты объединить в единую выдачу и насколько заметно (Prominence) они будут представлены.
  • US7447678B2
  • 2008-11-04
  • SERP

Как Google использует историю поведения пользователя для персонализации выбора и ранжирования вертикальных блоков (Universal Search)
Google отслеживает, с какими типами специализированных результатов (Новости, Картинки, Карты и т.д.) взаимодействует пользователь. На основе этой истории поведения строится персональная вероятностная модель, которая предсказывает, какие вертикали предпочтет пользователь в будущем. Система использует эти предсказания для выбора, оценки и ранжирования блоков вертикального поиска в выдаче.
  • US9305088B1
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google предлагает категории для уточнения запроса на основе анализа топа выдачи (особенно в локальном поиске)
Google анализирует категории (например, из бизнес-справочников), к которым принадлежат топовые результаты по запросу пользователя. Наиболее релевантные или часто встречающиеся категории предлагаются пользователю для уточнения или сужения поиска, что особенно актуально для локальных запросов и поиска организаций.
  • US7523099B1
  • 2009-04-21
  • Local SEO

  • Семантика и интент

  • SERP

Как Google использует статистику поиска и кликов по разным вертикалям (Web, Картинки, Видео) для определения предпочтительного типа контента и ранжирования в Универсальном Поиске
Google анализирует, в каких вертикалях (корпусах) пользователи чаще ищут определенный запрос и на какие типы результатов они кликают в смешанной выдаче. Система вычисляет "Меру относительной релевантности" для каждого корпуса и использует её для повышения результатов из наиболее предпочтительного корпуса, учитывая язык, страну пользователя и актуальные тренды.
  • US8359309B1
  • 2013-01-22
  • SERP

  • Поведенческие сигналы

  • Мультимедиа

Как Google персонализирует результаты поиска изображений на основе языка и местоположения пользователя
Google персонализирует Поиск Изображений, анализируя исторические данные о кликах. Система сравнивает, на что кликает общая популяция пользователей, с тем, что предпочитают пользователи с тем же языком и местоположением. Если предпочтения значительно различаются, Google переранжирует изображения в соответствии с локальным консенсусом, обеспечивая культурно и контекстуально релевантные результаты.
  • US8504547B1
  • 2013-08-06
  • Персонализация

  • Мультимедиа

  • Поведенческие сигналы

Популярные патенты

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует внешние данные для оценки репутации сущностей и их взаимной привлекательности в вертикальном поиске
Google использует систему для улучшения вертикального поиска (например, вакансий, недвижимости) путем оценки взаимной привлекательности двух разных типов сущностей (например, соискателя и вакансии). Система агрегирует данные из внешних источников для выявления скрытых атрибутов и расчета «Репутационной значимости» каждой сущности. На основе этих данных определяется метрика «Двухстороннего соответствия», которая используется для ранжирования.
  • US10853432B2
  • 2020-12-01
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google генерирует блок "Похожие вопросы" (People Also Ask) на основе анализа кликов и поведения пользователей
Google анализирует топовые результаты по исходному запросу и определяет "Тематические запросы" (Topic Sets) — прошлые запросы, по которым пользователи кликали на эти результаты. Затем система ищет популярные вопросы, соответствующие этим темам, фильтрует дубликаты на основе общности кликов и показывает их в блоке PAA для дальнейшего исследования темы.
  • US9213748B1
  • 2015-12-15
  • SERP

  • Семантика и интент

  • Поведенческие сигналы

Как Google извлекает, обрабатывает и индексирует анкорный текст, контекст и атрибуты входящих ссылок для ранжирования целевых страниц
Фундаментальный патент, описывающий инфраструктуру Google для обработки ссылок. Система извлекает анкорный текст, окружающий контекст и атрибуты форматирования (аннотации) из исходных страниц и инвертирует эти данные в структуру "Sorted Anchor Map". Это позволяет индексировать целевую страницу по тексту ссылок, указывающих на нее, используя эту внешнюю информацию как сигнал релевантности.
  • US7308643B1
  • 2007-12-11
  • Ссылки

  • Индексация

  • Техническое SEO

Как Google использует модель предвзятости представления (Presentation Bias), чтобы отделить клики по релевантности от кликов по позиции
Google использует механизм для интерпретации поведения пользователей (CTR), который учитывает, как именно представлены результаты поиска. Система рассчитывает ожидаемый CTR для конкретной позиции и визуального оформления (сниппет, выделение). Чтобы получить буст от поведенческих факторов, реальный CTR документа должен значительно превышать этот ожидаемый уровень. Это позволяет отфильтровать клики, обусловленные высокой позицией или привлекательным сниппетом, и выделить сигналы истинной релевантности.
  • US8938463B1
  • 2015-01-20
  • Поведенческие сигналы

  • SERP

Как Google в Автоподсказках (Suggest) предлагает искать запрос в разных вертикалях поиска (Картинки, Новости, Карты)
Патент описывает механизм "разветвления" (forking) автоподсказок Google Suggest. Система анализирует введенные символы и определяет, в каких вертикалях поиска (Корпусах) — таких как Картинки, Новости или Карты — пользователи чаще всего ищут предложенный запрос. Если корреляция с конкретной вертикалью высока (на основе Corpus Score), система предлагает пользователю искать сразу в ней, наряду со стандартным универсальным поиском.
  • US9317605B1
  • 2016-04-19
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

seohardcore