SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует контекстно-зависимые шаблоны запросов для понимания локальных поисковых запросов

SYSTEMS, METHODS, AND COMPUTER-READABLE MEDIA FOR INTERPRETING GEOGRAPHICAL SEARCH QUERIES (Системы, методы и машиночитаемые носители для интерпретации географических поисковых запросов)
  • US9753945B2
  • Google LLC
  • 2013-03-13
  • 2017-09-05
  • Local SEO
  • Семантика и интент
  • Персонализация
  • Мультиязычность
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует исторические логи поиска, чтобы понять, как пользователи в разных странах и на разных языках структурируют географические запросы. Система генерирует вероятностные Шаблоны Запросов (Query Templates) и рассчитывает вероятность их корректности в зависимости от контекста пользователя (локаль, язык, устройство). Это позволяет точнее интерпретировать неоднозначные локальные запросы и адаптироваться к региональным особенностям.

Описание

Какую проблему решает

Патент решает проблему неоднозначности и высокой вариативности географических поисковых запросов. Пользователи в разных регионах, использующие разные языки и устройства, формулируют запросы о местоположениях по-разному (например, порядок указания улицы и города). Это затрудняет точную интерпретацию запроса поисковой системой и может приводить к нерелевантным результатам в локальном поиске и на картах. Изобретение улучшает понимание географического интента путем адаптации к контексту пользователя.

Что запатентовано

Запатентована система для генерации и использования Query Templates (шаблонов запросов) для интерпретации географических запросов. Система в офлайн-режиме анализирует логи поисковых запросов для выявления устойчивых структур (шаблонов), состоящих из Term Types (типов терминов, например, [УЛИЦА], [ГОРОД]). Ключевым элементом является расчет Probability Distributions (распределений вероятностей) для этих шаблонов в зависимости от Context пользователя (локаль, язык, тип устройства), что позволяет адаптироваться к региональным различиям.

Как это работает

Система работает в двух основных режимах:

  • Офлайн (Генерация шаблонов): Система анализирует логи географических запросов и связанные с ними действия пользователей. Уникальные запросы интерпретируются и абстрагируются до шаблонов (например, запрос "5 wall st ny" становится шаблоном [НОМЕР] [УЛИЦА] [ЛОКАЛЬ]). Затем рассчитывается вероятность того, что каждый шаблон является корректным для конкретного контекста (например, для пользователей из США на мобильных устройствах).
  • Онлайн (Интерпретация запроса): При получении нового запроса система определяет контекст пользователя. Она генерирует Interpretation Candidates (кандидатов на интерпретацию) на основе сохраненных шаблонов и присваивает им вероятности, соответствующие текущему контексту. Кандидаты ранжируются, и наиболее вероятная интерпретация используется для выполнения поиска.

Актуальность для SEO

Высокая. Точная интерпретация локальных запросов критически важна для Google Maps, Local Pack и мобильного поиска. Способность адаптироваться к международным, лингвистическим и контекстуальным различиям в формулировании запросов остается фундаментальной задачей в области понимания запросов (Query Understanding).

Важность для SEO

Патент имеет значительное влияние на стратегии локального и международного SEO (7.5/10). Он демонстрирует, что Google не использует универсальные правила для парсинга географических запросов, а применяет data-driven подход, основанный на реальном поведении пользователей в конкретной локали и на конкретном языке. Это подчеркивает необходимость глубокой локализации SEO-стратегий, учитывающей структурные особенности запросов целевой аудитории.

Детальный разбор

Термины и определения

Additional Signals from User Actions (Дополнительные сигналы от действий пользователя)
Данные о поведении пользователя после выполнения запроса (например, клик по результату, уточнение запроса). Используются в офлайн-режиме для валидации интерпретаций при генерации шаблонов.
Context (Контекст)
Набор факторов, характеризующих среду пользователя в момент отправки запроса. Включает локаль (Locale), язык, страну, домен (например, .com, .de) и тип клиента (Client Type - desktop или mobile).
Geographical Search Query (Географический поисковый запрос)
Запрос, направленный на поиск информации о местоположении, адресе или географической области.
Interpretation Candidates (Кандидаты на интерпретацию)
Потенциальные варианты интерпретации входящего запроса, сгенерированные на основе Query Templates.
Probability Distribution (Распределение вероятностей)
Статистическая функция, определяющая вероятность того, что конкретный Query Template является правильной интерпретацией запроса для заданного Context.
Query Templates (Шаблоны запросов)
Абстрактные структуры географических запросов, состоящие из упорядоченного набора Term Types. Генерируются путем анализа логов. Пример: [STREET_NUMBER] [ROUTE] [LOCALITY].
Term Types (Типы терминов)
Категории, присваиваемые терминам в запросе. Примеры: ROUTE (улица), LOCALITY (населенный пункт), STREET_NUMBER (номер дома), ENTITY_POI (точка интереса), POSTAL_CODE (индекс), STATE, COUNTRY.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод интерпретации географических поисковых запросов.

  1. Система получает географический поисковый запрос от клиента.
  2. Система получает (из логов) множество исторических географических запросов.
  3. На основе этих запросов определяются Query Templates. Каждый шаблон включает расположение нескольких географических Term Types.
  4. Ключевое условие: некоторые шаблоны имеют различное расположение Term Types для разных локалей (Locales).
  5. Определяются Probability Distributions для шаблонов, соответствующие этим разным локалям.
  6. Шаблоны предоставляются в качестве Interpretation Candidates для интерпретации нового запроса. При этом используется распределение вероятностей, соответствующее локали, из которой был получен новый запрос.

Ядром изобретения является создание и использование контекстно-зависимых (в частности, зависимых от локали) вероятностных моделей для понимания структуры географических запросов.

Claim 15 (Зависимый): Уточняет процесс генерации шаблонов.

Определение шаблонов запросов основано на исторических запросах и связанных с ними действиях пользователей (user actions), таких как выбор результата поиска или уточнение запроса. Это подтверждает использование поведенческих данных для обучения модели.

Claim 18 (Зависимый): Расширяет понятие контекста.

Указывается, что шаблоны также могут иметь разное расположение Term Types для разных языков. Вероятности определяются с учетом как местоположения, так и языка запроса.

Claim 20 (Зависимый): Приводит конкретный пример региональных различий.

Первый шаблон имеет набор Term Types в первом порядке для первой локали, а второй шаблон имеет тот же набор Term Types, но во втором (отличном) порядке для второй локали (например, [Улица][Номер] vs [Номер][Улица]).

Где и как применяется

Изобретение применяется на этапе понимания запроса и является критически важным для локального поиска.

QUNDERSTANDING – Понимание Запросов
Это основная область применения. Система функционирует как интерпретатор географических запросов (Query interpreter). Она анализирует входящий запрос и контекст пользователя, используя предварительно рассчитанные Query Templates и Probability Distributions, чтобы определить наиболее вероятный географический интент.

Сбор данных и Анализ (Офлайн)
Процесс генерации шаблонов (Mining) происходит офлайн. Query template generator анализирует логи поисковых запросов (полученные, например, от Map Search engine) и Additional signals from user actions для построения статистических моделей.

RANKING – Ранжирование (Локальное)
Система напрямую не ранжирует результаты, но предоставляет входные данные для ранжирования. Результат интерпретации (структурированный интент) передается в географический поисковый движок (Geographic search engine) для извлечения и сортировки локальных результатов.

Входные данные (Онлайн):

  • Входящий географический поисковый запрос.
  • Контекст пользователя (Context): Локаль, Язык, Тип устройства.
  • База данных индексированных шаблонов запросов с их распределениями вероятностей.

Выходные данные (Онлайн):

  • Ранжированный список кандидатов на интерпретацию (Interpretation Candidates) с присвоенными оценками (Scores).

На что влияет

  • Конкретные типы контента: Влияет на результаты в Google Maps, Local Pack, страницы локальных бизнесов и точки интереса (POI).
  • Специфические запросы: Запросы с географическим интентом, особенно неоднозначные запросы, где интерпретация зависит от региональных особенностей (например, адресные запросы).
  • Конкретные ниши или тематики: Все ниши, зависящие от локального трафика (ритейл, услуги, недвижимость, туризм).
  • Языковые и географические ограничения: Патент специально разработан для обработки этих ограничений. Эффективность системы зависит от объема и качества накопленных логов для конкретной локали и языка.

Когда применяется

  • Триггеры активации: Алгоритм активируется, когда система идентифицирует запрос как географический.
  • Условия работы: Применяется для интерпретации структуры запроса до того, как он будет выполнен поисковым движком, особенно в случаях структурной неоднозначности.

Пошаговый алгоритм

Процесс А: Офлайн-генерация шаблонов запросов (Mining)

  1. Сбор данных: Получение логов географических поисковых запросов из поискового движка (например, Map Search engine).
  2. Извлечение уникальных запросов: Фильтрация и подсчет уникальных запросов.
  3. Определение интерпретаций: Для каждого уникального запроса определяется его корректная интерпретация. Это делается с использованием результатов поискового движка и Additional signals from user actions (клики, уточнения запроса).
  4. Извлечение шаблонов: Интерпретации абстрагируются до Query Templates путем замены терминов на их типы (Term Types).
  5. Подсчет уникальных шаблонов: Агрегация и определение списка уникальных шаблонов.
  6. Расчет вероятностей по контекстам: Определение Probability Distributions для каждого шаблона в зависимости от Context (локаль, язык, тип устройства).
  7. Индексирование и хранение: Сохранение шаблонов и их вероятностей для использования в реальном времени.

Процесс Б: Интерпретация запроса в реальном времени

  1. Получение запроса и контекста: Система получает входящий запрос и определяет Context пользователя.
  2. Генерация кандидатов: Система сопоставляет запрос с базой Query Templates для генерации Interpretation Candidates.
  3. Присвоение вероятностей: Каждому кандидату присваивается вероятность на основе Probability Distribution для текущего контекста.
  4. Присвоение оценок (Scoring): Кандидатам присваиваются оценки. Оценка может основываться на вероятности шаблона и других критериях (например, популярность результата, расстояние до пользователя).
  5. Ранжирование: Кандидаты ранжируются на основе оценок.
  6. Предоставление результатов: Наиболее вероятная(ые) интерпретация(и) используется для выполнения запроса в поисковом движке.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных:

  • Поведенческие факторы: Критически важные данные. Логи выполненных географических запросов (search query log). Additional signals from user actions (выбор результата, последующие уточнения) используются для валидации интерпретаций и расчета вероятностей во время офлайн-анализа.
  • Географические факторы: Данные о местоположении пользователя для определения локали (Locale) и страны. Используются как часть Context.
  • Пользовательские факторы: Язык пользователя (Language) и тип устройства (Client Type - desktop/mobile). Также используются как часть Context.

Какие метрики используются и как они считаются

  • Частота (Count): Количество раз, когда шаблон встретился в логах для определенного контекста.
  • Probability Distribution (Распределение вероятностей): Ключевая метрика. Рассчитывается на основе частоты использования шаблона в конкретном контексте. Определяет вероятность P(Template | Context).
  • Interpretation Scores (Оценки интерпретации): Оценки, присваиваемые кандидатам в онлайн-режиме. Они основываются на Probability Distribution и могут включать другие факторы, упомянутые в патенте, такие как популярность результата или расстояние между результатом и пользователем.

Выводы

  1. Контекст определяет интерпретацию в локальном поиске: Главный вывод — интерпретация географического запроса статистически зависит от контекста пользователя (локаль, язык, устройство). Google не применяет универсальные правила парсинга адресов.
  2. Data-Driven подход и региональные различия: Система обучается на исторических данных (логах запросов) и явно учитывает, что порядок терминов (Term Types) различается в зависимости от региона (Claim 20). То, как люди ищут в определенном регионе, определяет, как Google будет интерпретировать будущие запросы из этого региона.
  3. Вероятностное разрешение неоднозначности: При наличии нескольких возможных интерпретаций система использует рассчитанные Probability Distributions для выбора наиболее статистически вероятного варианта для данного контекста.
  4. Важность поведенческих сигналов для обучения: Патент явно указывает (Claim 15) на использование действий пользователя (клики, уточнения запроса) для валидации интерпретаций во время генерации шаблонов. Поведенческие факторы играют ключевую роль в обучении систем понимания запросов.
  5. Офлайн-вычисления для скорости: Генерация шаблонов и расчет вероятностей происходят офлайн, что позволяет системе быстро применять сложные статистические модели в реальном времени.

Практика

Best practices (это мы делаем)

  • Глубокая локализация SEO-стратегии: Необходимо исследовать, как именно целевая аудитория в конкретном регионе и на конкретном языке формулирует географические запросы. Адаптируйте контент, метаданные и структуру локальных страниц под доминирующие локальные Query Templates (например, порядок адреса, использование сокращений).
  • Обеспечение четкости и полноты локальных данных (NAP): Предоставляйте полные, консистентные и отформатированные в соответствии с местными стандартами данные о местоположении (Name, Address, Phone). Это помогает системе корректно классифицировать элементы адреса по Term Types.
  • Использование структурированных данных (LocalBusiness Schema): Внедряйте микроразметку для точного указания всех компонентов адреса. Это помогает поисковой системе однозначно идентифицировать Term Types и снижает риск неоднозначной интерпретации.
  • Учет типа устройства в SEO-стратегии: Так как тип устройства (Client Type) является частью Context, паттерны запросов могут отличаться. Анализируйте данные GSC для выявления различий в формулировках запросов с мобильных и десктопных устройств и адаптируйте стратегию соответственно.

Worst practices (это делать не надо)

  • Применение универсальных форматов адресов: Использование единого стандарта форматирования (например, американского) для всех международных версий сайта. Это может привести к тому, что контент не будет соответствовать доминирующим локальным Query Templates в целевом регионе.
  • Игнорирование языкового контекста: Не учитывать язык пользователя при оптимизации локального контента. Язык является важным контекстуальным сигналом, влияющим на выбор шаблона интерпретации (Claim 18).
  • Прямой перевод ключевых слов без структурной адаптации: Дословный перевод географических запросов или локального контента без учета структурных и лингвистических различий в целевом языке и регионе.

Стратегическое значение

Патент подтверждает стратегическую важность локализации, выходящей за рамки простого перевода. Для успешного международного и локального SEO необходимо адаптировать структуру и семантику под реальные поведенческие паттерны пользователей в целевом регионе. Google использует сложные статистические модели, основанные на машинном обучении и анализе больших данных, для интерпретации географического интента. Долгосрочная стратегия должна фокусироваться на соответствии этим изученным моделям поведения.

Практические примеры

Сценарий 1: Обработка неоднозначного запроса в разных локалях

  1. Запрос: Пользователь вводит запрос из двух терминов: [Term A] [Term B].
  2. Контекст 1 (США): Система проверяет Probability Distributions для локали США. Шаблон [ROUTE] [LOCALITY] (Улица Город) имеет вероятность 70%, а шаблон [LOCALITY] [ROUTE] (Город Улица) – 10%.
  3. Результат в США: Система предпочтет интерпретацию "Улица Город".
  4. Контекст 2 (Некоторая страна Европы): Система проверяет вероятности для этой локали. Шаблон [LOCALITY] [ROUTE] имеет вероятность 65%.
  5. Результат в Европе: Система предпочтет интерпретацию "Город Улица".

Сценарий 2: Интерпретация запроса "zurich 9000" (Пример из описания патента)

  1. Запрос: "zurich 9000". Контекст: Швейцария.
  2. Генерация кандидатов:
    1. Кандидат A: [CITY] [POSTAL_CODE] (Цюрих, индекс 9000).
    2. Кандидат B: [STREET_NUMBER] [ROUTE] (Дом Цюрих, улица 9000 - или наоборот).
  3. Применение вероятностей: Система проверяет статистику для контекста (Швейцария). Допустим, вероятность шаблона A составляет 65%, а шаблона B – 23%.
  4. Результат: Интерпретация A получает более высокий Score и выбирается для предоставления результатов.

Вопросы и ответы

Что такое "Context" (Контекст) в рамках этого патента и почему он так важен?

Контекст — это набор данных о пользователе и его среде в момент запроса. Он включает локаль (Locale), язык, страну и тип устройства (desktop/mobile). Контекст критически важен, потому что он определяет, какое распределение вероятностей (Probability Distribution) будет использоваться. Поскольку люди в разных странах формулируют запросы по-разному, контекст позволяет Google выбрать наиболее релевантный набор шаблонов (Query Templates) для точного понимания интента.

Как Google определяет правильную интерпретацию запроса для генерации шаблонов в офлайн-режиме?

Патент указывает, что помимо результатов самого поискового движка, система использует Additional signals from user actions (Claim 15). Это означает, что Google анализирует поведение пользователей после запроса — например, на какие результаты они кликали или как переформулировали запрос, если выдача была нерелевантной. Эти сигналы служат валидацией для обучения системы.

Как это влияет на стратегию международного локального SEO?

Это имеет фундаментальное значение. Патент доказывает, что нельзя просто переводить ключевые слова или использовать универсальный формат адресов. Необходимо проводить исследование того, как именно пользователи структурируют запросы в целевой локали и на целевом языке. Стратегия должна адаптироваться под доминирующие Query Templates в каждом конкретном регионе.

Влияет ли тип устройства (мобильный или десктоп) на интерпретацию запроса?

Да, влияет. Патент явно указывает, что тип клиента (Client Type) является частью Context. Это означает, что Google рассчитывает и хранит отдельные распределения вероятностей для мобильных и десктопных пользователей, если обнаруживает статистически значимые различия в их поведении и структуре запросов.

Что такое "Term Types" и какие они бывают?

Term Types — это абстрактные категории для элементов географического запроса. Система стремится разбить запрос на эти составляющие. Примеры включают ROUTE (улица), LOCALITY (населенный пункт), STREET_NUMBER (номер дома), ENTITY_POI (точка интереса, например, «Эйфелева башня»), POSTAL_CODE (индекс), STATE (штат/область) и COUNTRY (страна).

Как этот патент связан с консистентностью NAP (Name, Address, Phone) в локальном SEO?

Консистентность NAP остается крайне важной. Четкие, полные и единообразные данные NAP помогают системе корректно идентифицировать Term Types вашего бизнеса (например, однозначно определить название улицы и города). Это снижает вероятность неправильной интерпретации и помогает связать ваш бизнес с релевантными географическими запросами, независимо от используемого пользователем шаблона.

Применяется ли этот механизм только к Google Maps или также к основному веб-поиску?

Хотя в патенте часто упоминается Map Search engine, описанные механизмы применяются везде, где обрабатывается локальный интент. Это включает Google Maps, а также основной веб-поиск, в частности, для формирования Local Pack и ранжирования локализованных органических результатов.

Могу ли я узнать, какие Query Templates доминируют в моей локали?

Напрямую Google не предоставляет доступ к этим данным. Однако вы можете сделать обоснованные выводы, анализируя данные в Google Search Console и поисковые подсказки в вашем целевом регионе. Изучая, какие формулировки запросов приводят трафик и как пользователи структурируют поиск, вы можете реконструировать наиболее вероятные шаблоны.

Если я использую микроразметку Schema.org для адреса, нужен ли Google этот механизм интерпретации?

Да, нужен. Микроразметка помогает Google понять данные на вашей странице (этап Индексирования), но этот патент описывает понимание запроса пользователя (этап Query Understanding). Пользователи вводят запросы на естественном языке, а не в формате Schema.org. Система необходима для интерпретации этих запросов, чтобы затем связать понятый интент с данными в индексе.

Учитывает ли система изменения в поведении пользователей со временем?

Да. Патент описывает возможность анализа изменений в шаблонах с течением времени. Процесс генерации шаблонов (Mining) выполняется периодически. Это позволяет системе адаптироваться к новым трендам в поиске, изменениям в языке или поведению пользователей (например, если пользователи начинают использовать новые типы запросов или сокращения).

Похожие патенты

Как Google разбирает локальные запросы на «Что» и «Где» для повышения точности выдачи
Google использует механизм для интерпретации локальных запросов, введенных в одну строку. Система генерирует различные комбинации разделения запроса на тему («Что») и местоположение («Где»), отправляет их в разные базы данных (например, Карты, Локальный поиск) и использует оценки уверенности (Confidence Scores) для выбора наилучшей интерпретации.
  • US7917490B2
  • 2011-03-29
  • Local SEO

  • Семантика и интент

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.
  • US8478773B1
  • 2013-07-02
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google динамически определяет стоп-слова в локальных запросах, тестируя разные интерпретации запроса
Google использует механизм для точной интерпретации локальных запросов, содержащих неоднозначные слова. Вместо статического удаления стоп-слов система генерирует несколько вариантов разделения запроса на субъект и местоположение. Она тестирует варианты с удалением и сохранением потенциального стоп-слова, выполняет параллельные поиски и выбирает ту интерпретацию, которая дает наилучшие результаты.
  • US9009144B1
  • 2015-04-14
  • Семантика и интент

  • Local SEO

Как Google автоматически создает и ранжирует шаблоны запросов с сущностями для улучшения поисковых подсказок (Autocomplete)
Google использует систему для автоматического обнаружения паттернов в поисковых запросах, которые включают фиксированные термины и сущности из определенной категории (например, «рестораны в [городе]»). Система генерирует шаблоны запросов, оценивает их качество на основе частоты использования, разнообразия сущностей и их распределения, а затем использует эти шаблоны для формирования более точных и структурированных поисковых подсказок в реальном времени.
  • US9529856B2
  • 2016-12-27
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Популярные патенты

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google интегрирует персональный и социальный контент (Email, посты друзей, календарь) в универсальную поисковую выдачу
Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
  • US20150310100A1
  • 2015-10-29
  • Персонализация

  • Индексация

  • Поведенческие сигналы

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google собирает и структурирует данные о поведении пользователей в Поиске по картинкам (включая ховеры, клики и 2D-позицию)
Патент Google описывает инфраструктуру для детального сбора данных в Поиске по картинкам. Система фильтрует общие логи, фиксируя не только клики, но и наведение курсора (ховеры), длительность взаимодействия и точное 2D-расположение (строка/столбец) изображения на выдаче. Эти данные агрегируются в Модель Запросов Изображений для оценки релевантности.
  • US8898150B1
  • 2014-11-25
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google ранжирует сущности (например, людей с одинаковыми именами) с помощью кластеризации, контекстной авторитетности и персонализации
Google использует систему двухуровневого ранжирования для обработки неоднозначных запросов (например, имен людей). Сначала ресурсы группируются в кластеры, представляющие разные сущности. Ресурсы внутри кластера ранжируются на основе их качества и авторитетности внутри этого кластера. Затем сами кластеры ранжируются с учетом релевантности запросу и сильной персонализации (социальные связи и местоположение пользователя).
  • US8645393B1
  • 2014-02-04
  • Персонализация

  • Семантика и интент

  • SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google использует семантические связи внутри контента для переранжирования и повышения разнообразия выдачи
Google использует метод для переоценки и переранжирования поисковой выдачи путем анализа семантических взаимодействий между терминами внутри документов. Система строит графы локальных и глобальных связей, а затем определяет взаимосвязи между самими документами на основе их семантического вклада (даже без гиперссылок). Это позволяет повысить разнообразие выдачи, особенно по неоднозначным запросам.
  • US7996379B1
  • 2011-08-09
  • Семантика и интент

  • Ссылки

  • SERP

seohardcore