SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует географическое положение и историю поведения пользователей для разрешения неоднозначных запросов

INTERPRETING SEARCH QUERIES (Интерпретация поисковых запросов)
  • US8478773B1
  • Google LLC
  • 2011-01-14
  • 2013-07-02
  • Семантика и интент
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы и насколько они были удовлетворены результатами. На основе этих локализованных данных (гистограмм и метрик неудовлетворенности) выбирается наиболее вероятная интерпретация, и выдача фильтруется соответственно.

Описание

Какую проблему решает

Патент решает проблему обработки неоднозначных (ambiguous) или недостаточно определенных (underspecified) поисковых запросов, особенно в контексте географического поиска и онлайн-карт. Неоднозначность возникает, когда запрос может иметь несколько интерпретаций, что приводит к выдаче результатов, которые либо географически удалены друг от друга, либо принадлежат к разным категориям (например, запрос, совпадающий с названием ресторана и города). Цель — определить истинное намерение пользователя (intended search query) и предоставить наиболее релевантные результаты.

Что запатентовано

Запатентована система интерпретации запросов (Search Interpreter), которая обнаруживает неоднозначность и устраняет её, опираясь на анализ исторических данных пользователей с похожими характеристиками (similar characteristic), в первую очередь — с тем же географическим положением. Система анализирует журнал сохраненных запросов (log of stored search queries) и реакции пользователей (stored responses) на них. Для выбора наилучшей интерпретации используется анализ частотности (histogram analysis) и метрики удовлетворенности.

Как это работает

Система работает в несколько этапов:

  • Обнаружение неоднозначности: После первичного поиска система анализирует результаты. Если топовые результаты значительно удалены друг от друга (превышая порог расстояния) или относятся к разным категориям, запрос признается неоднозначным.
  • Анализ исторических данных: Система ищет похожие, но более специфичные запросы в истории поиска.
  • Географическая фильтрация: Эти исторические данные фильтруются, оставляя только запросы, сделанные из того же региона, что и текущий пользователь.
  • Определение интента: С помощью гистограммного анализа определяется наиболее частая интерпретация в этом регионе. Также учитываются сигналы неудовлетворенности пользователей (dissatisfaction count) прошлыми результатами.
  • Фильтрация выдачи: Исходные результаты фильтруются в соответствии с выбранной доминирующей интерпретацией.

Актуальность для SEO

Высокая. Понимание контекста пользователя, особенно его местоположения, и использование агрегированных поведенческих данных для уточнения интента являются фундаментальными компонентами современного поиска (Query Understanding). Эти механизмы критически важны для локального поиска и мобильной выдачи, где неоднозначность запросов встречается часто.

Важность для SEO

Патент имеет высокое значение для SEO, особенно для локального продвижения и управления брендами с неоднозначными названиями. Он демонстрирует, что доминирующий интент запроса не является статичным и сильно зависит от географии пользователя и исторического поведения локальной аудитории. Если бизнес не соответствует этому локальному доминирующему интенту, ранжирование по общему термину будет затруднено. Это подчеркивает важность анализа интента на региональном уровне и оптимизации под удовлетворенность пользователей.

Детальный разбор

Термины и определения

Ambiguous Search Query (Неоднозначный поисковый запрос)
Запрос, который приводит к разрозненным результатам поиска — либо географически удаленным друг от друга, либо принадлежащим к разным категориям.
Disambiguated Interpretation (Однозначная/Уточненная интерпретация)
Выбранная системой наиболее вероятная интерпретация неоднозначного запроса, основанная на анализе локализованных исторических данных.
Dissatisfaction Count (Счетчик неудовлетворенности)
Метрика, агрегирующая поведенческие сигналы, указывающие на неудовлетворенность пользователя результатами поиска (например, выполнение уточняющего запроса (refined search query), быстрый возврат к выдаче).
Histogram Data (Данные гистограммы)
Статистический анализ частотности различных интерпретаций запроса в истории поиска, сгруппированных по определенному признаку (например, географии).
Search Interpreter (Интерпретатор поиска)
Компонент поисковой системы, отвечающий за обнаружение и устранение неоднозначности запросов.
Similar Characteristic (Схожая характеристика)
Характеристика пользователя, используемая для фильтрации исторических данных. В патенте основным примером является географическое положение (geographic location).
Stored Responses (Сохраненные реакции)
Исторические данные о взаимодействии пользователей с результатами поиска, включая клики (user click), наведение курсора (mouse over) и уточняющие запросы.
Stored Search Queries (Сохраненные поисковые запросы)
База данных (лог) ранее выполненных поисковых запросов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод интерпретации запросов.

  1. Получение поискового запроса от пользователя.
  2. Идентификация набора результатов, отвечающих запросу.
  3. Определение того, что запрос неоднозначен (ambiguous). Критерий, указанный в этом пункте: географическое расстояние между местоположениями как минимум двух результатов превышает предопределенное расстояние (predetermined distance).
  4. Выбор однозначной интерпретации (disambiguated interpretation) на основе анализа журнала сохраненных поисковых запросов (log of stored search queries), которые похожи на исходный запрос и были получены от других пользователей.
  5. Предоставление набора результатов, основанного на этой однозначной интерпретации.

Ядром изобретения является автоматическое обнаружение неоднозначности по географическому признаку и её устранение с помощью анализа исторических данных.

Claim 2 (Зависимый от 1): Добавляет второй критерий неоднозначности.

Неоднозначность также может быть определена, если как минимум два результата связаны с разными категориями (different categories). Это позволяет системе реагировать на ситуацию, когда результаты близки географически, но различны по типу (например, магазин и достопримечательность).

Claim 5 и 9 (Зависимые от 1): Уточняют, что анализ исторических данных включает оценку поведения пользователей.

Анализ включает идентификацию взаимодействий (user interaction) и уточняющих запросов (Claim 5), а также определение удовлетворенности пользователей (user satisfaction) предыдущими результатами (Claim 9). Это означает использование поведенческих сигналов для оценки качества интерпретаций.

Claim 7 (Зависимый от 1): Определяет важность контекста пользователя.

Анализ журнала сохраненных запросов основывается на схожих характеристиках, включающих географическое местоположение (geographic location), откуда запрос был инициирован. Это ключевой момент: система ищет доминирующий интент в конкретном регионе.

Claim 8 (Зависимый от 1): Детализирует метод анализа.

Процесс включает идентификацию сохраненных запросов из того же географического региона и анализ данных гистограммы (histogram data) для этого набора. Это описывает механизм частотного анализа локализованных данных.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поиска.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения. Search Interpreter анализирует запрос в контексте местоположения пользователя. Если запрос потенциально неоднозначен, система использует агрегированные исторические данные для выбора наиболее вероятной disambiguated interpretation. Это форма переписывания или уточнения запроса на основе контекста.

RANKING – Ранжирование
На этом этапе генерируется первоначальный набор результатов. Именно этот набор анализируется системой для обнаружения триггеров неоднозначности (географическая или категориальная разрозненность).

RERANKING – Переранжирование (Фильтрация)
После выбора однозначной интерпретации система фильтрует (Filter search results) первоначальный набор результатов, удаляя или значительно понижая те, которые не соответствуют выбранному интенту.

INDEXING – Индексирование и извлечение признаков
Система полагается на данные, извлеченные на этом этапе, в частности, на географические координаты и категории, присвоенные документам/сущностям.

Входные данные:

  • Исходный поисковый запрос.
  • Географическое положение пользователя (IP, GPS, viewport карты).
  • Первичный набор результатов поиска с их метаданными (локация, категория).
  • Журнал исторических запросов и реакций пользователей (Stored Search Queries, Stored Responses).

Выходные данные:

  • Отфильтрованный набор результатов поиска, соответствующий однозначной интерпретации запроса.

На что влияет

  • Специфические запросы: Наибольшее влияние на широкие, короткие или неоднозначные запросы, особенно те, которые имеют географический интент (бренды, топонимы, общие термины с локальным значением).
  • Конкретные ниши или тематики: Критическое влияние на локальный поиск (Local SEO) и картографические сервисы.
  • Географические ограничения: Эффективность механизма напрямую зависит от местоположения пользователя и наличия достаточного объема исторических данных для конкретного региона.

Когда применяется

Алгоритм активируется при обнаружении неоднозначности запроса:

  • Триггеры активации и пороговые значения: Запрос признается неоднозначным, если выполняется хотя бы одно из условий:
    1. Географическое расстояние между двумя или более топовыми результатами превышает предопределенный порог (в тексте упоминается пример 100 миль).
    2. Топовые результаты принадлежат к разным категориям (например, ресторан vs. город).
  • Временные рамки: Анализ исторических данных и генерация гистограмм могут выполняться офлайн. Применение фильтрации к запросу происходит в реальном времени.

Пошаговый алгоритм

Процесс обработки запроса

  1. Получение запроса и контекста: Система получает запрос и данные о географическом положении пользователя.
  2. Первичный поиск: Генерируется исходный набор результатов.
  3. Анализ результатов (Обнаружение неоднозначности): Анализируются локации и категории топовых результатов. Проверяется, превышено ли пороговое расстояние или различны ли категории.
  4. Принятие решения:
    • Если запрос однозначен: Предоставить исходные результаты.
    • Если запрос неоднозначен: Перейти к шагу 5.
  5. Анализ исторических данных: Идентификация похожих запросов (similar search queries) в журнале.
  6. Географическая фильтрация: Фильтрация похожих запросов, оставляя только те, которые были сделаны из того же региона, что и текущий пользователь.
  7. Устранение неоднозначности (Disambiguation): Анализ локализованных данных для выбора лучшей интерпретации:
    • Частотный анализ (Histogram): Определение наиболее частой интерпретации.
    • Анализ удовлетворенности: Расчет dissatisfaction count для каждой интерпретации на основе stored responses (клики, уточнения).
    • Выбор: Выбор интерпретации с наилучшей комбинацией высокой частотности и низкого dissatisfaction count.
  8. Фильтрация результатов: Исходный набор результатов фильтруется в соответствии с выбранной интерпретацией.
  9. Предоставление результатов: Отфильтрованный набор предоставляется пользователю.

Какие данные и как использует

Данные на входе

  • Географические факторы: Местоположение пользователя (IP, GPS, данные сотовых вышек, viewport карты). Используется для фильтрации исторических данных. Адреса/координаты результатов поиска. Используются для обнаружения неоднозначности.
  • Поведенческие факторы (Агрегированные исторические данные):
    • Log of stored search queries: Используется для частотного анализа (гистограммы).
    • Stored responses: Взаимодействия (клики, наведения мыши) и последующие действия (уточняющие запросы). Используются для расчета метрик удовлетворенности.
  • Структурные/Контентные факторы: Категориальная информация (categorical information), связанная с результатами поиска (например, ресторан, город, магазин). Используется для обнаружения категориальной неоднозначности.

Какие метрики используются и как они считаются

  • Geographical Distance Threshold (Порог географического расстояния): Предопределенное значение (например, 100 миль). Сравнение расстояния между результатами с этим порогом определяет географическую неоднозначность.
  • Categorical Diversity (Категориальное разнообразие): Сравнение категорий топовых результатов. Различие категорий определяет категориальную неоднозначность.
  • Search Query Count (Счетчик поисковых запросов): Частотность конкретной интерпретации в локализованном наборе данных (основа гистограммы).
  • Dissatisfaction Count (Счетчик неудовлетворенности): Метрика неуспешности поисковой сессии. Рассчитывается на основе Stored responses. Индикаторы включают: уточнение запроса, быстрый возврат к выдаче (pogo-sticking), отсутствие кликов, прокрутка нескольких страниц. Патент упоминает, что разные типы негативных сигналов могут иметь разный вес (например, уточняющий запрос может иметь вес 1, а быстрый возврат — 0.5).
  • Итоговая оценка интерпретации: Комбинация Search Query Count (позитивный фактор) и Dissatisfaction Count (негативный фактор) для выбора доминирующего интента.

Выводы

  1. Локальный контекст доминирует при неоднозначности: Географическое положение пользователя является решающим фактором для интерпретации неоднозначных запросов. Интент одного и того же запроса может кардинально отличаться в разных регионах.
  2. Автоматическое обнаружение неоднозначности: Система использует четкие триггеры — географическую разрозненность (превышение порога расстояния) и категориальное разнообразие результатов — для активации механизма дисамбигуации.
  3. "Мудрость локальной толпы": Google полагается на агрегированные исторические данные о поведении пользователей в конкретном регионе (гистограммный анализ), чтобы определить наиболее вероятное намерение текущего пользователя.
  4. Удовлетворенность пользователя (User Satisfaction) критична: Система не просто выбирает самую частую интерпретацию, но и учитывает Dissatisfaction Count. Интерпретации, которые исторически лучше удовлетворяли пользователей, получают приоритет.
  5. Приоритет контекста над глобальной релевантностью: Даже если результат очень релевантен запросу глобально, он может быть отфильтрован локально, если система определит, что доминирующий интент в этом регионе иной.

Практика

Best practices (это мы делаем)

  • Максимизация локальных сигналов: Для бизнесов, особенно с неоднозначными названиями, критически важно укреплять связь бренда с конкретной географией и категорией. Используйте Google Business Profile (GBP), локальные ссылки, упоминания с адресом (NAP) и локализованный контент на сайте.
  • Оптимизация под удовлетворенность пользователя (User Satisfaction): Сосредоточьтесь на минимизации сигналов, которые увеличивают Dissatisfaction Count. Контент должен полностью отвечать локальному интенту, предотвращая быстрые возвраты в выдачу (pogo-sticking) или необходимость уточнения запроса.
  • Четкое категориальное позиционирование: Используйте микроразметку (Schema.org) и правильные категории в GBP, чтобы помочь Google точно классифицировать ваш ресурс. Это помогает выиграть при разрешении категориальной неоднозначности.
  • Региональный мониторинг интента: Регулярно анализируйте выдачу по ключевым запросам в разных целевых регионах. Понимание того, как интерпретируется запрос локально, важнее понимания его глобального значения.
  • Использование гео- и категориальных уточнителей во внешнем продвижении: При наращивании ссылок и упоминаний используйте анкоры и контекст, включающие уточняющие слова (например, "ресторан Арарат в Москве" вместо просто "Арарат").

Worst practices (это делать не надо)

  • Игнорирование географического контекста: Разработка единой SEO-стратегии без учета локальных различий в интенте. Попытка ранжироваться по неоднозначному термину с интентом, который не является доминирующим в данном регионе, будет неэффективной.
  • Создание страниц, ведущих к неудовлетворенности: Использование кликбейтных заголовков или контента низкого качества, который не отвечает на запрос пользователя. Это приведет к увеличению Dissatisfaction Count и ослаблению вашей интерпретации запроса в долгосрочной перспективе.
  • Неправильная или неоднозначная категоризация: Выбор слишком широких или неверных категорий может привести к тому, что ваш сайт будет конкурировать с нерелевантными ресурсами и проигрывать при фильтрации выдачи.

Стратегическое значение

Патент подтверждает, что интерпретация запросов в Google является динамичной и высоко контекстуальной. Для SEO это означает переход от анализа ключевых слов к анализу географически обусловленного намерения. Долгосрочная стратегия, особенно в локальном поиске, должна быть направлена на то, чтобы стать доминирующим и наиболее удовлетворительным ответом на запрос в конкретной географической области.

Практические примеры

Сценарий: Разрешение конфликта между брендом и топонимом (Пример из патента)

  1. Ситуация: Пользователь в Сиднее (Австралия) вводит запрос "Coles".
  2. Анализ Google: Система выполняет поиск и видит результаты: "Coles Supermarkets" (Австралия) и "Coles County Illinois" (США). Расстояние огромное, категории разные (Супермаркет vs. Округ). Запрос неоднозначен.
  3. Применение механизма: Система анализирует исторические запросы, содержащие "Coles", отправленные из Сиднея.
  4. Результат анализа: Гистограмма показывает, что 95% запросов связаны с "Coles Supermarkets", и Dissatisfaction Count низкий.
  5. Действие: Система интерпретирует запрос как "Coles Supermarkets" и фильтрует выдачу, удаляя результаты про округ в США.
  6. Вывод для SEO: Если бы вы продвигали сайт округа Коулз в Австралии, эта система активно работала бы против вас, так как локальный интент однозначно связан с супермаркетом.

Вопросы и ответы

Как именно система определяет, что запрос неоднозначен?

Патент определяет два основных автоматических триггера. Первый — географический: если расстояние между локациями топовых результатов превышает заданный порог (например, 100 миль). Второй — категориальный: если топовые результаты принадлежат к разным категориям (например, один результат — это бизнес, а другой — населенный пункт).

Что такое «Счетчик неудовлетворенности» (Dissatisfaction Count) и как он используется?

Это метрика, оценивающая, насколько пользователи были недовольны результатами для определенной интерпретации запроса в прошлом. Она учитывает негативные сигналы: выполнение уточняющего запроса, быстрые клики по разным результатам (pogo-sticking) или скроллинг по нескольким страницам выдачи. Система предпочитает ту интерпретацию запроса, у которой этот счетчик исторически ниже.

Насколько важна геолокация пользователя в этом процессе?

Она критически важна. Местоположение пользователя используется как фильтр для анализа исторических данных. Система смотрит только на то, что искали другие пользователи в этом же географическом регионе. Это позволяет определить локальный доминирующий интент, который может отличаться от глобального.

Что такое анализ гистограммы (Histogram Analysis) в этом контексте?

Это статистический анализ частоты различных более специфичных запросов в истории поиска, привязанных к определенному региону. Например, система подсчитывает, сколько раз пользователи в Кливленде искали "Disney World" по сравнению с "Disneyland", когда вводили общий запрос "Disney". Наиболее частый вариант (с учетом удовлетворенности) выбирается как доминирующая интерпретация.

Может ли менее частая интерпретация выиграть у более частой?

Да, если у более частой интерпретации очень высокий Dissatisfaction Count. Система ищет баланс между частотностью (популярностью) и удовлетворенностью пользователей. Менее частая, но более успешная (с низким уровнем неудовлетворенности) интерпретация может быть предпочтительнее популярной, но некачественной.

Как SEO-специалист может повлиять на интерпретацию запроса в свою пользу?

Ключевая стратегия — стать лучшим ответом в своем регионе и минимизировать сигналы неудовлетворенности (Dissatisfaction Count) для вашего сайта. Также необходимо усилить сигналы, четко определяющие вашу категорию и географическую привязку (Local SEO сигналы), чтобы соответствовать ожиданиям локальной аудитории и укрепить нужную интерпретацию в гистограмме Google.

Применяется ли этот механизм только к локальному поиску?

Хотя основной фокус патента — географические запросы и карты (где используется триггер расстояния), механизм обнаружения неоднозначности через расхождение категорий применим шире. Он может использоваться для выбора доминирующего типа контента или сущности для любого неоднозначного запроса, основываясь на контексте и исторических данных.

Использует ли система персональную историю поиска пользователя?

В данном патенте акцент сделан на анализе агрегированных данных от «множества других пользователей» (plurality of other users) с похожими характеристиками (местоположением). Описанный механизм основан на коллективном поведении в регионе, а не на индивидуальной персонализации.

Происходит ли этот анализ в реальном времени?

Патент предполагает комбинацию. Обнаружение неоднозначности и применение фильтрации происходят в реальном времени при обработке запроса. Однако тяжелая работа по анализу исторических журналов, расчету гистограмм и метрик неудовлетворенности может выполняться офлайн заранее и периодически обновляться.

Какова связь этого патента с Google Картами?

Патент имеет прямое отношение к Картам и локальному поиску. В нем указано, что механизм помогает разрешать неоднозначные запросы, которые приводят к географически удаленным результатам, чтобы корректно отображать нужные объекты на онлайн-карте с высокой степенью детализации (например, на уровне города или района).

Похожие патенты

Как Google определяет географическую релевантность документа, анализируя неоднозначные термины и названия мест
Google использует классификатор местоположений для определения географической привязки документа, даже если в нем нет точного адреса. Система анализирует неоднозначные термины (например, названия районов или улиц) и использует профили георелевантности (гистограммы), показывающие, где эти термины чаще всего используются. Перемножая эти профили, Google разрешает неоднозначность и вычисляет наиболее вероятное местоположение контента.
  • US7716162B2
  • 2010-05-11
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google использует местоположение пользователя для понимания и переписывания неявных запросов о ближайших объектах
Google использует механизм для интерпретации неявных запросов (например, «часы работы» или «меню»), основанный на точном местоположении пользователя. Система определяет ближайшие организации, понимает, к какому типу бизнеса относится запрос, и переписывает его, добавляя название наиболее подходящей организации (например, «меню [Название ресторана]»), используя популярность и рейтинги для выбора лучшего варианта среди конкурентов.
  • US10474671B2
  • 2019-11-12
  • Local SEO

  • Семантика и интент

  • Индексация

Как Google определяет локальный интент и предлагает уточнить запрос до его отправки в поиск
Google использует вероятностную модель, основанную на поведении пользователей, чтобы определить, имеет ли вводимый запрос локальный интент. Если вероятность высока, система предлагает пользователю добавить уточняющую информацию (например, местоположение) ещё до того, как запрос будет отправлен в поисковую систему. Это позволяет сразу формировать более точную и локализованную выдачу.
  • US8484190B1
  • 2013-07-09
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google разбирает локальные запросы на «Что» и «Где» для повышения точности выдачи
Google использует механизм для интерпретации локальных запросов, введенных в одну строку. Система генерирует различные комбинации разделения запроса на тему («Что») и местоположение («Где»), отправляет их в разные базы данных (например, Карты, Локальный поиск) и использует оценки уверенности (Confidence Scores) для выбора наилучшей интерпретации.
  • US7917490B2
  • 2011-03-29
  • Local SEO

  • Семантика и интент

Популярные патенты

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс
Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.
  • US8255386B1
  • 2012-08-28
  • Индексация

  • Поведенческие сигналы

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует контекст пользователя для предоставления информации без явного запроса (Технология предиктивного поиска)
Google использует технологию предиктивного (проактивного) поиска, которая анализирует текущий контекст пользователя (местоположение, время, календарь, скорость движения, привычки) для автоматического предоставления релевантной информации. Система реагирует на «запрос без параметров» (например, открытие приложения или простое действие с устройством) и самостоятельно определяет информационные потребности пользователя.
  • US8478519B2
  • 2013-07-02
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google определяет синонимы и варианты слов, анализируя категории выбранных пользователями результатов
Google использует метод стемминга, основанный на поведении пользователей и категориях сущностей. Если пользователи ищут разные слова (например, «пицца» и «пиццерия») и выбирают результаты одной категории («ресторан»), система идентифицирует эти слова как варианты одной основы (Stem Variants). Это происходит, если слова похожи по написанию ИЛИ если объем кликов статистически значим.
  • US9104759B1
  • 2015-08-11
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google извлекает сущности из активности пользователя для запуска проактивных (имплицитных) поисковых запросов
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.
  • US9009153B2
  • 2015-04-14
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

seohardcore