SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google интерпретирует общие запросы о путешествиях и преобразует их в структурированные данные для вертикального поиска (Google Flights/Hotels)

GENERATING TRAVEL QUERIES IN RESPONSE TO FREE TEXT QUERIES (Генерирование туристических запросов в ответ на запросы в свободной текстовой форме)
  • US9430571B1
  • Google LLC
  • 2012-10-24
  • 2016-08-30
  • Семантика и интент
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует запросы на естественном языке (например, «отпуск в Европе летом»), введенные в основной поиск. Система определяет вероятность туристического интента и предполагает недостающие параметры (отправление, назначение, даты), используя историю пользователя и тренды. Если уверенность высока, запрос структурируется и направляется в специализированный движок (например, Google Flights), минуя стандартный веб-поиск.

Описание

Какую проблему решает

Патент решает проблему обработки неоднозначных или неполных запросов о путешествиях, введенных на естественном языке (Free Text Query) в интерфейс основного поиска (General Search Engine). Специализированные туристические системы требуют структурированных данных (конкретные поля для дат и мест). Изобретение позволяет автоматически интерпретировать общие запросы и выводить недостающие параметры, чтобы предоставить пользователю конкретные варианты бронирования от специализированного движка.

Что запатентовано

Запатентована система и метод для преобразования свободных текстовых запросов в структурированные туристические запросы (Travel Queries). Система анализирует ввод, пытаясь вывести ключевые параметры: пункт отправления, пункт назначения и дату вылета. Для этого активно используются данные о пользователе (User Information) и агрегированные данные о трендах (Popular-Travel Information). Ключевым механизмом является вероятностная оценка: только если система достаточно уверена в интерпретации (Combined Probability превышает порог), запрос направляется в специализированную туристическую поисковую систему (Travel Search Engine).

Как это работает

Система работает как интеллектуальный маршрутизатор между основным и вертикальным поиском:

  • Ввод: Пользователь вводит Free Text Query в General Search Engine.
  • Анализ и Дополнение: Специальные модули (Derivation Modules) анализируют текст. Недостающие параметры предполагаются на основе истории пользователя, его местоположения, социальных связей, а также популярных трендов, событий и погоды.
  • Оценка Уверенности: Для каждого выведенного параметра рассчитывается вероятность. Затем вычисляется Combined Probability.
  • Пороговое Решение: Если Combined Probability превышает установленный порог (Threshold Value), интент считается подтвержденным.
  • Маршрутизация: При высокой уверенности генерируется структурированный Travel Query и отправляется в Travel Search Engine (например, Google Flights). При низкой уверенности запрос обрабатывается стандартным General Search Engine.

Актуальность для SEO

Высокая. Описанный механизм является фундаментальным для стратегии Universal Search, позволяя Google интегрировать свои вертикальные продукты (Google Flights, Hotels) непосредственно в основной поиск. Способность интерпретировать естественный язык (NLP) и использовать контекстные данные (персонализацию и тренды) для преобразования неоднозначных запросов в структурированные действия остается центральной задачей поисковых систем.

Важность для SEO

Патент имеет высокое значение для SEO в туристической нише. Он описывает механизм, с помощью которого Google идентифицирует и перехватывает туристический трафик из основного поиска для своих специализированных сервисов. Это напрямую влияет на видимость сторонних сайтов, особенно информационных и аффилиатных, по общим запросам. Понимание того, как Google использует персонализацию, тренды и типы отдыха для интерпретации запросов, критически важно для адаптации SEO-стратегии.

Детальный разбор

Термины и определения

Combined Probability (Комбинированная вероятность)
Совокупная оценка вероятностей всех выведенных параметров (Origin, Destination, Date). Используется для сравнения с порогом и принятия решения о маршрутизации запроса.
Derivation Modules (Модули вывода/деривации)
Компоненты системы (например, Origin-Location Derivation Module), отвечающие за извлечение или предположение конкретных параметров путешествия из текста и контекстных данных.
Free Text Query (Запрос в свободной текстовой форме)
Запрос на естественном языке, который может не содержать явных ограничений (например, «пляжный отдых в августе»).
General Search Engine (Основная поисковая система)
Стандартный веб-поиск, куда изначально поступает запрос.
Popular-Travel Information (Информация о популярных путешествиях)
Агрегированные данные о трендах: популярные маршруты, даты, продолжительность, типы отдыха (пляж, лыжи и т.д.), события, погода и ориентировочная стоимость.
Threshold Value (Пороговое значение)
Уровень уверенности, который должна превысить Combined Probability, чтобы система активировала Travel Search Engine.
Travel Query (Структурированный туристический запрос)
Запрос, сгенерированный системой, который явно определяет пункт отправления, назначения и дату вылета. Формат, необходимый для Travel Search Engine.
Travel Search Engine (Туристическая поисковая система)
Специализированная вертикальная поисковая система (например, Google Flights/Hotels), отличная от General Search Engine.
User Information (Информация о пользователе)
Персонализированные данные: местоположение, история прошлых поездок (маршруты, даты, расходы, типы отдыха), предпочтения, а также информация о контактах пользователя и их местоположении (из социальных сетей).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает ядро изобретения — процесс принятия решений о маршрутизации запроса на основе вероятностной оценки.

  1. Система получает Free Text Query через интерфейс General Search Engine.
  2. Система выводит (derives) термины, соответствующие туристическим ограничениям (Origin, Destination, Departure Date), и присваивает каждому соответствующую вероятность (probability).
  3. Система определяет, превышает ли Combined Probability этих терминов пороговое значение (Threshold Value).
  4. Если ДА (порог превышен):
    • Генерируется структурированный Travel Query, явно определяющий выведенные ограничения.
    • Запрос отправляется в Travel Search Engine (отдельный от основного поиска).
  5. Если НЕТ (порог не превышен):
    • General Search Engine обрабатывает исходный запрос без использования Travel Search Engine.

Ядром изобретения является использование вероятностной модели и порога уверенности для определения того, следует ли активировать специализированный вертикальный поиск или остаться в рамках общего веб-поиска.

Claims 5, 6, 7, 9 (Зависимые): Детализируют работу модулей вывода (Derivation Modules).

Утверждается, что вывод пункта отправления (5), назначения (6), даты вылета (7) и даты возвращения (9) основывается на комбинации трех источников: исходного текста запроса, User Information и Popular-Travel Information.

Claims 15-18 (Зависимые): Раскрывают состав User Information.

Включает предпочтения, местоположение, детальную историю прошлых поездок (маршруты, даты, расходы, типы направлений (Destination Types), такие как пляж, лыжи, горы, национальные парки, романтические направления), а также контакты пользователя и их местоположение, полученные из социальных сетей (Claim 18).

Claims 19-24 (Зависимые): Раскрывают состав Popular-Travel Information.

Включает популярные маршруты и даты, ориентировочную стоимость, популярные типы направлений, информацию о событиях и их локациях (из онлайн-баз данных, Claim 23), а также погодные условия в пунктах назначения (Claim 24).

Где и как применяется

Изобретение применяется на ранних этапах обработки запроса для определения его типа и маршрутизации.

QUNDERSTANDING – Понимание Запросов
Это основная фаза применения. Система анализирует Free Text Query в реальном времени для классификации интента и извлечения/вывода сущностей (локаций, дат). Процесс включает переписывание запроса (Query Rewriting) из неструктурированного в структурированный формат, используя обширные контекстные данные (персональные и общие тренды) для разрешения неоднозначностей. Здесь рассчитывается Combined Probability.

METASEARCH – Метапоиск и Смешивание (Triggering)
На этом этапе система действует как триггер для вертикального поиска. На основе Combined Probability принимается решение, следует ли задействовать Travel Search Engine вместо или параллельно с General Search Engine.

Входные данные:

  • Free Text Query пользователя.
  • User Information (история путешествий, локация, социальный граф, предпочтения).
  • Popular-Travel Information (тренды, цены, события, погода).

Выходные данные:

  • Структурированный Travel Query (если порог превышен).
  • ИЛИ: Сигнал для General Search Engine обработать запрос стандартно (если порог не превышен).

На что влияет

  • Конкретные ниши или тематики: Критическое влияние исключительно на нишу путешествий (Travel).
  • Специфические запросы: Наибольшее влияние на неоднозначные (ambiguous) и недостаточно определенные (underspecified) запросы на естественном языке (например, «зимний отпуск», «поездка на пляж», «куда поехать в октябре»).
  • Типы контента: Усиливает позиции структурированного контента (листинги билетов/отелей) и может снижать видимость информационного контента (блоги, обзоры), если система решает, что пользователь готов бронировать.

Когда применяется

  • Триггеры активации: Алгоритм активируется при получении любого Free Text Query в интерфейсе основного поиска для оценки туристического интента.
  • Условия применения: Travel Search Engine используется только тогда, когда система может вывести минимальный набор параметров (Origin, Destination, Date) и когда Combined Probability превышает установленный Threshold Value.
  • Исключения: Если запрос слишком сложный, новый или данных о пользователе недостаточно для уверенной интерпретации, порог не достигается, и запрос обрабатывается как стандартный веб-поиск.

Пошаговый алгоритм

Процесс обработки запроса и принятия решения:

  1. Получение запроса: Система получает Free Text Query через интерфейс General Search Engine.
  2. Инициализация модулей вывода: Активируются Derivation Modules (Origin, Destination, Departure/Return Date).
  3. Сбор контекстных данных: Модули получают доступ к User Information и Popular-Travel Information.
  4. Генерация кандидатов (Параллельно): Каждый модуль генерирует список кандидатов:
    • Парсинг текста запроса на наличие явных указаний.
    • Анализ истории пользователя (например, прошлые пункты отправления, предпочтения по типам отдыха).
    • Анализ популярных трендов (например, популярные направления из региона пользователя, события, погода).
  5. Расчет вероятностей (Probability Function): Для каждого кандидата рассчитывается вероятность (Probability Value).

    Детали: Вероятность зависит от источника (текст запроса имеет высокий вес), соответствия истории пользователя, общей популярности, а также дополнительных факторов (стоимость).

  6. Выбор параметров: Каждый модуль выбирает наиболее вероятного(ых) кандидата(ов).
  7. Расчет общей уверенности: Система вычисляет Combined Probability, агрегируя вероятности выбранных параметров.
  8. Проверка порога (Threshold Check): Combined Probability сравнивается с Threshold Value.
  9. Маршрутизация и Вывод:
    • Если порог превышен: Генерируется структурированный Travel Query и отправляется в Travel Search Engine.
    • Если порог не превышен: Запрос обрабатывается стандартно в General Search Engine.
  10. (Опционально) Корректировка: Система может предоставить интерфейс с предзаполненными полями для подтверждения или изменения пользователем.

Какие данные и как использует

Данные на входе

Система использует три основных источника данных, детально описанных в патенте:

1. Free Text Query:

  • Контентные факторы: Термины, указывающие на локации, даты (абсолютные, относительные, праздники), продолжительность, типы отдыха.

2. User Information (Персонализированные данные - Claims 15-18):

  • Географические факторы: Текущее местоположение пользователя (для вывода пункта отправления).
  • Поведенческие факторы (История): Прошлые пункты отправления и назначения (например, города с аэропортами), даты поездок, продолжительность.
  • Финансовые данные: Прошлые расходы на поездки (past user travel cost).
  • Предпочтения: Типы прошлых направлений (Past user destination types) – пляж, лыжи, горы, национальные парки, романтические места.
  • Социальные факторы: Информация о контактах пользователя и их местоположении (полученная из социальных сетей).

3. Popular-Travel Information (Общие данные и тренды - Claims 19-24):

  • Тренды: Популярные маршруты, даты и продолжительность пребывания (в целом или для пользователей со схожими характеристиками).
  • Типология: Популярные типы направлений (Popular destination types).
  • Экономические факторы: Предполагаемая стоимость поездок (Estimated travel cost).
  • Временные/Внешние факторы: Базы данных событий и их локации; данные о погоде (weather conditions) в пунктах назначения на разные даты.

Какие метрики используются и как они считаются

  • Probability Function (Функция вероятности): Используется для расчета Probability Value для каждого кандидата на параметр. Учитывает вес источника (текст запроса, история пользователя, популярность) и дополнительные факторы (стоимость, погода).
  • Combined Probability: Агрегированная метрика уверенности для всего набора выведенных параметров.
  • Threshold Value: Порог уверенности для активации вертикального поиска.
  • Критерии фильтрации локаций (Claims 20, 21):
    • Predetermined Maximum Distance: Максимальное расстояние от пользователя для пунктов отправления.
    • Predetermined Minimum Distance: Минимальное расстояние от пользователя для пунктов назначения.
    • (Расстояние может измеряться во времени, стоимости или дистанции).

Выводы

  1. Вероятностная интерпретация интента и Триггеринг: Ключевым механизмом является не просто распознавание ключевых слов, а использование вероятностной модели (Combined Probability) и порога уверенности для принятия решения о маршрутизации запроса. Это определяет, увидит ли пользователь веб-результаты или блоки вертикального поиска (Google Flights/Hotels).
  2. Гиперперсонализация для разрешения неоднозначности: Google активно использует глубокие данные о пользователе (User Information), включая историю поездок, расходы, предпочтения и даже социальные связи, чтобы заполнить пробелы в неоднозначных запросах. Выдача по общим запросам сильно персонализирована.
  3. Тренды и внешние данные как основа для предположений: При недостатке персональных данных система опирается на Popular-Travel Information («мудрость толпы»), учитывая не только популярные маршруты, но и внешние факторы, такие как события, стоимость и погоду.
  4. Агрессивное преобразование интента: Патент демонстрирует, как Google пытается сместить пользователя от информационного интента (исследование) к транзакционному (бронирование), автоматически преобразуя общие фразы в конкретные предложения.
  5. Критичность типизации контента (Destination Types): Система активно использует классификацию по типам отдыха (пляж, лыжи и т.д.). Это подчеркивает важность четкого позиционирования контента в туристической нише для соответствия предпочтениям пользователя и трендам.

Практика

Best practices (это мы делаем)

Рекомендации применимы для сайтов в туристической нише (OTA, авиакомпании, отели, агрегаторы, информационные ресурсы).

  • Оптимизация под типы направлений (Destination Types): Четко позиционируйте свой контент и предложения под категории, упомянутые в патенте (пляж, лыжи, романтика, национальные парки). Это помогает системе сопоставить ваше предложение с предпочтениями пользователя или популярными трендами при обработке общих запросов (например, «романтический отпуск»).
  • Обеспечение полноты данных для вертикального поиска (для OTA/Поставщиков): Критически важно передавать точные данные о ценах, доступности и маршрутах в Google Flights/Hotels. Поскольку система направляет структурированные запросы туда, ваша видимость зависит от присутствия в этой базе данных.
  • Оптимизация под тренды и события (Popular-Travel Information): Отслеживайте и адаптируйте предложения под популярные направления, даты и события. Система предпочитает популярные варианты и использует данные о событиях для вывода направлений и дат.
  • Для информационных сайтов – фокус на сложных запросах: Сосредоточьтесь на создании экспертного контента для сложных, сравнительных или многоэтапных запросов (например, планирование сложных маршрутов, нишевые сравнения). В этих случаях Combined Probability вряд ли достигнет порога, и будет активирован органический поиск (General Search Engine).

Worst practices (это делать не надо)

  • Игнорирование вертикального поиска Google: Фокусироваться только на органическом ранжировании в General Search Engine рискованно. Google активно перехватывает трафик с туристическим интентом и направляет его в свои специализированные продукты.
  • Нечеткое позиционирование контента: Создание общих страниц о направлениях без акцента на конкретные типы отдыха (например, просто «Отдых в Италии») снижает релевантность для системы, которая ищет соответствие определенным Destination Types.
  • Игнорирование контекста и персонализации: Оптимизация только под ключевые слова без учета предпочтений пользователя и популярных трендов неэффективна, так как система активно использует эти внешние и персональные сигналы для формирования Travel Query.

Стратегическое значение

Патент демонстрирует механизм, с помощью которого Google стремится стать основным инструментом планирования путешествий, перехватывая пользователей на ранних стадиях поиска и превращая исследование в бронирование. Для сторонних игроков рынка это означает усиление конкуренции с самим Google. Стратегия должна включать двойной подход: максимальную оптимизацию присутствия внутри вертикальных сервисов Google (Flights/Hotels) и фокусировку на контенте для органического поиска, который система не может легко классифицировать с высокой уверенностью.

Практические примеры

Сценарий 1: Интерпретация общего запроса с использованием персонализации и трендов

  1. Пользователь: Находится в Лондоне, ранее часто летал на пляжные курорты Испании (User Information).
  2. Исходный запрос (Free Text Query): «Пляжный отпуск в августе» (введен в General Search Engine).
  3. Анализ и Вывод:
    • Origin: Система предполагает Лондон (на основе местоположения пользователя).
    • Destination: Система анализирует предпочтение Испании (тип «пляж») и Popular-Travel Information (популярные пляжные направления из Лондона в августе). Выбирается Малага (AGP) как высоковероятный кандидат.
    • Date: Система выбирает популярные даты в августе.
  4. Принятие решения: Combined Probability высока. Порог превышен.
  5. Результат: Система генерирует структурированный запрос «Рейс Лондон в Малагу, [Даты августа]» и отправляет его в Google Flights. Пользователю отображаются результаты авиабилетов, а не статьи о пляжном отдыхе.

Сценарий 2: Обработка сложного запроса (Органический приоритет)

  1. Исходный запрос (Free Text Query): «Сравнение сафари в Кении и Танзании в сезон дождей».
  2. Анализ: Система идентифицирует локации и примерное время, но интент сложный (сравнение, специфический сезон).
  3. Вывод параметров: Системе сложно вывести конкретные даты и пункты бронирования, удовлетворяющие запросу на сравнение.
  4. Результат: Combined Probability ниже порога. Система обрабатывает запрос через General Search Engine. В выдаче приоритет получают экспертные статьи и блоги, сравнивающие эти варианты.

Вопросы и ответы

Что такое «Combined Probability» и почему это важно для SEO?

Это совокупная оценка уверенности системы в том, что запрос является туристическим и что она правильно определила его параметры (откуда, куда, когда). Это важно, потому что это триггер: если оценка превышает порог, Google покажет результаты вертикального поиска (Google Flights/Hotels); если нет — стандартные веб-результаты. Это напрямую определяет, где вы будете конкурировать за пользователя — в органической выдаче или в специализированных блоках.

Как система определяет пункт отправления, если он не указан в запросе?

Система использует иерархию данных. В первую очередь проверяется текущее местоположение пользователя и его история прошлых вылетов (User Information). Также учитываются популярные пункты отправления в регионе пользователя (Popular-Travel Information). Система может также применять фильтры расстояния (Claim 20), выбирая аэропорты в пределах приемлемой близости.

Насколько сильно персонализация влияет на интерпретацию запроса?

Влияние очень велико. Патент детально описывает использование истории путешествий, предпочтений по типам отдыха (пляж, лыжи), прошлых расходов и даже местоположения контактов пользователя из социальных сетей (Claim 18). Два пользователя, вводящие один и тот же общий запрос, с высокой вероятностью получат разные интерпретации и, следовательно, разные результаты.

Что такое «Popular-Travel Information» и как Google ее собирает?

Это агрегированные данные о поведении большого числа пользователей (тренды). Они включают популярные маршруты, даты, типы отдыха, а также внешние данные о событиях (Claim 23), погоде (Claim 24) и ценах. Google собирает их путем анализа логов поисковых запросов, данных из своих сервисов (Flights, Trends) и внешних источников (например, базы данных событий).

Как этот патент влияет на SEO для туристических блогов или информационных сайтов?

Влияние скорее негативное для общих запросов, так как система пытается перевести интент в бронирование. Однако это открывает возможности для фокусировки на сложных, сравнительных или узкоспециализированных запросах, где система не сможет достичь высокого порога уверенности (Combined Probability) и покажет органическую выдачу.

Как этот патент влияет на SEO для OTA (Online Travel Agencies) и авиакомпаний?

Это подчеркивает критическую важность интеграции с продуктами Google Travel (Flights/Hotels). Поскольку система направляет структурированные запросы именно туда, видимость в этих блоках становится приоритетом. Стратегия должна фокусироваться не только на ранжировании веб-страниц, но и на оптимизации данных (цены, доступность), передаваемых в Travel Search Engine.

Использует ли Google данные из социальных сетей для интерпретации запросов?

Да, согласно патенту (Claim 18), система может получать информацию о контактах пользователя и их местоположении из одной или нескольких социальных сетей. Это используется как один из сигналов для определения потенциального пункта назначения (например, если пользователь планирует поездку к другу).

Учитывает ли система погоду и стоимость при интерпретации запросов?

Да, явно указано (Claims 19, 24). Система использует данные о погодных условиях в пунктах назначения и ориентировочную стоимость поездок. Это помогает фильтровать нерелевантные варианты, например, избегать предложений направлений с плохой погодой или выбирать более доступные по цене варианты.

Что происходит, если система неправильно интерпретирует запрос?

Механизм вероятностного порога предназначен для минимизации ложных срабатываний. Если система не уверена, она покажет стандартные результаты. Кроме того, патент (Claim 28 в описании системы, хотя неявно в методе) упоминает возможность показать пользователю интерфейс с предварительно заполненными параметрами, позволяя ему скорректировать их перед финальным поиском.

Может ли система сгенерировать несколько туристических запросов из одного ввода?

Да. В патенте указано, что модули вывода могут определить более одного кандидата для каждого параметра (например, два возможных пункта назначения или диапазон дат). В этом случае система может сгенерировать несколько структурированных Travel Queries, комбинируя различные варианты параметров с наивысшими вероятностями.

Похожие патенты

Как Google оптимизирует получение свежих данных от партнеров (например, отелей или авиакомпаний) в условиях ограниченной пропускной способности API
Патент описывает инфраструктурный механизм Google для планирования запросов к партнерским системам (например, сайтам бронирования). Система рассчитывает «Ценность» (Utility Value) для каждого запроса на основе его популярности у пользователей и частоты обновления данных. Это позволяет Google запрашивать самые важные данные, не перегружая каналы партнеров.
  • US10410270B2
  • 2019-09-10
  • Свежесть контента

Как Google переписывает неявные запросы, определяя сущность по местоположению пользователя и истории поиска
Google использует местоположение пользователя для интерпретации запросов, которые явно не упоминают конкретную сущность (например, [часы работы] или [отзывы]). Система идентифицирует ближайшие объекты, анализирует исторические паттерны запросов для этих объектов и переписывает исходный запрос, добавляя в него название наиболее вероятной сущности.
  • US20170277702A1
  • 2017-09-28
  • Семантика и интент

  • Local SEO

  • Персонализация

Как Google предугадывает ваш следующий запрос и заранее показывает его результаты в текущей выдаче
Google анализирует агрегированную историю поисковых сессий, чтобы предсказать, какой запрос пользователь введет следующим. Система может выполнить этот предполагаемый запрос (Inferred Action) заранее и встроить его результаты непосредственно в текущую страницу выдачи. Этот механизм часто активируется при показе персональных данных или Панелей знаний и учитывает контекст (время, сезон) и интересы пользователя.
  • US20170116284A1
  • 2017-04-27
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует интерактивные шаблоны в подсказках для формирования структурированных запросов
Google может заменять стандартные поисковые подсказки интерактивными шаблонами, когда распознает намерение пользователя выполнить конкретную задачу (например, конвертацию величин, перевод, поиск авиабилетов). Эти шаблоны содержат редактируемые поля (выпадающие списки, поля ввода), позволяя пользователю сформировать точный структурированный запрос прямо в строке поиска перед отправкой.
  • US9158860B2
  • 2015-10-13
  • Семантика и интент

Как Google обобщает расписания общественного транспорта для создания кратких сводок (например, "Пн-Пт, 9:00-17:00")
Патент описывает алгоритм для анализа расписаний общественного транспорта в Google Maps/Transit. Система вычисляет "функцию стоимости" поездки (включая время ожидания), определяет временные окна качественного обслуживания и затем математически находит наиболее компактное и информативное обобщение этих окон, максимизируя общее время покрытия.
  • US20150170229A1
  • 2015-06-18
  • Local SEO

Популярные патенты

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует консенсус источников для выбора и валидации фактов в Knowledge Graph и прямых ответах
Система Google для выбора наилучшего ответа на фактические запросы. Она оценивает потенциальные ответы из разных источников и вычисляет «Оценку Поддержки» (Supported Score) на основе их согласованности. Факт отображается, только если он значительно превосходит противоречащие и несвязанные данные, обеспечивая высокую точность ответа.
  • US7953720B1
  • 2011-05-31
  • Knowledge Graph

  • EEAT и качество

  • Семантика и интент

Как Google использует данные о совместном посещении сайтов (Co-Visitation) для персонализации и повышения релевантности выдачи
Google использует поведенческие данные сообщества пользователей для определения тематической связи между сайтами. Если пользователи часто посещают Сайт А и Сайт Б в течение короткого промежутка времени (Co-Visitation), система создает "Вектор повышения" (Boost Vector). Этот вектор используется для повышения в выдаче тематически связанных сайтов, основываясь на истории посещений пользователя или контексте текущего сайта, улучшая персонализацию и релевантность.
  • US8874570B1
  • 2014-10-28
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google использует социальный граф и активность друзей для персонализации и переранжирования результатов поиска
Google использует данные из социального графа пользователя и активность его контактов (лайки, шеры, комментарии, плейлисты) для изменения ранжирования результатов поиска. Контент, одобренный социальным окружением, повышается в выдаче и сопровождается аннотациями, объясняющими причину повышения и указывающими на свежесть социального действия.
  • US8959083B1
  • 2015-02-17
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

seohardcore