SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google индексирует, ранжирует и структурирует события по времени и местоположению, обеспечивая темпоральное разнообразие

EVENT SEARCHING (Поиск событий)
  • US7647353B2
  • Google LLC
  • 2006-11-14
  • 2010-01-12
  • Индексация
  • Краулинг
  • Local SEO
  • Свежесть контента
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Патент Google, описывающий систему поиска событий, которая фильтрует результаты по времени и месту. Система разделяет запрошенный временной интервал (например, неделю) на сегменты (например, дни) и ранжирует лучшие события отдельно для каждого сегмента. Это предотвращает доминирование популярных событий одного дня и гарантирует видимость релевантных результатов на протяжении всего интервала.

Описание

Какую проблему решает

Патент решает проблему неэффективности традиционного поиска применительно к событиям, ограниченным по времени и месту. Традиционный поиск может путать сущности (например, группу "Chicago" и город Чикаго). Главная проблема — доминирование в выдаче наиболее популярных событий, сконцентрированных в одном временном слоте (например, в субботу вечером), что скрывает менее популярные, но релевантные события в другое время (например, в среду днем). Изобретение обеспечивает темпоральное разнообразие (Temporal Diversity) результатов поиска по всему заданному интервалу.

Что запатентовано

Запатентована система поиска событий, которая обрабатывает запрос, включающий временной интервал, местоположение и ключевые слова. Суть изобретения заключается в механизме разделения (partitioning) временного интервала на более мелкие сегменты (Partitions) на основе временного шага (Time Increment). Релевантность событий оценивается независимо внутри каждого сегмента, и для каждого из них отображается заданное количество лучших результатов.

Как это работает

Система работает в несколько этапов:

  • Индексирование: Специализированный краулер (Event Tool) находит события (включая веб-страницы, RSS, календари) и извлекает три ключевых элемента: Time Information, Place Information и Content.
  • Обработка запроса: Запрос анализируется на наличие временного интервала, местоположения и поисковых терминов.
  • Партиционирование: Временной интервал делится на разделы (например, дни или часы).
  • Локализация и Ассоциация: События фильтруются по месту и ассоциируются с соответствующим временным разделом.
  • Партиционное Ранжирование: Для каждого раздела система определяет релевантность событий на основе поисковых терминов.
  • Отображение: Отображается Топ-N наиболее релевантных событий для каждого раздела, часто в формате календаря.

Актуальность для SEO

Высокая. Этот патент описывает фундаментальные принципы, лежащие в основе вертикального поиска событий Google, отображения блоков событий (Event Packs) в SERP и функций поиска в Google Calendar. Механизмы извлечения структурированной информации о времени и месте и обеспечение темпорального разнообразия являются стандартом в современном поиске событий.

Важность для SEO

Патент имеет высокое значение (8/10) для сайтов, публикующих информацию о мероприятиях, конференциях, локальных бизнесах и расписаниях. Он демонстрирует, что Google обрабатывает время и место как жесткие фильтры до оценки контента. Механизм партиционного ранжирования создает возможности для ранжирования даже менее популярных событий, если они являются наиболее релевантными в своем конкретном временном слоте (например, в менее конкурентный день недели).

Детальный разбор

Термины и определения

Event (Событие)
Мероприятие, происходящее в определенное время и в определенном месте. Индексируется как набор данных: Time Information, Place Information и Content.
Event Tool (Инструмент обработки событий)
Компонент системы, отвечающий за обнаружение и индексирование событий. Может функционировать как краулер (event crawler), обрабатывать синдицированные фиды (например, RSS) или импортировать данные из календарей.
Partition (Раздел / Сегмент)
Часть временного интервала, полученная в результате его разделения на основе Time Increment. Ранжирование происходит независимо внутри каждого раздела.
Place Information / Place Component
Данные, описывающие местоположение события (географическое, адрес, название локации или даже IP/URL для онлайн-событий) или местоположение, указанное в запросе.
Query Generator Tool (Генератор запросов)
Компонент, автоматически генерирующий запросы для пользователя (например, функция "I'm Feeling Bored"), основываясь на его местоположении, истории поиска или популярных запросах.
Relevancy Tool (Инструмент определения релевантности)
Компонент, определяющий меру релевантности (measure of relevance) события по отношению к поисковому компоненту запроса.
Search Component / Content
Поисковые термины в запросе или описание сути события в базе данных.
Time Increment (Временной шаг)
Единица времени (например, час, день, неделя), используемая для разделения временного интервала на разделы (Partitions).
Time Information / Time Component
Данные, описывающие время события (начало, конец) или временные параметры запроса (интервал, шаг).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод поиска событий.

  1. Выбор запроса, включающего компонент времени (интервал), компонент места и поисковый компонент (ключевые слова).
  2. Определение временного шага (time increment).
  3. Разделение (partitioning) временного интервала на разделы (partitions) на основе этого шага.
  4. Для каждого раздела: определение меры релевантности для событий, которые происходят в этом разделе И имеют предопределенное отношение к указанному месту (например, географическую близость), на основе ключевых слов.
  5. Отображение предопределенного количества релевантных событий.

Ядро изобретения — это процесс ранжирования, который выполняется независимо для каждого временного раздела. Это гарантирует, что результаты будут распределены по времени (темпоральное разнообразие), а не сгруппированы вокруг самых популярных событий интервала.

Claim 18 (Зависимый от 1): Детализирует иерархическое разделение.

  1. Разделение каждого раздела (partition) на подразделы (sub-partitions) на основе второго временного шага.
  2. Определение релевантности событий внутри каждого подраздела.

Это позволяет реализовать многоуровневую детализацию, например, разбить неделю на дни (первый шаг), а затем день на часы (второй шаг).

Claim 54 (Независимый пункт): Описывает метод, применяемый к событиям, связанным с календарем.

Он повторяет логику Claim 1 (разделение интервала, определение релевантности по времени, месту и поисковым терминам), но в контексте коллекции событий из календаря (пользовательского или публичного).

Где и как применяется

Изобретение охватывает все этапы архитектуры поиска в рамках специализированной вертикали событий.

CRAWLING – Сканирование и Сбор данных
Event Tool действует как специализированный краулер. Он сканирует сеть в поисках электронных документов, описывающих события. Он также активно принимает данные из синдицированных фидов (явно упомянуты RSS) и пользовательских календарей.

INDEXING – Индексирование и извлечение признаков
Происходит ключевое извлечение и структурирование данных. Система идентифицирует и записывает три ключевых признака для каждого события: Time Information, Place Information и Content. Патент подчеркивает использование структурированных языков (например, XML) для облегчения этого процесса. Также происходит иерархическое распознавание мест (например, понимание, что конкретное здание находится в определенном городе).

QUNDERSTANDING – Понимание Запросов
Система анализирует запрос и разделяет его на Time Component, Place Component и Search Component. Если компоненты отсутствуют, система может подставить значения по умолчанию (например, текущее местоположение пользователя). Также здесь работает Query Generator Tool.

RANKING – Ранжирование (Вертикальное)
Основное применение алгоритма. Используется партиционное ранжирование (Partitioned Ranking):

  1. Определяются временные разделы (partitions).
  2. События фильтруются по месту (localized collection).
  3. Внутри каждого раздела Relevancy Tool вычисляет меру релевантности на основе Search Component.
  4. Отбирается Топ-N событий для каждого раздела.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Результаты вертикального поиска событий затем могут быть смешаны с основной веб-выдачей (например, в виде блока Event Pack) или отображены в специализированном интерфейсе. Display Tool отвечает за форматирование вывода (список, день, неделя, месяц).

На что влияет

  • Конкретные типы контента: Влияет исключительно на контент, который может быть идентифицирован как событие (концерты, семинары, встречи, локальные мероприятия, вебинары).
  • Специфические запросы: Запросы с явным или неявным временным и локальным интентом (например, "что делать в Москве на выходных", "концерты джаза в этом месяце").
  • Форматы контента: Повышает значимость контента, представленного в структурированных форматах (XML, RSS, iCalendar, микроразметка Schema.org/Event), так как это упрощает извлечение точных данных о времени и месте.

Когда применяется

  • Триггеры активации: Активируется, когда система идентифицирует интент пользователя как поиск событий в определенном временном интервале и/или месте.
  • Условия работы: Применяется для структурирования отображения результатов, когда в запросе указан временной интервал, который может быть разделен на более мелкие инкременты (например, поиск на неделю с отображением по дням).

Пошаговый алгоритм

Процесс А: Индексирование событий (Фоновый процесс)

  1. Идентификация описания события: Event Tool получает описание из краулера, RSS-фида или календаря.
  2. Извлечение данных: Система идентифицирует Time Information, Place Information и Content из описания (используя структуру документа, например XML-теги, или анализ текста).
  3. Запись данных: Структурированная информация о событии сохраняется в базе данных событий (Event Data).
  4. (Опционально) Сравнение с сохраненными запросами: Новое событие сравнивается с предопределенными запросами пользователей для генерации уведомлений.

Процесс Б: Обработка поискового запроса (Реальное время)

  1. Получение запроса: Система получает запрос (от пользователя или сгенерированный автоматически).
  2. Партиционирование временного интервала: Определяется временной интервал и временной шаг (Time Increment). Интервал разбивается на разделы (partitions).
  3. Локализация событий: Из базы данных отбираются события, происходящие в месте, указанном в Place Component (localized collection).
  4. Ассоциация с разделами: Локализованные события ассоциируются с соответствующими временными разделами (например, по времени начала).
  5. Итерация по разделам: Система последовательно выбирает каждый раздел.
  6. Определение релевантности: Для событий в выбранном разделе Relevancy Tool вычисляет релевантность на основе Search Component запроса.
  7. Отбор событий: Выбирается предопределенное количество (Топ-N) наиболее релевантных событий для данного раздела.
  8. Отображение результатов: Display Tool форматирует и отображает отобранные события, сгруппированные по разделам.

Какие данные и как использует

Данные на входе

Система использует строго структурированные данные для работы алгоритма.

  • Контентные факторы: Content события (описание, название, организатор, тип события). Используется для определения релевантности поисковому компоненту запроса.
  • Временные факторы: Time Information (время начала, окончания, продолжительность). Критически важно для ассоциации события с временным разделом.
  • Географические факторы: Place Information (адрес, координаты, название места). Используется для локализации коллекции событий. Упоминается иерархическое распознавание мест. Патент также указывает, что местом может быть URL или IP-адрес для онлайн-событий.
  • Структурные факторы: Патент подчеркивает важность структурированных данных (XML, RSS, календари) для точного извлечения времени и места.
  • Пользовательские факторы: User Data (местоположение пользователя по IP или настройкам профиля, история запросов). Используется для подстановки значений по умолчанию в запрос или для автоматической генерации запросов (Query Generator Tool).

Какие метрики используются и как они считаются

  • Measure of Relevance (Мера релевантности): Числовая оценка, определяющая соответствие Content события и Search Component запроса. Рассчитывается независимо для событий внутри каждого временного раздела.
  • Geographical Proximity (Географическая близость): Метрика для определения, находится ли место события в "предопределенном отношении" к месту, указанному в запросе.
  • Time Increment (Временной шаг): Параметр, определяющий размер временных разделов (час, день, неделя и т.д.). Может быть указан в запросе или определен системой.

Выводы

  1. Фундамент вертикального поиска событий: Патент описывает специализированную систему, отличную от стандартного веб-поиска. Она требует точного извлечения сущностей времени и места (Time Information и Place Information).
  2. Критичность структурированных данных: Система предпочитает структурированные источники (в патенте упомянуты XML, RSS, календари). Это прямой предшественник современных требований к разметке Schema.org/Event.
  3. Партиционное ранжирование и Темпоральное разнообразие: Ключевая инновация — разбиение временного интервала и независимое ранжирование внутри каждого раздела. Это предотвращает доминирование популярных событий и обеспечивает хронологическое разнообразие. Событие конкурирует только с другими событиями в том же временном слоте.
  4. Время и Место как жесткие фильтры: Время и место используются как ограничения (constraints) на этапе отбора кандидатов (локализация и ассоциация с разделом), а не просто как сигналы ранжирования. Релевантность контента оценивается только для прошедших фильтрацию событий.
  5. Иерархическое понимание локаций: Система разработана для понимания вложенности локаций (город > район > конкретное место), что критично для локального поиска.

Практика

Best practices (это мы делаем)

  • Внедрение и валидация разметки Event Schema: Это критически важно. Необходимо тщательно размечать все события, уделяя особое внимание полям startDate, endDate и location. Точность этих данных напрямую влияет на фильтрацию и сегментацию.
  • Использование структурированных фидов (RSS/iCalendar): Публикуйте события через синдицированные фиды. Патент явно указывает эти источники как надежные для Event Tool.
  • Оптимизация контента события (Content): Описание события должно быть релевантным запросам (Search Component). Поскольку ранжирование происходит внутри временных разделов, релевантность контента является ключевым фактором для попадания в Топ-N для этого дня/часа.
  • Стратегическое планирование времени: При продвижении серии мероприятий рассмотрите возможность их проведения в менее конкурентные временные слоты (например, будние дни). Благодаря механизму партиционирования, это может повысить видимость события, так как конкуренция внутри этого слота будет ниже.
  • Локальная оптимизация (Place Information): Убедитесь, что место проведения корректно распознается системой. Используйте официальные названия мест и полные адреса, чтобы система могла установить иерархическую связь (например, что конкретный клуб находится в определенном городе).

Worst practices (это делать не надо)

  • Публикация времени и места в изображениях или неструктурированном тексте: Это затрудняет для Event Tool точное извлечение данных, что может привести к игнорированию события системой.
  • Неоднозначное указание времени: Использование относительных дат ("в следующую пятницу") без указания точной даты и часового пояса в разметке может привести к ошибкам в партиционировании.
  • Игнорирование структурированных данных: Полагаться только на текстовое описание без использования Schema.org или фидов значительно снижает вероятность того, что событие будет корректно обработано этой специализированной системой.
  • Манипуляции с местоположением: Попытки указать неверное местоположение для охвата большей аудитории неэффективны, так как система строго фильтрует события по Place Information.

Стратегическое значение

Патент подтверждает важность вертикального поиска и структурированных данных для Google. Он показывает, что для событий Google использует специализированные методы индексирования и ранжирования. Для SEO-специалистов это означает, что оптимизация под события требует особого подхода, сфокусированного на технической точности передачи данных (Schema, фиды) и локальной привязке. Понимание механизма партиционного ранжирования помогает оценить конкурентную среду не в целом по нише, а в конкретные дни или часы.

Практические примеры

Сценарий: Оптимизация афиши кинотеатра на неделю

  1. Задача: Кинотеатр хочет, чтобы все его сеансы были видны при поиске «фильмы на этой неделе [город]».
  2. Анализ (на основе патента): Запрос имеет Time Interval (неделя) и Place Component (город). Система выберет Time Increment = 1 день. Неделя будет разбита на 7 разделов.
  3. Действия: Необходимо убедиться, что Google индексирует каждый сеанс как отдельное событие с точным Time Information и Place Information. Для этого используется разметка Schema.org/Event для каждого сеанса на веб-сайте и/или передача данных через фид.
  4. Как работает система: Google фильтрует события по городу. Затем для каждого дня (раздела) он определяет релевантность сеансов запросу «фильмы».
  5. Ожидаемый результат: Благодаря механизму партиционирования, менее популярные утренние сеансы во вторник имеют такой же шанс попасть в Топ выдачи для раздела «Вторник», как и популярные вечерние сеансы в субботу для раздела «Суббота». Без этого механизма субботние сеансы могли бы вытеснить все остальные.

Вопросы и ответы

Что такое "партиционное ранжирование" (Partitioned Ranking) в контексте этого патента?

Это ключевой механизм, при котором общий временной интервал запроса (например, неделя) делится на более мелкие разделы (например, дни). Система ранжирует события независимо внутри каждого дня. Это означает, что определяются Топ-3 события для понедельника, Топ-3 для вторника и так далее. Это обеспечивает темпоральное разнообразие и предотвращает доминирование самых популярных событий над всем интервалом.

Насколько важна разметка Schema.org/Event, исходя из этого патента?

Она критически важна. Хотя патент напрямую не упоминает Schema.org (он был подан раньше), он подчеркивает необходимость структурированных данных и упоминает использование XML и RSS для точного извлечения Time Information и Place Information. В современных реалиях Schema.org является стандартом для предоставления этой структурированной информации.

Что важнее для поиска событий: время, место или ключевые слова?

Все три элемента критичны. Время и место действуют как жесткие фильтры. Сначала система отбирает события по месту (локализация), затем распределяет их по временным разделам (партиционирование). Только после этого оценивается релевантность ключевых слов для ранжирования внутри раздела. Без точного времени и места событие не будет обработано.

Как система определяет, где находится событие?

Система извлекает Place Information из данных о событии. Патент также упоминает иерархическое распознавание мест. Это означает, что система понимает, что конкретное заведение находится внутри города (например, "Бруклинский мост" в "Нью-Йорке"), и если пользователь ищет события в городе, система включит события в этом заведении.

Может ли эта система индексировать онлайн-события (вебинары)?

Да. В патенте указано, что Place Information может включать IP-адрес, URL, имя компьютера в сети или указывать на среду вещания (broadcast medium). Это подразумевает возможность обработки событий, которые происходят в интернете.

Что такое Event Tool и как он работает?

Event Tool — это компонент, отвечающий за наполнение базы данных событий. Он функционирует как специализированный краулер (event crawler), который ищет описания событий на веб-страницах. Кроме того, он может обрабатывать синдицированные фиды (например, RSS) и импортировать события из пользовательских календарей.

Как система решает, на какие разделы делить время (часы, дни или недели)?

Система определяет временной шаг (Time Increment). Он может быть явно указан пользователем или определен системой автоматически на основе общего временного интервала запроса. Патент также поддерживает иерархическое разделение (Claim 18), позволяя делить, например, дни на часы.

Что произойдет, если я не укажу местоположение в запросе?

Патент предусматривает использование данных пользователя (User Data). Если компонент места отсутствует, система может использовать текущее географическое местоположение пользователя (определенное по IP или указанное в профиле) в качестве значения по умолчанию для Place Component.

Что такое функция "I'm Feeling Bored", описанная в патенте?

Это функция, которая использует Query Generator Tool для автоматического создания запроса на поиск событий. Запрос может быть сгенерирован на основе местоположения пользователя, его истории поиска и привычек, или даже случайным образом, чтобы предложить интересные мероприятия поблизости без ввода пользователя.

Как обрабатываются события, которые длятся несколько дней?

Патент предлагает варианты: событие может быть ассоциировано с разделом, если его время начала попадает в этот раздел, или если любая часть события происходит во время раздела. Это означает, что многодневное событие потенциально может отображаться в нескольких последовательных временных разделах, если оно остается релевантным.

Похожие патенты

Как Google выборочно индексирует действия пользователя на локальном устройстве, основываясь на поведении и частоте событий
Анализ патента Google, описывающего инфраструктуру для клиентского поиска (например, Google Desktop). Система фиксирует действия пользователя (события) с контентом (статьями) и решает, индексировать ли их, используя критерии, основанные на частоте событий, доступных ресурсах и предполагаемых интересах пользователя (имплицитно выведенных из его поведения).
  • US8346777B1
  • 2013-01-01
  • Индексация

  • Local SEO

  • Поведенческие сигналы

Как Google эффективно индексирует и ранжирует повторяющиеся события для персонального и структурированного поиска
Google использует специализированный метод для индексации повторяющихся событий. Система создает единый документ, разделяя общую информацию (название, описание) и уникальные детали каждого случая (дата, исключения). Для ранжирования применяется двухэтапный процесс: быстрая аппроксимация частоты события для первичной оценки и детальный анализ точного времени для финального скоринга.
  • US9760600B2
  • 2017-09-12
  • Индексация

Как Google извлекает даты и локации из контента для отображения результатов на карте и временной шкале
Google извлекает даты и географические локации непосредственно из контента веб-страниц. Это позволяет системе визуализировать результаты поиска на интерактивной временной шкале и на карте, даже если запрос не содержал явных указаний на время или место. Пользователи могут использовать эти визуализации для навигации и уточнения запросов, а сниппеты могут фокусироваться вокруг извлеченных фактов.
  • US10509817B2
  • 2019-12-17
  • Индексация

  • Краулинг

  • SERP

Как Google автоматически категоризирует локальный контент и историю пользователя для контекстного поиска по неявным запросам
Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.
  • US7788274B1
  • 2010-08-31
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

Как Google создает агрегированные блоки событий (Integrated Event View), объединяя факты, новости и фильтруя социальные сети
Google использует систему для идентификации событий (спорт, концерты) в запросах и генерации «Интегрированного представления события» (Integrated Event View). Эта система агрегирует фактические данные, результаты веб-поиска и контент из социальных сетей. Ключевой особенностью является фильтрация социальных сообщений с использованием семантического сходства (например, LSA) и геолокации для обеспечения релевантности.
  • US20110302153A1
  • 2011-12-08
  • Семантика и интент

Популярные патенты

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя
Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.
  • US9116952B1
  • 2015-08-25
  • Семантика и интент

  • Поведенческие сигналы

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует нейросетевые эмбеддинги (Two-Tower Model) для семантического поиска изображений с учетом контекста страницы
Google использует систему поиска изображений, основанную на нейронных сетях (модель "Две Башни"). Система создает векторные представления (эмбеддинги) для поисковых запросов и для пар "изображение + посадочная страница", помещая их в общее семантическое пространство. Это позволяет находить релевантные изображения не по ключевым словам, а по близости векторов, учитывая как содержание картинки, так и контекст страницы, на которой она размещена.
  • US11782998B2
  • 2023-10-10
  • Семантика и интент

  • Индексация

  • Мультимедиа

Как Google использует машинное обучение для прогнозирования желаемого типа контента (Web, Images, News) и формирования смешанной выдачи (Universal Search)
Google анализирует исторические журналы поиска (пользователь, запрос, клики), чтобы обучить модель машинного обучения. Эта модель предсказывает вероятность того, что пользователь хочет получить результаты из определенного репозитория (например, Картинки или Новости). Google использует эти прогнозы, чтобы решить, в каких индексах искать и как смешивать результаты на финальной странице выдачи (Universal Search).
  • US7584177B2
  • 2009-09-01
  • Семантика и интент

  • SERP

  • Персонализация

Как Google динамически меняет формулы ранжирования, адаптируя веса факторов под контекст запроса и пользователя
Google не использует единую модель ранжирования. Система использует машинное обучение для создания множества специализированных моделей (Predicted Performance Functions), обученных на исторических данных о кликах для разных контекстов (Search Contexts). При получении запроса система определяет контекст (тип запроса, язык, локация пользователя) и применяет ту модель, которая лучше всего предсказывает CTR в этой ситуации, динамически изменяя значимость различных сигналов ранжирования.
  • US8645390B1
  • 2014-02-04
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google автоматически дополняет запросы пользователя терминами из его недавней истории поиска для уточнения интента
Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
  • US9449095B1
  • 2016-09-20
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google динамически перестраивает выдачу, если пользователь игнорирует результаты, связанные с определенной сущностью
Google использует механизм уточнения интента пользователя в реальном времени при обработке неоднозначных запросов. Система группирует результаты поиска по связанным сущностям. Если пользователь демонстрирует отсутствие интереса к одной из групп (например, прокручивает или смахивает результаты), система динамически модифицирует выдачу, понижая или удаляя все результаты, связанные с этой отклоненной сущностью.
  • US9348945B2
  • 2016-05-24
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

seohardcore