Анализ патента Google, описывающего систему поиска событий. Чтобы избежать доминирования популярных событий в выдаче, система разделяет запрашиваемый временной интервал на более мелкие части (например, неделю на дни). Затем она находит и отображает наиболее релевантные события для каждой из этих частей, обеспечивая тем самым временное разнообразие результатов. Патент также подчеркивает важность извлечения данных о времени и месте событий из структурированных источников.
Описание
Какую задачу решает
Патент решает проблему низкой временной диверсификации при поиске событий за определенный интервал. В традиционном поиске результаты могут быть переполнены информацией о самых популярных событиях, происходящих в один момент (например, в субботу вечером), в то время как менее популярные, но релевантные события, происходящие в другое время (например, в среду днем), оказываются погребенными в выдаче. Система направлена на то, чтобы предоставить пользователю обзор релевантных событий, распределенных по всему запрошенному временному интервалу.
Что запатентовано
Запатентована система и метод поиска событий, который принимает запрос, включающий временной интервал, местоположение и поисковые термины. Ключевым элементом изобретения является механизм партиционирования (partitioning) временного интервала на более мелкие сегменты (partitions и sub-partitions) на основе заданных приращений времени (time increments). Система определяет релевантность событий отдельно для каждого сегмента и отображает заданное количество наиболее релевантных событий для каждого из них.
Как это работает
Система работает следующим образом:
- Сбор данных: Специализированный краулер (Event Tool) собирает данные о событиях из веб-страниц, RSS-фидов и календарей.
- Прием запроса: Получается запрос, содержащий временной интервал, местоположение и ключевые слова.
- Партиционирование: Временной интервал делится на сегменты (например, дни) и, возможно, суб-сегменты (например, часы).
- Локализация событий: Отбираются события, происходящие в указанном месте (place component).
- Оценка релевантности по сегментам: Для каждого временного сегмента система независимо определяет релевантность локализованных событий на основе поисковых терминов (search component).
- Выбор и отображение: Для каждого сегмента выбирается предопределенное количество лучших событий. Результаты отображаются сгруппированными по этим временным сегментам (часто в формате календаря).
Актуальность для SEO
Высокая. Принципы, описанные в патенте, остаются крайне актуальными. Обеспечение разнообразия результатов (в данном случае временного) является постоянной задачей поисковых систем. Методы извлечения событий из структурированных данных (XML, RSS), описанные в патенте, являются фундаментальными для того, как Google индексирует события сегодня (например, через Schema.org) и отображает их в Event Packs.
Важность для SEO
Патент имеет высокое значение (8/10) для сайтов, связанных с событиями (афиши, календари, локальный бизнес). Он демонстрирует, что простая популярность события не гарантирует его видимости, если система стремится обеспечить временное разнообразие. Это дает возможность менее популярным событиям получить видимость, если они релевантны и происходят во временном сегменте с низкой конкуренцией. Патент критически подчеркивает необходимость предоставления точных и структурированных данных о времени и месте.
Детальный разбор
Термины и определения
- Event (Событие)
- Происшествие определенной активности в определенное время и в определенном месте. Включает Time Information, Place Information и Content.
- Event Tool (Инструмент обработки событий / Event Crawler)
- Компонент, который функционирует как краулер событий, извлекая описания событий из электронных документов (включая XML, RSS-фиды, календари) и записывая их в базу данных.
- Time Component (Временной компонент запроса)
- Часть запроса, определяющая временной интервал (time interval) для поиска.
- Place Component (Компонент места запроса)
- Часть запроса, описывающая место (например, географическое положение).
- Search Component (Поисковый компонент запроса)
- Часть запроса, содержащая поисковые термины для оценки релевантности.
- Time Increment (Приращение времени)
- Единица времени (например, день, час), используемая для разделения временного интервала на сегменты.
- Partition (Сегмент, Партиция)
- Часть временного интервала, полученная в результате применения первого Time Increment. Система оценивает релевантность событий внутри каждого сегмента независимо.
- Sub-partition (Суб-сегмент)
- Результат дальнейшего разделения Partition с использованием второго Time Increment (например, разделение дня на часы).
- Relevancy Tool (Инструмент оценки релевантности)
- Компонент системы, определяющий меру релевантности события по отношению к запросу.
- Structured Language (Структурированный язык)
- Языки разметки (например, XML) или форматы синдикации (например, RSS), облегчающие извлечение данных о событиях.
Ключевые утверждения (Анализ Claims)
Патент является продолжением (continuation) более ранних заявок. Анализ проводится по ключевому независимому пункту Claim 1.
Claim 1 (Независимый пункт): Описывает метод поиска событий с двойным партиционированием в контексте календаря.
- Система идентифицирует события из электронных документов и записывает их в calendar.
- Выбирается запрос, включающий time interval, place component и search component.
- Временной интервал разделяется (partitioning) на сегменты (partitions) на основе первого time increment.
- Для как минимум одного сегмента определяется релевантность события из календаря, которое происходит в этом сегменте и имеет предопределенное отношение к указанному месту.
- Предоставляются релевантные события для отображения.
- Ключевое дополнение: Процесс также включает дальнейшее разделение каждого сегмента на суб-сегменты (sub-partitions) на основе второго time increment.
- Релевантность событий определяется также для событий, происходящих в суб-сегментах.
Ядро изобретения — это механизм многоуровневой временной диверсификации. Например, поиск событий на неделю может быть разделен на дни (первый уровень), а затем каждый день на часы (второй уровень). Это гарантирует показ релевантных результатов для каждого временного слота, предотвращая доминирование событий одного дня.
Claim 2 (Зависимый): Уточняет, что отношение к месту включает географическую близость (geographical proximity).
Claim 4 (Зависимый): Уточняет, что длина каждого сегмента фиксирована и не зависит от количества событий в этом сегменте.
Claim 5 (Зависимый): Упоминает возможность поиска в публичных или общих календарях пользователей.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, фокусируясь на обработке данных о событиях.
CRAWLING – Сканирование и Сбор данных
Event Tool функционирует на этом этапе. Он ищет электронные документы в сети, определяет, описывают ли они события, и извлекает Time Information, Place Information и Content. Патент явно упоминает извлечение данных из структурированных языков (XML), синдицированных фидов (RSS) и календарей.
INDEXING – Индексирование и извлечение признаков
Извлеченные данные о событиях записываются в базу данных (event data или календарь). Происходит структурирование информации для быстрого поиска по временным и географическим параметрам.
RANKING – Ранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение логики патента. Когда поступает запрос на поиск событий с временным интервалом, система активирует логику партиционирования:
- Разделение интервала: Интервал делится на partitions и sub-partitions.
- Множественные мини-ранжирования: Процесс ранжирования (определение релевантности по search component) выполняется независимо для каждого временного сегмента.
- Смешивание/Агрегация: Лучшие результаты из каждого сегмента агрегируются для финального отображения (часто в виде календаря).
Входные данные:
- Запрос пользователя (Time Interval, Place Component, Search Component).
- База данных проиндексированных событий (Event Data).
- Определенные или вычисленные Time Increments.
Выходные данные:
- Набор релевантных событий, сгруппированных и отсортированных по временным сегментам.
На что влияет
- Конкретные типы контента: В первую очередь влияет на контент, описывающий события (концерты, семинары, встречи и т.д.).
- Специфические запросы: Влияет на запросы, которые явно или неявно указывают временной интервал и местоположение (например, «концерты в Москве на этой неделе», «что делать в выходные»).
- Конкретные ниши или тематики: Афиши, туризм, развлечения, образование, локальный бизнес.
Когда применяется
- Триггеры активации: Алгоритм активируется, когда система идентифицирует запрос как поиск событий и определяет наличие временного интервала (time interval), который можно разделить на значимые сегменты.
- Условия работы: Применяется для обеспечения временного разнообразия результатов, чтобы предотвратить доминирование одного или нескольких очень популярных событий в выдаче за весь период.
Пошаговый алгоритм
Процесс обработки запроса на поиск событий:
- Получение запроса: Система получает запрос с Time Component, Place Component и Search Component.
- Определение приращений и партиционирование: Определяются первый и второй Time Increment. Временной интервал разделяется на Partitions и Sub-partitions.
- Локализация событий: Из базы данных извлекаются события, которые происходят в месте, указанном в Place Component (с учетом географической близости).
- Ассоциация событий с сегментами: Локализованные события ассоциируются с соответствующими временными сегментами (Partitions/Sub-partitions).
- Итерация по сегментам: Система последовательно выбирает каждый временной сегмент.
- Определение релевантности: Для событий, ассоциированных с текущим сегментом, Relevancy Tool вычисляет релевантность на основе Search Component запроса.
- Выбор событий: Выбирается предопределенное количество наиболее релевантных событий для текущего сегмента.
- Агрегация и отображение: После обработки всех сегментов выбранные события отображаются пользователю, сгруппированные по этим сегментам.
Какие данные и как использует
Данные на входе
Система использует следующие типы данных для индексации событий и обработки запросов:
- Временные факторы: Точное время начала и окончания события (Time Information). Критически важно для ассоциации события с Partition.
- Географические факторы: Место проведения события (Place Information). Используется для локализации событий. Система может использовать координаты, адреса или названия мест. Упоминается иерархическое распознавание мест (например, «The Alamo» находится в «San Antonio»).
- Контентные факторы: Описание события (Content). Используется для определения релевантности по отношению к Search Component.
- Структурные факторы: Данные, извлеченные из структурированных источников. Патент явно упоминает extensible markup language (XML) и синдицированные фиды (RSS feed), а также данные из календарей.
- Пользовательские факторы: Упоминается возможность генерации запросов на основе свойств пользователя (property of a user), таких как история запросов (query-history) или текущее местоположение, особенно для функции автоматической генерации запросов (например, «I’m feeling bored»).
Какие метрики используются и как они считаются
- Relevance (Релевантность): Числовая мера того, насколько контент события соответствует Search Component запроса. Патент не детализирует формулу расчета, но указывает, что она основана на сравнении контента и поисковых терминов.
- Geographical Proximity (Географическая близость): Метрика для определения того, находится ли место проведения события в пределах предопределенного отношения к месту, указанному в запросе.
- Time Increments (Приращения времени): Метрики (например, день, час, неделя), используемые для разделения интервала. Могут быть указаны в запросе или определены системой автоматически.
Выводы
- Временная диверсификация как цель: Основная цель патента — предотвратить ситуацию, когда высокорелевантные или популярные события монополизируют выдачу. Система активно обеспечивает разнообразие, разделяя интервал и проводя независимое ранжирование внутри каждого временного сегмента (partition).
- Популярность vs. Временной слот: Менее популярное событие может получить высокую видимость, если оно является наиболее релевантным в своем временном сегменте, даже если его общая популярность ниже, чем у событий в других сегментах.
- Критичность структурированных данных для событий: Патент явно подчеркивает важность извлечения точных данных о времени и месте. Упоминание XML и RSS указывает на фундаментальную зависимость системы от структурированных данных (сегодня это Schema.org) для эффективной работы механизма партиционирования и локализации.
- Многоуровневое партиционирование: Система применяет иерархическое разделение (partitions и sub-partitions), что позволяет адаптировать уровень детализации отображения (например, неделя -> день -> час) и обеспечивать разнообразие на разных уровнях.
- Локализация и иерархия мест: Географическая привязка событий является обязательным условием. Система способна понимать иерархию местоположений и географическую близость для корректного отбора событий.
Практика
Best practices (это мы делаем)
- Использование микроразметки Event: Внедряйте и поддерживайте актуальную разметку Schema.org/Event. Патент подтверждает, что система полагается на извлечение структурированных данных для точной идентификации времени (startDate, endDate) и места (location). Это критически важно для попадания в нужный временной сегмент (partition).
- Предоставление фидов событий (RSS/Atom): Если на сайте много событий, предоставляйте структурированные фиды. Патент явно упоминает RSS feed как источник данных для Event Tool (краулера событий).
- Точность и полнота данных о времени и месте: Убедитесь, что время и место указаны максимально точно, включая часовой пояс и полные адреса. Система использует Geographical Proximity и иерархию мест для локализации событий.
- Оптимизация контента событий под релевантность: Помните, что ранжирование происходит внутри каждого временного сегмента на основе Search Component. Контент страницы события должен быть четко оптимизирован под релевантные ключевые слова, чтобы выиграть конкуренцию в своем временном слоте.
- Стратегия для повторяющихся или менее популярных событий: Используйте этот механизм в своих интересах. Если вы проводите регулярные мероприятия или нишевые события, у вас есть хорошие шансы на видимость в менее конкурентные временные слоты (например, будние дни), так как система стремится заполнить каждый partition релевантными результатами.
Worst practices (это делать не надо)
- Указание неточных или широких временных рамок: Если время события указано нечетко, система не сможет корректно ассоциировать его с временным сегментом, что снизит видимость.
- Отсутствие структурированных данных: Полагаться только на неструктурированный текст для описания времени и места рискованно. Краулер может некорректно интерпретировать данные, что приведет к ошибкам индексации.
- Игнорирование локальной оптимизации: Не указывать точное местоположение или использовать неоднозначные названия мест. Place Component является жестким фильтром в этом алгоритме.
- Фокус только на популярности: Пытаться конкурировать только за счет популярности (например, ссылочного веса) может быть неэффективно для поиска событий, так как механизм партиционирования намеренно ограничивает количество результатов от одного временного слота в пользу разнообразия.
Стратегическое значение
Патент подтверждает стратегию Google по структурированию информации и обеспечению разнообразия в выдаче. Для вертикали поиска событий временное разнообразие является ключевым фактором качества. Это означает, что SEO-стратегия для сайтов с событиями должна быть основана на технической точности данных (время, место) и семантической релевантности контента. Понимание механизма партиционирования позволяет более точно прогнозировать видимость событий в зависимости от времени их проведения и конкуренции в конкретном временном слоте.
Практические примеры
Сценарий: Оптимизация серии еженедельных семинаров
Сайт образовательного центра проводит семинары по вечерам во вторник, среду и четверг.
- Запрос пользователя: «Семинары по маркетингу в [Город] на этой неделе».
- Работа системы: Google определяет Time Interval (эта неделя) и Time Increment (1 день). Интервал делится на 7 сегментов (partitions).
- Конкуренция: В субботу проходит крупная и популярная конференция по маркетингу.
- Ранжирование без партиционирования: В традиционном поиске топ выдачи заняли бы страницы конференции. Семинары могли бы не попасть в Топ-10.
- Ранжирование с партиционированием:
- Сегмент «Суббота»: Конференция занимает топ.
- Сегменты «Вторник», «Среда», «Четверг»: Семинары образовательного центра являются наиболее релевантными событиями в эти дни.
- Действия SEO-специалиста:
- Убедиться, что для каждого семинара создана отдельная страница с корректной разметкой Event, где точно указаны дата и время начала.
- Оптимизировать контент страницы каждого семинара под запрос «семинар по маркетингу».
- Результат: В итоговой выдаче (например, в блоке событий) пользователь увидит и конференцию в субботу, и семинары в будние дни, так как система обеспечила временное разнообразие.
Вопросы и ответы
Как этот патент влияет на видимость очень популярных событий, например, крупных концертов?
Популярные события по-прежнему будут хорошо ранжироваться, но их доминирование ограничивается их временным сегментом (partition). Если пользователь ищет события на неделю, а концерт проходит только в пятницу, система будет активно искать релевантные события для показа в понедельник, вторник и т.д. Это предотвращает ситуацию, когда вся выдача состоит только из ссылок на пятничный концерт.
Что важнее для ранжирования событий согласно этому патенту: популярность события или время его проведения?
Оба фактора важны, но они применяются на разных этапах. Время проведения определяет, в каком временном сегменте (partition) будет участвовать событие. Популярность и релевантность определяют, выиграет ли событие ранжирование внутри этого конкретного сегмента. Точное время критично для попадания в рассмотрение.
Как система определяет, на какие части (Time Increments) делить временной интервал?
Патент предполагает, что Time Increment может быть определен на основе запроса (например, пользователь выбирает вид «День», «Неделя» или «Месяц») или автоматически. На практике система выбирает наиболее подходящее приращение в зависимости от длины интервала: для интервала в 3 дня приращением будет 1 день, а для интервала в 1 день — 1 час.
Подтверждает ли этот патент важность использования микроразметки Schema.org/Event?
Да, абсолютно. Патент неоднократно подчеркивает необходимость точного определения времени и места события. Он явно упоминает извлечение данных из структурированных языков (например, XML) и RSS-фидов. Микроразметка Event является современным стандартом для предоставления этой информации поисковым системам в структурированном виде.
Как обрабатываются события, которые длятся несколько дней?
Патент упоминает, что событие ассоциируется с сегментом, если его время начала приходится на этот сегмент, или если любая часть события происходит во время сегмента. Следовательно, длительное событие может быть ассоциировано с несколькими последовательными сегментами и участвовать в ранжировании в каждом из них.
Что такое многоуровневое партиционирование (Partitions и Sub-partitions) и зачем оно нужно?
Это иерархическое разделение времени. Например, при поиске на месяц интервал сначала делится на недели (partitions), а затем каждая неделя делится на дни (sub-partitions). Это позволяет системе обеспечивать разнообразие на разных уровнях детализации и адаптировать отображение результатов в зависимости от контекста (например, показать календарь на месяц с событиями на каждый день).
Как система обрабатывает местоположение? Насколько точным оно должно быть?
Местоположение используется как фильтр (Place Component). Патент указывает на использование географической близости (geographical proximity) и иерархического распознавания мест. Это означает, что система может понять, что конкретный адрес или заведение находится в пределах более крупного города, указанного в запросе. Точность данных о месте критична для корректной локализации события.
Может ли этот механизм помочь в продвижении менее популярных или нишевых событий?
Да. Поскольку система стремится показать релевантные результаты для каждого временного сегмента, нишевое событие имеет высокие шансы на видимость, если оно является наиболее релевантным в своем сегменте (например, в будний день утром), даже если его общая популярность низкая.
Применяется ли этот алгоритм ко всем запросам о событиях?
Он применяется к запросам, для которых определен временной интервал (например, «на выходных», «на следующей неделе»). Если запрос касается конкретного момента времени или конкретного события по названию, стандартные алгоритмы ранжирования будут иметь приоритет без необходимости временного партиционирования.
Что такое Event Tool, упомянутый в патенте?
Это компонент системы, который функционирует как специализированный краулер (Event Crawler). Его задача — активно сканировать интернет, идентифицировать страницы, описывающие события, извлекать из них данные (время, место, контент) и записывать их в индекс. Он также отвечает за обработку данных из RSS-фидов и календарей.