SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google создает интерактивные временные шкалы (Timelines) событий, фильтруя результаты по авторитетности источников

TIMELINE OF EVENTS IN SEARCH BASED SYSTEM (Временная шкала событий в поисковой системе)
  • US20200074007A1
  • Google LLC
  • 2018-08-30
  • 2020-03-05
  • SERP
  • EEAT и качество
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует двухэтапную систему для генерации временных шкал. Сначала система определяет значимые события, анализируя всплеск публикаций от широкой категории источников (например, всех СМИ) в определенные интервалы времени. Затем для этих событий выбираются лучшие результаты исключительно от самых авторитетных источников (например, топовых СМИ), которые отображаются в хронологическом порядке.

Описание

Какую проблему решает

Патент решает проблему сложности восприятия пользователем хронологического развития событий за определенный период времени. Стандартный поиск требует выполнения множества отдельных запросов с разными временными фильтрами. Изобретение автоматизирует этот процесс, предоставляя единое графическое представление (Timeline) значимых событий. Это повышает эффективность поиска и улучшает пользовательский интерфейс, особенно на мобильных устройствах.

Что запатентовано

Запатентована система (Timeline Engine), которая генерирует графическую временную шкалу событий, используя инфраструктуру существующей поисковой системы. Ключевым механизмом является двухэтапный процесс, который определяет «значимые события» на основе объема публикаций от предопределенной категории хостов (например, новостных сайтов), а затем выбирает наиболее авторитетные источники для их представления.

Как это работает

Система работает следующим образом:

  • Сегментация времени: Заданный временной период делится на интервалы (например, месяцы).
  • Этап 1 (Определение значимости): Для каждого интервала выполняется поиск. Система подсчитывает количество результатов от хостов из первой, широкой категории (List X, например, все СМИ). Интервалы с высокой активностью (превышающей Selection Threshold) считаются значимыми.
  • Этап 2 (Выбор авторитетного источника): Для выбранных интервалов выполняется повторный поиск, но с ограничением только по хостам из второй, более строгой и авторитетной категории (List Y, например, топовые СМИ).
  • Генерация Timeline: Наиболее релевантный результат (Топ-1) из Этапа 2 для каждого интервала используется для создания визуальной хронологической шкалы.

Актуальность для SEO

Высокая. Генерация структурированных ответов и SERP Features, особенно связанных с хронологией (новости, история, биографии), является актуальным направлением развития поиска. Описанный механизм предоставляет конкретную реализацию того, как Google автоматически строит временные шкалы, опираясь на сигналы авторитетности.

Важность для SEO

Патент имеет высокое значение (7/10), особенно для издателей (Publishers) и сайтов, освещающих события. Он демонстрирует механизм, где Google использует предопределенные списки хостов (по сути, «белые списки») для генерации специальных блоков выдачи. Для попадания в блок Timeline сайт должен быть не только релевантным и своевременным, но и классифицироваться как высокоавторитетный источник (принадлежать к List Y).

Детальный разбор

Термины и определения

Host Constraints (Ограничения по хостам)
Параметры поискового запроса, требующие, чтобы результаты были размещены только на хостах, удовлетворяющих определенным требованиям (например, входящих в List Y).
Predefined Category of Hosts (Предопределенная категория хостов)
Группа хостов, классифицированных по определенному признаку (например, «Новостные сайты», «Академические журналы»). В патенте используются две такие категории:
List X (Первая категория)
Более широкий список хостов. Используется на первом этапе для определения значимости события по объему публикаций.
List Y (Вторая категория)
Более узкий список авторитетных или популярных хостов. Часто является подмножеством List X. Используется на втором этапе для выбора финального, наиболее качественного результата для отображения.
Selection Threshold (Порог выбора)
Критерий для определения значимости временного интервала. Основан на количестве публикаций от List X. Может быть фиксированным числом или динамическим (например, Топ-N интервалов).
Time Interval (Временной интервал)
Сегмент, полученный путем разделения общего Time Period (например, месяц внутри года). Является подмножеством (proper subset) Time Period.
Timeline Engine (Механизм генерации временной шкалы)
Компонент системы, который управляет всем процессом: сегментацией времени, отправкой запросов к поисковой системе, анализом результатов и генерацией финального графического представления.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый процесс генерации временной шкалы.

  1. Система получает запрос с терминами и временными ограничениями (Time Period).
  2. Time Period делится на несколько Time Intervals.
  3. Для каждого интервала:
    1. Система отправляет запрос в поисковую систему с терминами и ограничениями по данному интервалу.
    2. Получает данные о релевантных ресурсах, опубликованных в этот интервал.
    3. Определяет количество ресурсов, размещенных на хостах из предопределенной категории (List X).
  4. Выбираются интервалы, для которых это количество соответствует Selection Threshold.
  5. Генерируется графическое представление (Timeline) выбранных интервалов, включающее поисковый результат для каждого из них.
  6. Графическое представление предоставляется пользователю.

Claim 3 (Зависимый): Уточняет механизм работы Selection Threshold. Порог может быть реализован путем выбора предопределенного числа интервалов с наибольшим количеством идентифицированных ресурсов (Топ-N интервалов).

Claim 4 (Зависимый от 1): Критически важный пункт, описывающий второй этап фильтрации качества для генерации финального изображения.

Для каждого выбранного интервала система:

  1. Отправляет новый запрос в поисковую систему: те же термины, те же временные ограничения интервала, НО добавляет Host Constraints, указывающие на вторую предопределенную категорию хостов (List Y).
  2. Получает второй набор ресурсов, ограниченный List Y.
  3. Выбирает из этого набора ресурс, который указан поисковой системой как наиболее релевантный (most responsive) (Топ-1).
  4. Генерирует Timeline, используя эти выбранные ресурсы.

Этот механизм гарантирует, что значимость события определяется по широкому кругу источников (List X), но в финальной выдаче будет показан результат от наиболее авторитетного источника (List Y).

Claim 5 (Зависимый): Указывает, что результаты отображаются в хронологическом порядке их публикации.

Где и как применяется

Изобретение функционирует на финальных стадиях обработки запроса, используя данные индексации для генерации специализированного элемента выдачи.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна обработать данные, необходимые для работы Timeline Engine:

  • Точная дата публикации: Дата публикации каждого ресурса должна быть точно извлечена и проиндексирована.
  • Классификация хостов: Хосты должны быть предварительно классифицированы по категориям, чтобы система могла определить их принадлежность к List X и List Y.

QUNDERSTANDING – Понимание Запросов
Система анализирует запрос на наличие временных ограничений. Патент также упоминает, что система может автоматически определять релевантный временной период для темы запроса, если он не указан пользователем.

METASEARCH – Метапоиск и Смешивание
Основное место применения патента. Timeline Engine действует как метапоисковая система:

  1. Координирует выполнение множества параллельных поисковых запросов с разными временными интервалами.
  2. Анализирует результаты, применяя логику фильтрации по категориям хостов (List X).
  3. Генерирует второй набор уточненных запросов с более строгими ограничениями (List Y).
  4. Объединяет лучшие результаты и формирует блок Timeline (SERP Feature), который встраивается в общую выдачу.

Входные данные:

  • Запрос пользователя (Термины + Time Period).
  • Предопределенные списки хостов (List X и List Y).
  • Индекс поисковой системы.

Выходные данные:

  • Графическое представление (Timeline) выбранных авторитетных ресурсов в хронологическом порядке.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние в новостных тематиках, истории, политике, финансах, биографиях, а также в темах, где важна хронология развития (например, история продукта или компании).
  • Специфические запросы: Запросы, подразумевающие временной диапазон (например, «События [Тема] в 2023 году») или запросы об исторических событиях.
  • Типы контента: Новостные статьи, пресс-релизы, академические публикации.

Когда применяется

  • Условия активации: Когда запрос содержит явные или неявные временные ограничения, и система намеревается показать хронологию.
  • Триггеры и пороговые значения: Алгоритм активируется для отображения интервала, только если количество публикаций от хостов из List X в этом интервале достигает Selection Threshold.
  • Динамическая настройка: Патент упоминает возможность динамического определения интервалов. Если в каком-то интервале слишком много активности, он может быть разделен на более короткие подинтервалы.

Пошаговый алгоритм

Процесс работы Timeline Engine:

Этап 1: Инициализация и Сегментация

  1. Получение запроса: Система получает запрос (термины и Time Period).
  2. Загрузка конфигурации: Получение доступа к спискам хостов List X и List Y.
  3. Сегментация времени: Разделение Time Period на множество непересекающихся Time Intervals (например, по месяцам).

Этап 2: Определение значимых событий (Significance Detection)

  1. Параллельный поиск 1: Отправка запросов в поисковую систему для каждого временного интервала.
  2. Анализ результатов: Получение списков релевантных ресурсов для каждого интервала.
  3. Подсчет по категории: Для каждого интервала определяется количество ресурсов, размещенных на хостах из List X.
  4. Выбор интервалов: Идентификация интервалов, которые удовлетворяют Selection Threshold (например, выбор Топ-4 интервалов с наибольшим количеством публикаций от List X).

Этап 3: Выбор авторитетного источника (Source Selection)

  1. Параллельный поиск 2 (Ограниченный): Для каждого выбранного интервала выполняется повторный запрос. К запросу добавляется ограничение: искать только среди хостов из List Y.
  2. Выбор лучшего результата: Из полученных результатов выбирается ресурс, который поисковая система считает наиболее релевантным (most responsive).

Этап 4: Генерация и Отображение

  1. Сортировка: Выбранные ресурсы сортируются в хронологическом порядке по дате публикации.
  2. Рендеринг: Генерация графического представления Timeline.
  3. Вывод: Предоставление Timeline пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании метаданных результатов поиска и предопределенных списков.

  • Временные факторы: Дата публикации (Publication Date). Критически важный фактор, используемый для привязки ресурса к конкретному Time Interval и для финальной сортировки.
  • Технические факторы: URL ресурса. Используется для идентификации хоста и проверки его принадлежности к List X или List Y.
  • Факторы качества/авторитетности (Системные данные): Предопределенные категории хостов (List X и List Y). Принадлежность к этим спискам служит индикатором значимости и качества/надежности. Эти списки, вероятно, формируются на основе сигналов E-E-A-T или специфических критериев (например, для новостных источников).

Какие метрики используются и как они считаются

  • Плотность публикаций от List X: Метрика значимости события. Количество релевантных ресурсов, опубликованных хостами из List X в течение определенного Time Interval.
  • Selection Threshold (Порог выбора): Критерий для отбора интервалов. Может быть реализован как:
    1. Фиксированное минимальное количество публикаций от List X.
    2. Выбор Топ-N интервалов с максимальным количеством публикаций от List X.
  • Ranking Score / Relevance (Неявно): Стандартная оценка ранжирования, возвращаемая поисковой системой. Используется на Этапе 3 для выбора наиболее релевантного (most responsive) результата среди ресурсов от List Y.

Выводы

  1. Двухэтапный процесс генерации SERP Feature: Google использует сложный процесс для создания временных шкал. Этап 1 (с использованием List X) направлен на обнаружение всплеска активности (значимого события). Этап 2 (с использованием List Y) направлен на выбор наиболее качественного и авторитетного источника для представления этого события.
  2. Использование категорий хостов («Белые списки»): Патент явно указывает на использование предопределенных списков хостов (Predefined Category of Hosts) для фильтрации и оценки. Это подтверждает, что Google категоризирует сайты и может использовать механизмы, схожие с «белыми списками», для специфических поисковых функций.
  3. Приоритет авторитетности для отображения: В финальный блок Timeline могут попасть только ресурсы с хостов из List Y (наиболее авторитетные). Даже если событие было обнаружено благодаря активности других сайтов (List X), они не будут показаны, если не входят в List Y.
  4. Критичность временных меток: Точная дата публикации (Publication Date) является основой всего механизма, так как позволяет привязать контент к временным интервалам и упорядочить его хронологически.
  5. Объем публикаций как прокси значимости: Система использует количество публикаций от доверенных источников как индикатор того, что событие является важным, не прибегая к глубокому семантическому анализу самого события на этом этапе.

Практика

Best practices (это мы делаем)

  • Укрепление авторитетности и репутации хоста (E-E-A-T): Ключевая стратегия — добиться включения сайта в авторитетные списки Google (аналогичные List Y). Это требует долгосрочной работы над качеством контента, экспертностью, надежностью и репутацией бренда, особенно для издателей и отраслевых СМИ.
  • Обеспечение точности дат публикаций: Критически важно указывать актуальные и точные даты публикации контента. Это касается метаданных, микроразметки (Schema.org: datePublished, dateModified) и видимой части страницы. Без точной даты контент не сможет быть привязан к Time Interval.
  • Своевременное и качественное освещение событий: Издателям необходимо оперативно реагировать на значимые события в своей нише. Чтобы быть выбранным на Этапе 2, контент должен быть не только опубликован авторитетным сайтом (List Y), но и быть наиболее релевантным (most responsive) среди конкурентов.

Worst practices (это делать не надо)

  • Манипуляция датами публикаций: Попытки искусственно «освежить» контент путем изменения даты публикации без существенного обновления могут привести к потере доверия со стороны Google к временным меткам сайта. Это помешает корректной обработке контента механизмом Timeline Engine.
  • Игнорирование общей авторитетности домена: Фокус исключительно на релевантности отдельной статьи недостаточен. Если сайт не входит в доверенные категории (особенно List Y), он не появится в Timeline, даже если он первым осветил событие.
  • Создание поверхностного событийного контента: Создание низкокачественного контента или кликбейта для реагирования на события неэффективно, так как на Этапе 2 система фильтрует результаты по качеству и авторитетности источников (List Y) и выбирает лучший результат.

Стратегическое значение

Патент подтверждает стратегию Google по использованию авторитетных источников для формирования структурированных ответов и SERP Features. Он демонстрирует, что для определенных функций поиска Google может полагаться на строгие категории качества сайтов. Для SEO-специалистов это подчеркивает разрыв между стандартным ранжированием и попаданием в специализированные блоки: последнее часто требует значительно более высокого уровня авторитетности (E-E-A-T) и доверия со стороны системы.

Практические примеры

Сценарий: Генерация Timeline для истории компании

  1. Запрос: «История слияния Компании А и Компании Б 2016-2018».
  2. Сегментация: Система делит период на 24 месяца.
  3. Этап 1 (Анализ значимости): Система использует List X (все финансовые СМИ и блоги). Она обнаруживает всплески публикаций в Мае 2016 (объявление о слиянии) и Январе 2018 (завершение слияния). Эти 2 месяца выбираются как значимые.
  4. Этап 2 (Выбор источника): Система выполняет повторный поиск для Мая 2016 и Января 2018, но ограничивает его сайтами из List Y (например, WSJ, Bloomberg, Reuters).
  5. Выбор результата: Для Мая 2016 выбирается статья из WSJ. Для Января 2018 — аналитика Bloomberg.
  6. Генерация Timeline: Система строит шкалу с этими двумя статьями в хронологическом порядке.

Вопросы и ответы

Что такое List X и List Y, и чем они отличаются?

Это предопределенные категории хостов (Predefined Category of Hosts). List X — это более широкий список (например, все известные СМИ и блоги), который используется на Этапе 1 для обнаружения значимых событий по всплеску публикационной активности. List Y — это более узкий и авторитетный список (например, только топовые мировые СМИ), который используется на Этапе 2 для выбора финального результата, отображаемого в Timeline. List Y часто является подмножеством List X.

Как этот патент связан с E-E-A-T?

Связь прямая и очень сильная. Попадание в List Y (список авторитетных источников, используемых для финального отображения) напрямую зависит от того, насколько высоко Google оценивает E-E-A-T сайта. Патент демонстрирует конкретный механизм, где сигналы авторитетности и надежности используются как жесткий фильтр для отбора контента в специализированных блоках выдачи.

Насколько важна дата публикации контента для этого патента?

Дата публикации (Publication Date) имеет критическое значение. Весь механизм основан на анализе контента внутри конкретных временных интервалов и последующей хронологической сортировке. Если дата публикации неточна или отсутствует, контент не сможет быть корректно обработан Timeline Engine и не попадет во временную шкалу.

Как система определяет, что событие является «значимым»?

Система использует прокси-метрику: количество публикаций по теме запроса со стороны сайтов из предопределенной категории (List X) в определенный временной интервал. Если это количество превышает пороговое значение (Selection Threshold) или является одним из самых высоких, система интерпретирует это как индикатор значимого события.

Применяется ли этот механизм только к новостным сайтам?

Хотя новостные сайты являются наиболее очевидным примером, механизм может применяться шире. В патенте также упоминаются академические журналы. Категории могут включать отраслевые ресурсы, официальные сайты компаний или любые другие группы сайтов, где важна хронология и авторитетность, в зависимости от тематики запроса.

Может ли небольшой, но качественный блог попасть на такую временную шкалу?

Это маловероятно, если блог не признан высокоавторитетным источником на уровне системы (т.е. не входит в List Y). Даже если блог активно и качественно освещает тему, на финальном этапе система отдаст предпочтение более крупным или признанным авторитетным сайтам из List Y для отображения на шкале.

Как система выбирает финальный результат для отображения на шкале?

На втором этапе система выполняет поиск, ограниченный авторитетными источниками (List Y) и конкретным временным интервалом. Из полученного списка она выбирает тот результат, который основная поисковая система считает наиболее релевантным (most responsive) исходному запросу. Это стандартное ранжирование в рамках жестких фильтров.

Что происходит, если пользователь не указал временной период в запросе?

Патент упоминает, что система может добавить временные ограничения автоматически. Это может быть период по умолчанию или период, определенный на основе темы запроса (например, годы Второй мировой войны для соответствующего запроса). Также система может определить границы периода, анализируя распределение дат публикаций по теме.

Могут ли временные интервалы быть разной длины?

Да. Патент описывает возможность динамического определения интервалов. Если в одном интервале обнаружено слишком много активности, система может разделить его на более короткие интервалы (например, разбить месяц на дни) и провести повторный анализ для повышения детализации временной шкалы.

Влияет ли этот патент на обычное ранжирование (10 синих ссылок)?

Напрямую патент не влияет на алгоритмы ранжирования стандартных результатов. Он описывает механизм генерации отдельного SERP-блока. Однако генерация блока Timeline может занимать значительное место на странице выдачи, смещая органические результаты вниз и перехватывая клики пользователей, что косвенно влияет на трафик.

Похожие патенты

Как Google извлекает даты и локации из контента для отображения результатов на карте и временной шкале
Google извлекает даты и географические локации непосредственно из контента веб-страниц. Это позволяет системе визуализировать результаты поиска на интерактивной временной шкале и на карте, даже если запрос не содержал явных указаний на время или место. Пользователи могут использовать эти визуализации для навигации и уточнения запросов, а сниппеты могут фокусироваться вокруг извлеченных фактов.
  • US10509817B2
  • 2019-12-17
  • Индексация

  • Краулинг

  • SERP

Как Google визуализирует эволюцию новостных сюжетов и классифицирует типы контента во времени
Google использует систему визуализации результатов поиска по историческим новостям. Она строит график, показывающий развитие новостных сюжетов (кластеров) во времени, включая их разделение и слияние. Система также использует различные маркеры для идентификации типов контента, таких как оригинальные статьи, дубликаты и редакционные материалы, в рамках каждого сюжета.
  • US8131702B1
  • 2012-03-06
Как Google индексирует, ранжирует и структурирует события по времени и местоположению, обеспечивая темпоральное разнообразие
Патент Google, описывающий систему поиска событий, которая фильтрует результаты по времени и месту. Система разделяет запрошенный временной интервал (например, неделю) на сегменты (например, дни) и ранжирует лучшие события отдельно для каждого сегмента. Это предотвращает доминирование популярных событий одного дня и гарантирует видимость релевантных результатов на протяжении всего интервала.
  • US7647353B2
  • 2010-01-12
  • Индексация

  • Краулинг

  • Local SEO

Как Google определяет, действительно ли новость посвящена сущности, и строит хронологию событий
Google использует систему для определения релевантности новостей конкретным объектам (сущностям, событиям, темам). Система анализирует кластеры новостных статей (коллекции), оценивая общий интерес к объекту (поисковые запросы, социальные сети) и значимость объекта внутри коллекции (упоминания в заголовках, центральность в тексте). Ключевой механизм — оценка уместности событий: система проверяет, соответствует ли событие типу объекта (например, «новый метод лечения» для болезни), чтобы отфильтровать мимолетные упоминания и создать точную хронологию новостей.
  • US9881077B1
  • 2018-01-30
  • Семантика и интент

  • Поведенческие сигналы

Как Google эффективно индексирует и ранжирует повторяющиеся события для персонального и структурированного поиска
Google использует специализированный метод для индексации повторяющихся событий. Система создает единый документ, разделяя общую информацию (название, описание) и уникальные детали каждого случая (дата, исключения). Для ранжирования применяется двухэтапный процесс: быстрая аппроксимация частоты события для первичной оценки и детальный анализ точного времени для финального скоринга.
  • US9760600B2
  • 2017-09-12
  • Индексация

Популярные патенты

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования
Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.
  • US8005811B2
  • 2011-08-23
  • Поведенческие сигналы

  • SERP

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce
Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.
  • US7089237B2
  • 2006-08-08
  • Поведенческие сигналы

  • Персонализация

  • SERP

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует внутренние ссылки и структуру DOM для генерации шаблонов сайта и извлечения структурированных сниппетов
Google анализирует повторяющиеся блоки внутренних ссылок (например, списки товаров). Если текст возле ссылки на исходной странице совпадает с текстом на целевой странице, Google определяет DOM-структуру этого текста и создает шаблон домена. Этот шаблон позволяет автоматически извлекать ключевую информацию (например, цену и характеристики) для сниппетов со всех однотипных страниц сайта, даже без микроразметки.
  • US9971746B2
  • 2018-05-15
  • Структура сайта

  • SERP

  • Ссылки

seohardcore