SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google визуализирует эволюцию новостных сюжетов и классифицирует типы контента во времени

SYSTEMS AND METHODS FOR BROWSING HISTORICAL CONTENT (Системы и методы для просмотра исторического контента)
  • US8131702B1
  • Google LLC
  • 2004-03-31
  • 2012-03-06
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему визуализации результатов поиска по историческим новостям. Она строит график, показывающий развитие новостных сюжетов (кластеров) во времени, включая их разделение и слияние. Система также использует различные маркеры для идентификации типов контента, таких как оригинальные статьи, дубликаты и редакционные материалы, в рамках каждого сюжета.

Описание

Какую проблему решает

Патент решает проблему визуализации и анализа развития новостных сюжетов с течением времени. Традиционные списки результатов новостных агрегаторов могут быть громоздкими и затрудняют понимание того, как история эволюционировала. Изобретение призвано предоставить пользователям возможность быстро и легко оценить прогрессию одной или нескольких новостных историй за определенный период.

Что запатентовано

Запатентована система и метод для графического представления агрегированного исторического контента (в первую очередь, новостей). Система позволяет пользователям выполнять поисковые запросы с указанием временного окна и получать результаты в виде многомерного графика (News Historical Graph). Этот график визуализирует новостные кластеры (сюжеты) во времени, показывая их эволюцию (разделение и слияние), а также использует различные визуальные индикаторы для дифференциации типов статей (оригиналы, дубликаты, редакционные материалы) внутри кластера.

Как это работает

Система работает следующим образом:

  • Ввод данных: Пользователь вводит один или несколько поисковых запросов и указывает временное окно (Time Window) для поиска по историческим данным.
  • Поиск и кластеризация: Система извлекает релевантные статьи из агрегированного корпуса новостей и группирует их в News Clusters (новостные сюжеты).
  • Классификация контента: Каждая статья классифицируется по типу (News Article Type) — например, оригинал, дубликат, редакционная статья.
  • Визуализация: Система генерирует News Historical Graph. Время отображается по одной оси (например, X), а разные новостные кластеры — по другой (например, Y).
  • Маркировка: Для каждого типа статьи используется свой визуальный маркер (Visual Indicator), например, буквы 'O', 'd', 'E'.
  • Отображение эволюции: График визуально показывает, как один сюжет разделяется (Splitting) на несколько или как несколько сюжетов сливаются (Merging) в один, например, с помощью стрелок (Relational Indicators).

Актуальность для SEO

Средняя. Патент подан в 2004 году. Хотя конкретный пользовательский интерфейс (News Historical Graph), показанный в патенте, может быть устаревшим или специфичным для архивного поиска (например, Google News Archives), базовые концепции высокоактуальны. Способность Google классифицировать типы новостного контента (оригинал против дубликата) и отслеживать эволюцию тем (Topic Layer, кластеризация новостей) имеет решающее значение в современном поиске.

Важность для SEO

Влияние на SEO минимальное (15/100). Это патент о пользовательском интерфейсе (UI/UX) и визуализации данных, а не о ранжировании. Он не дает прямых указаний о факторах ранжирования. Его ценность для Senior SEO заключается в подтверждении того, что Google имеет сложные системы для автоматической классификации новостного контента по типу (оригинал, дубликат, мнение) и глубоко анализирует эволюцию и взаимосвязи новостных сюжетов во времени.

Детальный разбор

Термины и определения

News Article Type (Тип новостной статьи)
Классификация статьи. Патент упоминает такие типы, как Original (Оригинал), Duplicate (Дубликат), Breaking News (Срочные новости), Editorial (Редакционная статья), Opeds (Мнения), Wire Stories (Сообщения информагентств).
News Cluster (Новостной кластер)
Группа новостных статей из разных источников, относящихся к одному и тому же событию или теме («новостному сюжету»).
News Historical Graph (Исторический граф новостей)
Пользовательский интерфейс, описанный в патенте. Многомерный график, который отображает новостные кластеры во времени.
Other Events (Другие события)
События, не относящиеся к новостям (например, активность на фондовом рынке, цены на сырьевые товары), которые могут быть наложены на график для выявления корреляций с новостями.
Relational Indicator (Индикатор связи)
Визуальный элемент (например, стрелка), который показывает связь между кластерами, в частности, разделение или слияние.
Splitting/Merging (Разделение/Слияние)
Процесс эволюции новостного сюжета. Splitting происходит, когда одна история разделяется на несколько связанных, но разных сюжетов. Merging происходит, когда разрозненные события объединяются в один большой кластер.
Time Window (Временное окно)
Указанный пользователем период времени (начало и конец интервала), в рамках которого выполняется поиск исторических статей.
Visual Indicator / Marker (Визуальный индикатор / Маркер)
Графический маркер (точка, иконка, символ, цвет), используемый на графике для обозначения отдельной статьи и ее типа (News Article Type).

Ключевые утверждения (Анализ Claims)

Патент фокусируется на методе визуализации результатов поиска.

Claim 1 (Независимый пункт): Описывает основной метод визуализации новостей.

  1. Система получает один или несколько поисковых запросов, включающих ссылку на указанный период времени (Time Window).
  2. Система получает документы, релевантные запросам.
  3. Определяется News Article Type для каждого документа.
  4. Для каждого документа выбирается Visual Indicator на основе его типа (причем используются разные индикаторы для разных типов).
  5. Идентифицируются новостные кластеры (первый, второй, третий).
  6. Система отображает документы в виде последовательностей новостных кластеров относительно указанного периода времени на графике (News Historical Graph). Каждый документ представлен своим Visual Indicator.
  7. Критически важно: отображение включает визуализацию того, как первый новостной кластер разделяется (Splitting) на второй и третий новостные кластеры.
  8. График предоставляется пользователю.

Claim 9 (Зависимый): Уточняет, что отображение включает Relational Indicators (например, стрелки), указывающие на то, что первый кластер разделяется на второй и третий.

Claim 10 (Зависимый): Уточняет, что система также может отображать слияние (Merging или converging) кластеров.

Claim 11 и 12 (Зависимые): Уточняют, что система может отображать документы вместе с Other Events (например, данными фондового рынка) и указывать на корреляции между новостями и этими событиями.

Claim 19 (Независимый пункт): Детализирует процесс классификации и визуализации, явно перечисляя типы контента: определение, соответствует ли результат original news article, duplicate news article, editorial или статье из предпочитаемого пользователем источника, и выбор соответствующего индикатора.

Где и как применяется

Изобретение относится к представлению результатов поиска (Presentation Layer), но требует значительной предварительной обработки данных на этапе индексирования.

INDEXING – Индексирование и извлечение признаков
На этом этапе базовые системы должны обработать новостной контент для поддержки визуализации:

  • Кластеризация: Группировка статей в News Clusters (сюжеты).
  • Классификация типов: Определение News Article Type (оригинал, дубликат, редакционная статья и т.д.) для каждой статьи.
  • Анализ эволюции: Отслеживание взаимосвязей между кластерами для идентификации событий Splitting и Merging. Эти данные сохраняются для последующего использования.

RANKING – Ранжирование
Система выполняет поиск по запросу пользователя в пределах указанного Time Window. Патент не описывает алгоритм ранжирования, но упоминает, что при генерации графика система определяет, какие кластеры показать (например, топ-15 самых релевантных/важных).

METASEARCH – Метапоиск и Смешивание (Presentation Layer)
Основное применение патента. Система берет результаты этапа RANKING и генерирует визуальное представление (News Historical Graph). Она отвечает за отрисовку графика, размещение Visual Indicators и Relational Indicators.

Входные данные:

  • Поисковый запрос(ы) пользователя и Time Window.
  • Корпус исторических новостных статей.
  • Предварительно рассчитанные данные о News Clusters и их эволюции.
  • Классификация News Article Type для каждой статьи.
  • (Опционально) Данные об Other Events.

Выходные данные:

  • Документ News Historical Graph (пользовательский интерфейс), визуализирующий результаты поиска во времени.

На что влияет

  • Конкретные типы контента: Влияет исключительно на представление новостных статей (News Articles), особенно в контексте просмотра архивов.
  • Специфические запросы: Влияет на запросы, связанные с историческими событиями или темами, развивающимися во времени, где пользователь хочет проследить эволюцию сюжета.

Когда применяется

  • Условия применения: Алгоритм применяется, когда пользователь выполняет поиск в специализированном интерфейсе (например, Google News Archive Search) и указывает исторический Time Window. Он не применяется в стандартной веб-выдаче в реальном времени.

Пошаговый алгоритм

Процесс А: Предварительная обработка (Офлайн/Индексирование)

  1. Сбор и агрегация контента: Сбор новостных статей из различных источников.
  2. Индексирование и группировка: Индексирование контента и группировка статей в News Clusters.
  3. Классификация статей: Определение News Article Type для каждой статьи (оригинал, дубликат и т.д.).
  4. Анализ эволюции: Определение временных рамок каждого кластера и идентификация событий Splitting и Merging между кластерами.

Процесс Б: Обработка запроса и Визуализация (Реальное время)

  1. Получение запроса: Получение поискового запроса и Time Window от пользователя.
  2. Выполнение поиска: Поиск релевантных статей и кластеров в пределах указанного временного окна.
  3. Ранжирование кластеров: Выбор наиболее важных/релевантных News Clusters для отображения.
  4. Выбор индикаторов: Для каждой статьи в выбранных кластерах определяется соответствующий Visual Indicator на основе ее типа.
  5. Генерация графика: Создание News Historical Graph.
    1. Отрисовка оси времени (например, X).
    2. Отрисовка кластеров в виде линий (например, горизонтальных на оси Y).
    3. Нанесение Visual Indicators на линии в моменты публикации статей.
    4. Отрисовка Relational Indicators (стрелок) для демонстрации Splitting и Merging.
    5. (Опционально) Наложение данных об Other Events.
  6. Предоставление интерфейса: Отправка графического документа пользователю с возможностью взаимодействия (например, клик по маркеру для просмотра статьи, изменение масштаба).

Какие данные и как использует

Данные на входе

  • Временные факторы: Дата и время публикации статьи являются критически важными данными для построения временной шкалы и фильтрации по Time Window.
  • Контентные факторы: Содержание статей используется для группировки в News Clusters. Анализ контента и метаданных используется для определения News Article Type (например, выявление признаков редакционной статьи, мнения или дубликата).
  • Пользовательские факторы: Патент упоминает возможность выделения статей из источников, предпочитаемых пользователем. Также упоминается возможность вывода (inferring) поисковых запросов на основе прошлой активности пользователя (past news browsing activity).
  • Системные данные (Классификация): Предварительно определенный тип статьи: Original, Duplicate, Editorial, Opeds, Wire Stories.

Какие метрики используются и как они считаются

Патент фокусируется на визуализации, но упоминает использование следующих методов и метрик:

  • Алгоритмы кластеризации: Используются для группировки статей в News Clusters на основе содержания и даты.
  • Методы классификации: Используются для определения News Article Type.
  • Оценки релевантности/важности: Используются для ранжирования News Clusters и выбора тех, которые будут отображены на графике, если пространство ограничено (например, Топ-15).
  • Плотность кластеризации (Density of clustering): Управляется в зависимости от разрешения графика. При изменении масштаба крупные кластеры могут декомпозироваться на более мелкие.
  • Корреляционный анализ: Упоминается возможность расчета и отображения корреляций между новостными кластерами и Other Events.

Выводы

  1. Это патент о UI/Визуализации, а не о ранжировании: Основное изобретение заключается в способе представления исторических данных поиска, а не в том, как эти данные ранжируются. SEO-специалистам не следует искать здесь сигналы ранжирования.
  2. Подтверждение глубокой классификации типов новостного контента: Патент явно указывает, что Google автоматически классифицирует новостные статьи по типам: Оригинал (Original), Дубликат (Duplicate), Редакционная статья (Editorial), Мнение (Oped), Новость информагентства (Wire story). Это подтверждает стратегическую важность оригинальности контента.
  3. Анализ эволюции тем (Topic Evolution): Система построена на способности Google понимать, как новостные сюжеты связаны между собой, развиваются, разделяются (Splitting) и сливаются (Merging). Google видит новостную повестку как динамический граф тем.
  4. Корреляция событий: Система разработана с возможностью визуализации корреляций между различными новостными темами или между новостями и реальными событиями (Other Events), что указывает на способность Google связывать разнородные данные.

Практика

Best practices (это мы делаем)

Хотя патент имеет ограниченное прямое применение для SEO-ранжирования, он дает важные концептуальные инсайты для Новостного SEO (Google News Optimization) и контент-стратегии.

  • Приоритет оригинального репортажа (Original Reporting): Система визуализации явно выделяет Original stories (маркер 'O') иначе, чем Duplicates или Wire Stories. Это подчеркивает стратегическую важность создания уникального, оригинального контента, чтобы быть идентифицированным как первоисточник новостного сюжета.
  • Четкое разделение типов контента: Убедитесь, что редакционные статьи (Editorials), мнения (Op-eds) и стандартные новостные репортажи четко различимы по структуре, подаче и разметке (Schema.org). Это поможет системам Google правильно классифицировать News Article Type.
  • Стратегия покрытия эволюционирующих тем: Используйте концепции разделения (Splitting) для планирования контента. Когда происходит крупное событие (инициирующее разделение темы), быстро создавайте специализированный контент для новых подтем, чтобы оставаться частью развивающегося сюжета, который Google отслеживает.
  • Точные временные метки: Критически важно предоставлять точные и надежные данные о дате и времени публикации, так как это основа для построения временной шкалы.

Worst practices (это делать не надо)

  • Зависимость от дублированного или синдицированного контента: Стратегия, основанная только на перепечатке сообщений информагентств или контента других издателей без добавления оригинальной ценности, неэффективна. Патент явно показывает, что Google классифицирует такой контент как Duplicate.
  • Маскировка мнений под новости: Попытка представить субъективный анализ (Oped) как объективный новостной репортаж может привести к некорректной классификации контента системой и снижению доверия.

Стратегическое значение

Патент подтверждает сложный уровень понимания новостной экосистемы Google (изобретатель Кришна Бхарат — основатель Google News). Он демонстрирует способность Google картографировать эволюцию тем с течением времени. Стратегическое значение для издателей заключается в понимании того, что их контент оценивается в контексте его оригинальности и его роли в общем развитии темы (является ли он инициатором сюжета, развитием подтемы или просто повторением). Это подчеркивает необходимость для SEO-специалистов мыслить не только отдельными статьями, но и развитием сюжетов.

Практические примеры

Сценарий: Разработка контент-стратегии для освещения крупной технологической конференции (например, Google I/O).

  1. Анализ (До события): Понимание того, что конференция породит множество новостных кластеров.
  2. Действие (Идентификация Разделения - Splitting): Подготовка к освещению ключевых анонсов. Планирование контента для ожидаемых разделений: например, анонс новой версии Android (основной кластер) разделится на: (1) функции для пользователей, (2) API для разработчиков, (3) влияние на производителей устройств.
  3. Действие (Оригинальность): Фокус на создании оригинальных репортажей и аналитики по каждому из этих направлений, чтобы получить классификацию Original story.
  4. Действие (Слияние - Merging): После конференции создание обобщающего материала, который синтезирует ключевые итоги и тренды (слияние разрозненных анонсов в общую картину).
  5. Ожидаемый результат: Максимальная видимость в Google News за счет покрытия всех ключевых аспектов эволюционирующей темы и получения статуса оригинального источника.

Вопросы и ответы

Описывает ли этот патент, как Google ранжирует новости?

Нет. Этот патент не описывает алгоритмы ранжирования. Он посвящен исключительно пользовательскому интерфейсу и методу визуализации уже полученных результатов поиска по историческим новостям. Он показывает, как отобразить эволюцию новостных сюжетов во времени.

Что означают маркеры 'O', 'd', 'E' на графике?

Эти маркеры являются визуальными индикаторами типа контента, который Google определил автоматически. 'O' означает Original story (оригинальная статья/первоисточник), 'd' означает Duplicate story (дубликат или повтор), а 'E' означает Editorial (редакционная статья). Патент также упоминает возможность маркировки срочных новостей, мнений и новостей информагентств.

Какое значение для SEO имеет тот факт, что Google различает оригиналы и дубликаты?

Хотя патент описывает использование этой классификации для визуализации, сам факт наличия такой классификации критически важен. Это подтверждает, что Google имеет системы для определения первоисточника новостного сюжета. Для SEO это означает, что стратегический фокус должен быть на создании оригинального контента, чтобы максимизировать шансы на высокую видимость в Google News.

Как понимание "Разделения" (Splitting) и "Слияния" (Merging) тем помогает в контент-стратегии?

Это помогает предвидеть развитие новостной повестки. "Разделение" происходит, когда крупное событие порождает несколько подтем (например, стихийное бедствие порождает темы о разрушениях, спасательных операциях и экономическом влиянии). Быстрое создание контента для этих подтем позволяет занять нишу. "Слияние" происходит, когда разрозненные события объединяются в тренд, что дает возможность создать авторитетный обобщающий контент.

Используется ли "News Historical Graph" в Google сегодня?

Конкретный интерфейс, показанный в патенте (поданном в 2004 году), скорее всего, устарел и не используется в таком виде. Однако базовые технологии, позволяющие Google отслеживать эволюцию тем и классифицировать контент, лежат в основе современных систем, таких как Google News и Topic Layer в Knowledge Graph.

Может ли система сравнивать разные поисковые запросы или накладывать другие данные?

Да, патент описывает возможность комбинирования графиков из разных поисковых запросов, чтобы увидеть связь между событиями. Также система может накладывать "Другие события" (Other Events), например, данные фондового рынка или статистику, для визуального выявления корреляций с новостями.

Учитывает ли система предпочтения пользователя?

Да, в патенте указано, что система может специально маркировать истории из источников, предпочитаемых пользователем (news sources preferred by the user). Это указывает на использование сигналов персонализации при представлении результатов.

Ограничивается ли этот патент только новостями?

Хотя основное внимание уделяется новостным статьям, в патенте указано, что описанные методы могут быть применены к любому типу документов или статей, например, к веб-страницам. Теоретически, это может применяться для визуализации эволюции любой темы в интернете.

Что такое "Wire stories" и почему они выделены?

Wire stories — это новости, поставляемые информационными агентствами (например, Reuters, AP). Многие издатели публикуют их без изменений. Выделение их в отдельную категорию позволяет Google (и пользователю) отличить стандартный репортаж агентства от уникальной журналистской работы конкретного издания.

Кто такой Кришна Бхарат (Krishna Bharat) и какова его роль?

Кришна Бхарат является одним из изобретателей этого патента и известен как основатель Google News. Его участие указывает на то, что описанные механизмы глубоко интегрированы в подход Google к обработке и представлению новостного контента.

Похожие патенты

Как Google News использует расширяемые блоки (Story Clusters) для агрегации разнообразного контента по одной теме
Патент Google описывает интерфейс для агрегации контента (например, Google News). Система группирует связанные документы в кластеры и представляет их в виде сворачиваемых блоков. В развернутом виде блок показывает разнообразные типы контента (статьи, видео, мнения, контекст) из разных источников, помогая пользователю всесторонне изучить тему.
  • US9678618B1
  • 2017-06-13
  • Мультимедиа

  • Семантика и интент

Как Google оценивает качество новостных источников, кластеризует статьи и ранжирует новости на основе свежести, оригинальности и авторитетности
Детальный разбор основополагающего патента Google News. Система оценивает источники по скорости реакции на события, оригинальности контента и авторитетности (ссылки, просмотры). Новостные сюжеты (кластеры) ранжируются по свежести и качеству источников. Статьи внутри сюжета сортируются с использованием «Модифицированной оценки свежести», которая дает значительное преимущество авторитетным изданиям.
  • US7568148B1
  • 2009-07-28
  • Свежесть контента

  • EEAT и качество

Как Google кластеризует новостные результаты для генерации блоков "Связанные темы" и "Категории"
Google анализирует результаты поиска по новостям и группирует статьи, освещающие одно и то же событие, в кластеры. Затем система извлекает общие ключевые слова из этих кластеров для формирования блока "Связанные темы" (Related Topics), помогая уточнить запрос. Одновременно определяется широкая категория новостей (например, "Спорт"), из которой предлагается дополнительный контент для расширения контекста.
  • US11194868B1
  • 2021-12-07
  • Семантика и интент

  • Свежесть контента

  • SERP

Как Google выбирает главное изображение для новостных статей и кластеров в Google News и Top Stories
Google использует многофакторную систему для выбора наилучшего изображения, представляющего новостную статью или кластер. Система фильтрует неподходящие изображения (рекламу, логотипы), анализирует контекст (подписи, Alt-текст, расположение рядом с заголовком) и оценивает технические параметры (размер, формат), чтобы выбрать изображение для показа в результатах поиска новостей.
  • US8775436B1
  • 2014-07-08
  • Мультимедиа

  • Семантика и интент

  • SERP

Как Google персонализирует, локализует и ранжирует новостной контент для Google News и Discover
Google использует систему для персонализации новостного контента, анализируя темы (используя Knowledge Graph), местоположения и даты публикации статей. Система создает динамические профили пользователей на основе истории чтения, применяя механизм «затухания» для устаревших интересов. Ранжирование учитывает релевантность, качество источника, популярность (количество просмотров) и свежесть контента.
  • US9569547B2
  • 2017-02-14
  • Персонализация

  • Свежесть контента

  • Knowledge Graph

Популярные патенты

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам
Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).
  • US11609949B2
  • 2023-03-21
  • Антиспам

  • SERP

  • Поведенческие сигналы

Как Google переносит авторитетность бренда и описательные термины между страницами одного сайта для улучшения ранжирования
Google использует механизмы для улучшения релевантности страниц путем переноса сигналов внутри сайта. Система распространяет "авторитетные" термины (например, бренд) с главной страницы на внутренние разделы и, наоборот, поднимает "высокоописательные" термины (например, адреса, категории, уникальные слова) с внутренних страниц на главную. Это позволяет ранжировать наиболее подходящую страницу сайта, даже если нужные ключевые слова на ней отсутствуют.
  • US7933890B2
  • 2011-04-26
  • Структура сайта

  • Техническое SEO

  • Индексация

Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
  • US7783639B1
  • 2010-08-24
  • Ссылки

  • Антиспам

  • EEAT и качество

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует погоду, время и местоположение для понимания истинного намерения пользователя и адаптации поисковой выдачи
Google анализирует, как физическое окружение (погода, время, местоположение) влияет на то, что ищут пользователи. Система выявляет корреляции между средой и поведением пользователей в прошлом (включая длительность кликов), чтобы лучше понять текущий интент многозначных запросов. Затем она переранжирует выдачу или переписывает запрос для предоставления наиболее релевантных результатов и рекламы.
  • US8898148B1
  • 2014-11-25
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google находит фактические ответы, начиная с потенциальных ответов и связывая их с запросами пользователей (Reverse Question Answering)
Google использует метод «обратного ответа на вопрос» для эффективного поиска фактов. Вместо глубокого анализа запроса система начинает с идентификации потенциальных ответов (например, дат, измерений) в индексе. Затем она определяет, для каких запросов эти ответы релевантны, анализируя, какие документы высоко ранжируются и получают клики по этим запросам. Это позволяет точно сопоставлять факты с разнообразными формулировками вопросов.
  • US9116996B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
  • US9128945B1
  • 2015-09-08
  • SERP

  • Поведенческие сигналы

  • EEAT и качество

seohardcore