Как Google агрегирует данные из разных индексов для создания специализированной выдачи по медиазапросам (Фильмы, Сериалы)

AGGREGATING MEDIA INFORMATION (Агрегирование медиаинформации)

US8533761B1
Google LLC
2007-04-30
2013-09-10

Google использует архитектуру для обработки медиазапросов (фильмы, сериалы). Система определяет, что запрос связан с медиа, и одновременно отправляет запросы в разные корпусы данных (структурированные данные, веб-индекс, картинки, расписания). Затем результаты агрегируются в единый специализированный интерфейс (например, Knowledge Panel или детальная страница сущности), предоставляя пользователю сводную информацию из разных источников.

Какую проблему решает

Патент решает проблему предоставления разрозненной информации в ответ на медиазапросы (например, о фильмах, сериалах, актерах). Вместо того чтобы заставлять пользователя искать расписание в одном месте, изображения в другом, а обзоры в третьем, система улучшает пользовательский опыт, предоставляя агрегированную сводку из различных источников в едином, специализированном интерфейсе.

Что запатентовано

Запатентована система и метод агрегации информации о медиаобъектах из различных корпусов данных (plurality of different corpuses). Когда система получает запрос и идентифицирует его как медиа-связанный (media-related), она параллельно опрашивает разные источники данных (например, структурированную базу данных, веб-индекс, индекс изображений) и объединяет полученные результаты в специализированный формат отображения.

Как это работает

Система функционирует следующим образом:

Триггер: Определяется, что входящий запрос является media-related.
Идентификация: Идентифицируется конкретный медиаобъект (media-related object), например, фильм или сериал.
Параллельный поиск: Система отправляет запросы одновременно в несколько различных корпусов данных (например, в базу данных расписаний, индекс изображений, веб-индекс).
Агрегация: Компонент Page Formatter (включающий Search Result Aggregator) собирает полученные результаты.
Форматирование: Результаты объединяются в единый интерфейс (например, в виде One Box или детальной страницы), где для каждого типа контента выделена своя отдельная область (distinct area).

Актуальность для SEO

Высокая. Описанная архитектура является фундаментальной для реализации Universal Search (Универсального поиска) и Blending (Смешивания результатов). Этот патент описывает базовые механизмы, лежащие в основе создания современных SERP features, таких как Knowledge Panels, карусели изображений и специализированные блоки для сущностей (фильмы, книги, музыка). Агрегация данных из разных индексов критически важна для современного поиска Google.

Важность для SEO

Патент имеет высокое стратегическое значение (7.5/10) для понимания того, как Google формирует выдачу для запросов, связанных с сущностями. Он не описывает алгоритмы ранжирования стандартных веб-страниц, но объясняет архитектуру, которая позволяет Google создавать богатые результаты (Rich Results) и SERP features. Это напрямую влияет на то, как пользователи взаимодействуют с выдачей, и определяет критическую важность оптимизации контента не только для веб-поиска, но и для вертикальных индексов (картинки, видео).

Термины и определения

Media-related object (Медиа-связанный объект): Сущность, к которой относится запрос, такая как телевизионная программа, фильм, актер или режиссер.
Plurality of different corpuses (Множество различных корпусов): Несколько различных источников данных или индексов, которые система опрашивает параллельно. Например, веб-индекс, индекс изображений, база данных структурированной информации.
Structured corpus (Структурированный корпус): База данных, содержащая организованную информацию о медиаобъектах, такую как расписание программ, списки актеров, даты выхода.
Unstructured corpus (Неструктурированный корпус): Неструктурированные данные, такие как контент веб-страниц (веб-индекс).
One Box: (Термин используется в описании патента). Специально отформатированный блок результатов поиска, интегрированный в основную выдачу, который отличается от стандартного списка синих ссылок.
Page Formatter (Формировщик страницы): Компонент системы, отвечающий за агрегацию результатов из разных корпусов и генерацию кода (например, Markup) для их отображения в едином пользовательском интерфейсе.
Head End (Головная станция/Провайдер): Источник программирования для пользователя (например, локальный кабельный провайдер), используемый для предоставления точного локального расписания.
Crawler и Classifier (Краулер и Классификатор): Компоненты для сбора контента из сети (Crawler) и его последующего анализа и категоризации (Classifier) для хранения в соответствующих корпусах.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обработки поискового запроса и генерации агрегированной выдачи.

Система получает первый поисковый запрос и определяет, является ли он медиа-связанным (media-related).
Если ДА: Идентифицируется media-related object.
Система собирает результаты поиска из plurality of different corpuses. (Результаты включают список эпизодов, даты/время показов, обзор программы, а также веб-контент/изображения, полученные через второй запрос, основанный на первом).
Генерируется код для форматирования этих разнородных результатов для совместного отображения на веб-странице.
Формат отображения отличается от формата для запросов, которые не были определены как медиа-связанные.
Код обеспечивает отображение результатов из каждого корпуса в отдельной, отличной от других области дисплея (distinct area).

Claim 3 (Зависимый от 1): Уточняет типы корпусов. Сбор данных происходит как минимум из одного структурированного (structured corpus) и одного неструктурированного корпуса (unstructured corpus).

Claim 6 (Независимый пункт): Описывает метод с фокусом на параллельном поиске и агрегации.

Получение запроса и определение его связи с медиапрограммой.
Отправка запросов к поисковым системам, адресующим множество корпусов. Подчеркивается, что для каждого корпуса выполняется отдельный поиск (separate search is conducted for each corpus).
Получение множества результатов в ответ на эти отдельные поиски.
Агрегация результатов из разных корпусов для одновременного отображения в смежных областях (adjacent areas).
Агрегация включает идентификацию отдельных областей (distinct areas) для группировок результатов из каждого корпуса и генерацию кода для создания веб-страницы.

Где и как применяется

Изобретение затрагивает несколько ключевых этапов поисковой архитектуры, обеспечивая механизм Универсального поиска.

CRAWLING и INDEXING
На этих этапах Crawler собирает данные (веб-страницы, изображения, данные от провайдеров расписаний). Classifier определяет тип контента и направляет его в соответствующие корпусы (Structured corpus, Unstructured corpus, индекс изображений).

QUNDERSTANDING – Понимание Запросов
Система должна определить, что запрос является media-related (триггер для активации механизма) и идентифицировать соответствующий media-related object (сущность).

RANKING – Ранжирование
Система генерирует внутренние запросы и отправляет их параллельно в соответствующие корпусы. Каждый корпус (Веб, Картинки, Структурированные данные) выполняет свой собственный поиск и ранжирование.

METASEARCH – Метапоиск и Смешивание
Это основной этап применения патента. Search result aggregator (часть Page Formatter) собирает Топ-N результаты от каждого задействованного корпуса. Page Formatter определяет макет (layout) страницы и генерирует код (Markup) для отображения агрегированных результатов в едином интерфейсе (например, One Box или детальная страница сущности).

Входные данные:

Исходный поисковый запрос пользователя.
Данные из различных корпусов.
Информация о пользователе (местоположение для определения локального Head end).

Выходные данные:

Код (Markup) для отображения агрегированной страницы, содержащей результаты из множества различных источников.

На что влияет

Конкретные типы контента и ниши: В первую очередь влияет на отображение информации о сущностях в нише развлечений (Entertainment), таких как фильмы, сериалы, актеры, режиссеры.
Специфические запросы: Информационные и навигационные запросы, связанные с медиа-сущностями (например, "the tonight show", "актеры сериала lost").
Определенные форматы контента: Патент описывает архитектуру, которая позволяет создавать SERP features, такие как Knowledge Panels, карусели изображений и видео, списки эпизодов и расписания показов.

Когда применяется

Триггеры активации: Алгоритм активируется, когда система с достаточной уверенностью определяет, что запрос является media-related.
Условия работы алгоритма: В описании патента указано, что это может быть основано на совпадении с терминами в "белом списке" (whitelist) медиа-терминов, использовании специальных префиксов (например, "tv:") или наличии в запросе других индикаторов (название телесети, имя актера).

Пошаговый алгоритм

Получение запроса: Система получает поисковый запрос от пользователя.
Определение типа запроса: Система анализирует запрос, чтобы определить, является ли он медиа-связанным.
Обработка не-медиа запроса: Если запрос не связан с медиа, возвращаются стандартные результаты поиска.
Идентификация медиаобъекта: Если запрос связан с медиа, система идентифицирует соответствующий media-related object (сущность).
Определение контекста (Опционально): Проверяется местоположение пользователя или его провайдер (Head end) для локализации расписаний.
Параллельный поиск по корпусам: Система генерирует и отправляет один или несколько внутренних запросов к различным корпусам данных. Для каждого корпуса выполняется отдельный поиск. Может генерироваться вторичный запрос для поиска изображений.
Сбор результатов: Система получает наборы результатов от каждого корпуса.
Агрегация результатов: Компонент Page Formatter агрегирует полученные разнородные результаты.
Генерация интерфейса: Page Formatter генерирует код для отображения агрегированных результатов в едином интерфейсе. Интерфейс структурирован так, чтобы выделять отдельные области (distinct areas) для каждого типа данных.
Отображение: Агрегированная страница предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на агрегации данных из различных источников:

Контентные факторы (Неструктурированный корпус): Текст веб-страниц, сниппеты, URL. Используются для заполнения блока веб-результатов (Web Data).
Структурные факторы (Структурированный корпус): Критически важные данные. Включают расписания программ (Scheduled Data), метаданные фильмов и сериалов (актеры, режиссеры, даты выхода), биографии (Structured Media Content).
Мультимедиа факторы: Изображения и видео, полученные из соответствующих индексов (Image corpus, Video corpus).
Географические факторы / Пользовательские факторы: Упоминается использование информации о местоположении пользователя и провайдере услуг (Head end) для локализации результатов, в частности, расписаний ТВ-программ.

Какие метрики используются и как они считаются

Патент описывает архитектуру агрегации и форматирования, а не метрики ранжирования.

Определение медиа-интента: Система использует метрику (не детализированную в патенте) для определения, является ли запрос media-related. Упоминается использование "белого списка" (whitelist) терминов.

Конкретные формулы или алгоритмы расчета оценок ранжирования внутри каждого корпуса в патенте не приводятся.

Архитектура Универсального Поиска: Патент описывает фундаментальный механизм того, как Google реализует Universal Search и Blended Search для специфических вертикалей, в данном случае — медиа. Это не алгоритм ранжирования, а механизм формирования выдачи.
Параллельный опрос множественных корпусов: Ключевой концепцией является одновременный опрос различных индексов (plurality of different corpuses) — веб, картинки, структурированные данные — для ответа на один запрос пользователя.
Идентификация интента как триггер: Определение запроса как media-related переключает логику обработки запроса со стандартного поиска на специализированный процесс агрегации и меняет формат представления результатов.
Фокус на сущностях (Entity-Oriented): Патент демонстрирует подход, ориентированный на идентификацию сущностей (media-related object) и агрегацию всей доступной информации вокруг них. Это является архитектурной основой для работы Knowledge Graph и отображения Knowledge Panels.
Важность структурированных данных: Явное разделение на structured corpus и unstructured corpus подчеркивает, что структурированные данные критически важны для формирования информативных и точных агрегированных ответов.

Best practices (это мы делаем)

Оптимизация под сущности (Entity Optimization): Необходимо работать над тем, чтобы ваши медиа-сущности (фильмы, сериалы, ключевые персоны) были четко определены и распознаны Google. Это увеличивает вероятность формирования агрегированной выдачи по связанным запросам и использования вашего контента в ней.
Использование структурированных данных (Schema.org): Активно внедряйте микроразметку (Movie, TVSeries, Episode, Person), чтобы предоставлять Google данные для Structured corpus. Это помогает заполнять блоки с расписаниями, списками актеров и эпизодов в агрегированной выдаче.
Оптимизация в вертикальных поисках (Images/Video SEO): Поскольку система агрегирует данные из разных корпусов, критически важно иметь сильное присутствие в Google Images и Video/YouTube. Оптимизируйте изображения (постеры, кадры) и видео (трейлеры, обзоры) — их метаданные, качество и релевантность — чтобы они отбирались для показа в агрегированных блоках.
Обеспечение согласованности данных: Убедитесь, что информация о сущности согласована на вашем сайте, в социальных сетях и авторитетных базах данных (например, iMDB, Wikipedia), чтобы укрепить сигналы для Structured corpus.

Worst practices (это делать не надо)

Игнорирование вертикальных поисков: Фокусировка исключительно на ранжировании в основном веб-поиске и игнорирование оптимизации изображений и видео. Это приведет к потере видимости в агрегированных блоках, которые часто занимают значительную часть выдачи по медиазапросам.
Отсутствие или ошибки в микроразметке: Непредоставление структурированных данных для медиаконтента усложняет Google извлечение точной информации для заполнения специализированных блоков, снижая шансы на участие в агрегированной выдаче.
Фокус только на ключевых словах, а не на сущностях: Оптимизация страниц под текстовые запросы без учета связей между сущностями. Система работает на уровне объектов (media-related object), поэтому важно выстраивать эти связи.

Стратегическое значение

Патент подтверждает стратегию Google по переходу от выдачи в виде "10 синих ссылок" к богатой, агрегированной выдаче, основанной на сущностях и намерениях пользователя. Он описывает архитектуру, которая позволяет Google отвечать на запрос, используя наиболее подходящие типы контента из разных индексов. Для Senior SEO-специалистов это подчеркивает необходимость мыслить за пределами традиционного веб-поиска и фокусироваться на общей видимости сущности (Entity Visibility) во всех релевантных корпусах данных Google (Web, Images, Video, Structured Data).

Практические примеры

Сценарий: Оптимизация страницы нового сериала на сайте стримингового сервиса.

Цель: Максимизировать видимость сериала в агрегированной выдаче Google по его названию.
Действия по Structured Corpus: Внедрить детальную разметку Schema.org (TVSeries для главной страницы сериала, Episode для каждой серии с указанием дат выхода, Person для актеров).
Действия по Image Corpus: Подготовить высококачественные постеры и кадры. Оптимизировать их (размер, формат, alt-тексты, названия файлов) и разместить на страницах сериала и эпизодов. Добавить их в Image Sitemap.
Действия по Video Corpus: Разместить официальный трейлер на YouTube, оптимизировать его заголовок и метаданные. Внедрить разметку VideoObject на сайте.
Ожидаемый результат: При запросе названия сериала Google формирует агрегированную выдачу (Knowledge Panel или специализированный блок). Данные из микроразметки используются для заполнения списка эпизодов и информации об актерах. Оптимизированные изображения попадают в карусель Google Images, а трейлер — в блок Google Video. Сайт сервиса получает видимость через эти агрегированные элементы.

Что такое "множество различных корпусов" (plurality of different corpuses) в контексте этого патента?

Это означает, что Google использует несколько независимых баз данных или индексов для ответа на один запрос. В патенте упоминаются структурированный корпус (например, база данных с расписаниями и метаданными фильмов), неструктурированный корпус (веб-индекс), а также корпусы изображений и видео. Система опрашивает их параллельно.

Описывает ли этот патент Knowledge Panel (Сеть знаний)?

Хотя термин Knowledge Panel не используется, патент описывает архитектуру, которая позволяет создавать такие элементы. Агрегация структурированных данных, изображений и веб-результатов о конкретном медиаобъекте в единый специализированный интерфейс (описанный в патенте как One Box или детальная страница) функционально соответствует тому, как работает Knowledge Panel для фильмов и сериалов.

Как Google определяет, что запрос является "media-related"?

Патент не дает исчерпывающего списка факторов, но упоминает несколько механизмов. Это может быть совпадение с "белым списком" (whitelist) известных медиа-терминов, использование пользователем специальных префиксов (например, "tv:"), или наличие в запросе других индикаторов, таких как название телеканала или имя известного актера.

Как этот патент связан с Universal Search или Blended Search?

Этот патент описывает конкретную реализацию архитектуры Universal Search для медиа-вертикали. Он детализирует, как именно происходит смешивание (Blending): параллельный опрос разных корпусов и последующая агрегация результатов с помощью Page Formatter в единый интерфейс.

Влияет ли этот патент на ранжирование моего сайта в обычном веб-поиске?

Напрямую нет. Патент не описывает алгоритмы ранжирования внутри веб-корпуса. Однако он описывает механизм, который может существенно изменить вид поисковой выдачи (SERP) по медиазапросам. Появление крупных агрегированных блоков может снизить CTR традиционных органических результатов, даже если их позиции не изменились.

Что самое важное для SEO специалиста в этом патенте?

Самое важное — это понимание того, что для достижения видимости по запросам, связанным с сущностями, недостаточно оптимизации только под веб-поиск. Необходимо обеспечить присутствие контента во всех релевантных корпусах (Images, Video) и предоставлять точные структурированные данные, чтобы участвовать в формировании агрегированной выдачи.

Как я могу оптимизировать свой контент, чтобы он попадал в эти агрегированные блоки?

Ключевыми являются три направления. Первое — внедрение микроразметки (Schema.org), чтобы предоставлять данные для Structured corpus. Второе — оптимизация изображений (качество, метаданные, alt-тексты) для попадания в Image corpus. Третье — оптимизация видеоконтента (например, на YouTube) для попадания в Video corpus.

Что такое "Structured Corpus" и как Google его получает?

Structured Corpus — это база данных, содержащая факты о медиаобъектах (расписания, актеры, даты выхода). Google может получать эти данные путем парсинга веб-страниц (особенно с микроразметкой), из фидов данных от партнеров (например, стриминговых сервисов или провайдеров расписаний), а также из авторитетных источников типа Wikipedia или iMDB.

Что подразумевается под генерацией "второго запроса" на основе первого?

Это означает, что система может модифицировать или генерировать новые запросы для более эффективного поиска в специализированных корпусах. Например, если первый запрос — имя актера, второй запрос для корпуса изображений может быть сформулирован так, чтобы найти именно фотографии этого актера, а не его однофамильцев, путем добавления уточняющих терминов.

Применяется ли эта технология только к фильмам и сериалам?

Патент сфокусирован на медиаинформации (фильмы, ТВ, актеры) в качестве примера реализации. Однако описанная архитектура — параллельный опрос разных корпусов и агрегация результатов для специфического интента — является универсальной и применяется Google во многих других вертикалях (например, Покупки, Локальный поиск, Погода, Спорт).

Как Google агрегирует и фильтрует медиаконтент на основе подписок пользователя на платформах типа Google TV

Google использует систему для унифицированного поиска медиаконтента (фильмы, сериалы) из различных источников (стриминговые сервисы, ТВ, локальные хранилища). Система локально определяет, к каким сервисам у пользователя есть доступ (подписки), и фильтрует результаты, показывая только тот контент, который пользователь реально может посмотреть. Это механизм обеспечения видимости контента в агрегированных медиа-платформах.

US9317571B2
2016-04-19

Персонализация
Мультимедиа

Как Google использует машинное обучение для автоматического расширения запросов о фильмах и сериалах и показа связанного контента

Google использует систему для распознавания запросов, связанных с медиа (фильмы, сериалы). Если запрос идентифицирован как медийный, система автоматически расширяет его, добавляя семантически связанные термины (например, похожие шоу, актеров, жанры), найденные с помощью обученной модели машинного обучения. Это позволяет возвращать более широкий и релевантный набор результатов, даже если исходный запрос был узким.

US8484192B1
2013-07-09

Семантика и интент
Мультимедиа
Knowledge Graph

Как Google использует данные веб-поиска для распознавания сущностей в специализированных вертикалях (на примере поиска медиаконтента)

Google использует двухэтапный процесс для ответа на описательные запросы в специализированных поисках (например, поиск фильмов по сюжету). Сначала система ищет информацию в основном веб-индексе, анализирует топовые результаты для выявления релевантных сущностей (названий фильмов), а затем использует эти сущности для поиска в специализированной базе данных.

US9063984B1
2015-06-23

Семантика и интент
Мультимедиа
Индексация

Как Google агрегирует поисковые подсказки из нескольких специализированных поисковых сервисов одновременно

Патент Google описывает инфраструктуру для улучшения поисковых подсказок (Autocomplete). Когда пользователь вводит текст, система одновременно опрашивает несколько специализированных поисковых сервисов (например, веб-поиск, вертикальный поиск или сервис прямых URL). Полученные результаты агрегируются и отображаются в отдельных секциях интерфейса, а выбор пользователя направляется строго в соответствующий сервис.

US8533173B2
2013-09-10

Как Google оптимизирует индексы медиа-контента для быстрого поиска и предотвращения перегрузки системы (Clumping)

Патент Google, описывающий инфраструктурную оптимизацию баз данных для сопоставления медиа (видео/аудио). Система использует машинное обучение на тренировочных данных для выбора оптимальных ключей поиска. Цель — предотвратить "clumping" (когда один ключ связан со слишком многими файлами), обеспечивая быстрый и эффективный поиск по отпечаткам контента.

US8184953B1
2012-05-22

Индексация
Мультимедиа

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи

Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.

US8825639B2
2014-09-02

Персонализация
EEAT и качество
Поведенческие сигналы

Как Google решает, показывать ли прямой ответ, анализируя частоту использования естественного языка в исторических запросах о факте

Google анализирует исторические данные о том, как пользователи ищут конкретный факт. Если они часто используют естественный язык (например, «какая высота у Эйфелевой башни»), система считает, что пользователи действительно ищут этот факт. На основе этого рассчитывается «Оценка поиска фактов» (Fact-Seeking Score). Эта оценка используется как сигнал ранжирования, чтобы решить, нужно ли показывать прямой ответ (Factual Answer) и насколько высоко его разместить в результатах поиска.

US9396235B1
2016-07-19

Семантика и интент
SERP
Поведенческие сигналы

Как Google использует данные о кликах разных групп пользователей (популяций) для локализации и персонализации ранжирования

Google адаптирует результаты поиска, анализируя, как разные группы пользователей (популяции), определяемые по местоположению, языку или демографии, взаимодействуют с выдачей. Система рассчитывает «Сигнал Популяции» (Population Signal) на основе исторических кликов группы и корректирует ранжирование. Также используется механизм сглаживания для компенсации нехватки данных по конкретным группам.

US7454417B2
2008-11-18

Персонализация
Поведенческие сигналы
SERP

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования

Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.

US7783644B1
2010-08-24

Поведенческие сигналы
Индексация
Семантика и интент

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента

Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).

US10318543B1
2019-06-11

Ссылки
Индексация
Мультимедиа

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности

Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.

US7657520B2
2010-02-02

SERP
EEAT и качество
Поведенческие сигналы

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов

Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.

US9436709B1
2016-09-06

EEAT и качество
Поведенческие сигналы

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей

Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.

US9244972B1
2016-01-26

EEAT и качество
Семантика и интент
SERP

Как Google оценивает и выбирает контент для Featured Snippets (Блоков с ответами) на основе консенсуса выдачи

Google использует систему для выбора и оценки Featured Snippets. Система анализирует топовые результаты поиска, чтобы предсказать, какие термины должны быть в ответе (Answer Terms). Затем она оценивает отрывки текста, учитывая совпадение с запросом, наличие предсказанных терминов ответа (консенсус топа), качество исходного сайта, форматирование и языковую модель контента.

US9940367B1
2018-04-10

SERP
Семантика и интент
EEAT и качество

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска

Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.

US8117195B1
2012-02-14

EEAT и качество
Антиспам
Ссылки