SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google агрегирует и фильтрует медиаконтент на основе подписок пользователя на платформах типа Google TV

THIRD PARTY CONTENT PROVIDER INTEGRATIONS (Интеграция сторонних поставщиков контента)
  • US9317571B2
  • Google LLC
  • 2012-08-24
  • 2016-04-19
  • Персонализация
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для унифицированного поиска медиаконтента (фильмы, сериалы) из различных источников (стриминговые сервисы, ТВ, локальные хранилища). Система локально определяет, к каким сервисам у пользователя есть доступ (подписки), и фильтрует результаты, показывая только тот контент, который пользователь реально может посмотреть. Это механизм обеспечения видимости контента в агрегированных медиа-платформах.

Описание

Какую проблему решает

Патент решает проблему фрагментации поиска медиаконтента. В условиях, когда контент распределен по многочисленным источникам (стриминговые сервисы, кабельное ТВ, локальные DVR) с различными моделями доступа (подписки, покупки), пользователям сложно найти, где доступен нужный фильм или сериал. Изобретение устраняет проблему "зашумленности" выдачи, исключая результаты, которые пользователь не может просмотреть из-за отсутствия доступа или подписки.

Что запатентовано

Запатентована система и метод для федеративного (объединенного) поиска медиаконтента. Суть изобретения заключается в механизме определения доступности контента локально на клиентском устройстве (Client Device) и использовании этой информации для фильтрации результатов из централизованной базы данных. Система идентифицирует доступные источники (например, активные подписки) и гарантирует, что в результатах поиска отображается только доступный контент (accessible content instances).

Как это работает

Система работает следующим образом:

  • Локальное определение доступа: Клиентское устройство (например, Google TV) определяет доступные источники. Это происходит путем опроса установленных приложений (например, проверка подписки в приложении Netflix), сканирования ТВ-каналов и анализа локального хранилища (DVR).
  • Генерация запроса: При поиске устройство формирует Media Content Query. Этот запрос включает не только ключевые слова, но и идентификаторы доступных источников (Accessible Content Source Identifiers) или данные о подписках (Subscription/Permission Data).
  • Централизованная фильтрация: Запрос отправляется на сервер (Media Information Server), который обращается к агрегированной базе данных (Media Information Database).
  • Выдача результатов: Сервер возвращает результаты, которые соответствуют ключевым словам И отфильтрованы так, чтобы включать только доступные пользователю источники.

Актуальность для SEO

Высокая для медиа-платформ. Проблема фрагментации контента и необходимость унифицированного поиска (например, в Google TV, Android TV) в 2025 году крайне актуальна. Описанный механизм является фундаментальным для работы современных ТВ-агрегаторов.

Важность для SEO

Влияние на стандартное веб-SEO (ранжирование сайтов в google.com) минимальное. Однако патент имеет критическое значение (7/10) для SEO и оптимизации видимости (Visibility Optimization) в рамках агрегированных медиа-платформ Google. Он описывает механизм, с помощью которого контент-провайдеры попадают в унифицированную поисковую выдачу на устройствах пользователей. Понимание этого механизма необходимо для медиа-компаний, стремящихся максимизировать охват своего контента через платформы Google.

Детальный разбор

Термины и определения

Accessible Content Identification Module (Модуль идентификации доступного контента)
Компонент на клиентском устройстве, отвечающий за локальное определение того, какие источники контента доступны пользователю.
Accessible Content Source Identifiers (Идентификаторы доступных источников контента)
Данные, включаемые в Media Content Query, которые сообщают серверу, из каких источников клиентское устройство может воспроизводить контент.
Aggregation Server (Сервер агрегации)
Сервер, который собирает метаданные о медиаконтенте из различных удаленных источников (Remote Content Sources).
Client Device (Клиентское устройство)
Устройство пользователя (например, ТВ-приставка, смарт-ТВ, планшет), на котором выполняется поиск и воспроизведение.
Content Provider (Поставщик контента)
Организация (например, Netflix Inc., кабельный оператор), предоставляющая один или несколько источников контента.
Content Source (Источник контента)
Конкретный канал доставки медиа (например, ТВ-канал, стриминговый сервис Netflix, локальный DVR).
Media Content Query (Запрос медиаконтента)
Запрос, отправляемый клиентом на сервер. Включает ключевые слова, идентификаторы доступных источников и фильтры.
Media Information Database (База данных медиаинформации)
Централизованное хранилище агрегированной информации о доступности контента из множества источников.
Media Information Server (Сервер медиаинформации)
Сервер, который обрабатывает Media Content Query, выполняет поиск и фильтрацию результатов.
Subscription/Permission Data (Данные о подписке/разрешениях)
Данные, хранящиеся локально или получаемые от приложений на клиенте, которые подтверждают наличие у пользователя доступа к платному контенту.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод, выполняемый клиентским устройством для представления медиаконтента.

  1. Отображение поискового интерфейса и получение ключевых слов для поиска медиаконтента (ТВ-программ/фильмов), доступного из различных источников, включая подписные.
  2. Генерация Media Search Query.
  3. Ключевой шаг: Определение локально на клиентском устройстве (determining locally at the client device) источников контента, доступных пользователю.
  4. Генерация Media Content Query. Этот запрос включает ключевые слова И subscription and permission data для доступных источников.
  5. Отправка Media Content Query в Media Information Database. База данных использует этот запрос для идентификации контента, доступного пользователю, на основе предоставленных данных о подписках.
  6. Получение отфильтрованных результатов.
  7. Представление списка доступных медиа-единиц.
  8. Предоставление возможности выбрать и отобразить контент с помощью приложения, связанного с источником этого контента.

Ядром изобретения является механизм локального определения профиля доступа пользователя (subscription and permission data) и его использование для фильтрации результатов из централизованной агрегированной базы данных. Это гарантирует, что пользователь видит только то, что может посмотреть.

Claim 12 (Зависимый от 1): Детализирует обработку обновлений доступности.

  1. Обнаружение изменения в доступных источниках контента (например, оформлена новая подписка).
  2. В ответ на это изменение, включение обновленных идентификаторов доступных источников в Media Content Query.

Это описывает механизм обновления, управляемый событиями, что оптимизирует коммуникацию между клиентом и сервером.

Claim 20 (Независимый пункт): Описывает метод с точки зрения серверной системы.

  1. Сервер получает Media Content Query от клиентского устройства, включающий ключевые слова и subscription and permission data.
  2. Подчеркивается, что доступные источники были определены на клиентском устройстве (например, на основе индикаций от локальных приложений).
  3. Сервер идентифицирует в базе данных единицы контента, доступные пользователю, на основе этих данных.
  4. Сервер предоставляет отфильтрованную информацию обратно клиентскому устройству.

Это подтверждает роль сервера: получение заранее определенного профиля доступа от клиента и использование его в качестве жесткого фильтра для глобальной базы данных.

Где и как применяется

Этот патент описывает специализированную поисковую систему (например, Google TV), функционирующую как агрегатор медиаконтента. Он не относится к стандартной архитектуре веб-поиска.

CRAWLING & INDEXING (Агрегация данных)
Aggregation Server выполняет функцию сбора данных, получая информацию о медиаконтенте (метаданные, доступность, URI) от удаленных источников (Remote Content Sources) — Netflix, Amazon, ТВ-сети. Эти данные индексируются и сохраняются в Media Information Database.

RANKING (Получение, Фильтрация и Ранжирование)
Это ядро патента. Процесс инициируется на Client Device:

  1. Локальная предобработка (Client): Устройство локально определяет доступные источники через Accessible Content Identification Module.
  2. Генерация запроса (Client): Формируется Media Content Query, обогащенный данными о доступности (Accessible Content Source Identifiers).
  3. Фильтрация (Server): Media Information Server извлекает релевантный контент и применяет критически важный фильтр на основе данных о доступности, предоставленных клиентом. Алгоритмы ранжирования по релевантности в патенте не описываются.

METASEARCH – Метапоиск и Смешивание
Система выполняет Метапоиск, объединяя данные из разных вертикалей (Стриминг, ТВ, Локальные источники) и смешивая результаты в унифицированном интерфейсе на Client Device. Она представляет различные экземпляры одного и того же контента (например, фильм доступен на Netflix и на локальном DVR) вместе.

Входные данные:

  • Ключевые слова пользователя (Media Search Query).
  • Локально определенные Subscription/Permission Data.
  • Список доступных ТВ-каналов (Accessible Channel List).
  • Данные о локальном контенте (Locally Stored Content Data).
  • Фильтры пользователя (Filters).

Выходные данные:

  • Унифицированный список информации о медиаконтенте, отфильтрованный по доступности для клиентского устройства.

На что влияет

  • Конкретные типы контента: Влияет на медиаконтент: фильмы, телешоу, потенциально музыку, доступные через подписные сервисы или вещательные каналы.
  • Специфические запросы: Влияет на запросы, связанные с поиском медиа (названия, актеры, жанры) внутри интерфейсов Smart TV.
  • Конкретные ниши или тематики: Индустрия медиа, развлечений, стриминговые сервисы и телевещание.

Когда применяется

  • Триггеры активации: Инициирование пользователем поиска в интерфейсе медиасистемы.
  • Условия работы: Механизм фильтрации по доступности активен всегда, так как цель состоит в том, чтобы показывать только доступный контент.
  • Обновления: Система активирует механизмы обновления при обнаружении изменений в доступных источниках (Claim 12) или изменениях в сохраненных фильтрах пользователя (Claim 14).

Пошаговый алгоритм

Фаза 1: Определение локальной доступности (Фоновый или периодический процесс на Client Device)

  1. Сканирование локальных источников: Устройство идентифицирует и каталогизирует контент на локальных хранилищах (DVR, медиасервер).
  2. Сканирование каналов: Устройство определяет доступные ТВ-сигналы для формирования Accessible Channel List.
  3. Опрос приложений: Устройство взаимодействует с установленными медиа-приложениями (например, Netflix) для получения индикации активных подписок (Subscription/Permission Data).
  4. Мониторинг изменений: Устройство отслеживает изменения в доступности (например, новая подписка, истекший пробный период).

Фаза 2: Обработка запроса (В реальном времени)

  1. Получение запроса: Клиентское устройство получает Media Search Query от пользователя.
  2. Локальный поиск (Параллельно): Устройство выполняет поиск совпадений в каталогизированной локальной базе данных.
  3. Генерация Media Content Query: Устройство генерирует запрос для удаленного сервера, включая:
    • Ключевые слова.
    • Текущие Accessible Content Source Identifiers (или обновления, если были обнаружены изменения).
    • Примененные Filters.
  4. Отправка запроса: Media Content Query отправляется на Media Information Server.
  5. Обработка на сервере: Сервер извлекает релевантные результаты из Media Information Database И фильтрует их, используя данные о доступности, предоставленные в запросе.
  6. Получение и Смешивание: Клиентское устройство получает отфильтрованные удаленные результаты и объединяет их с локальными результатами.
  7. Представление: Унифицированный список доступного контента представляется пользователю.
  8. Выбор и воспроизведение: По выбору пользователя запускается соответствующее приложение (например, приложение Netflix или локальный плеер) для отображения контента.

Какие данные и как использует

Данные на входе

Патент фокусируется на инфраструктуре агрегации и данных, необходимых для фильтрации по доступности.

  • Контентные факторы (Метаданные): Media Information Database полагается на агрегированные метаданные от поставщиков: Название, Актеры, Жанр, Рейтинг, Качество видео (HD/SD), Описание.
  • Факторы доступности (Ключевые данные):
    • Accessible Content Source Identifiers: Список источников, к которым у пользователя есть доступ.
    • Subscription/Permission Data: Данные, указывающие на активные подписки (полученные локально).
    • Accessible Channel List: Список доступных ТВ-каналов (просканированных локально).
  • Локальные факторы:
    • Locally Stored Content Data: Каталог контента на локальных устройствах (DVR).
  • Пользовательские и Системные факторы:
    • Device ID и User ID: Идентификаторы устройства и пользователя.
    • Filters: Пользовательские предпочтения или ограничения (Жанр, Стоимость, Рейтинг, Родительский контроль).

Какие метрики используются и как они считаются

Патент не описывает метрики ранжирования (такие как оценки релевантности или качества). Он фокусируется исключительно на бинарной фильтрации.

  • Проверка доступности (Accessibility Check): Бинарная проверка (Да/Нет). Выполняется сервером путем сопоставления идентификатора источника контента со списком Accessible Content Source Identifiers, предоставленным клиентом.
  • Проверка фильтров (Filter Check): Проверка на соответствие метаданных контента пользовательским ограничениям (Filters), таким как жанр, стоимость или рейтинг.

Выводы

  1. Инфраструктура для "Aggregator SEO": Патент описывает не алгоритмы веб-поиска, а инфраструктуру для федеративного поиска медиаконтента (Universal Search for Media). Это критически важно для оптимизации видимости контента внутри медиа-платформ Google (Aggregator SEO).
  2. Видимость зависит от интеграции и доступности: Ключевой вывод для медиакомпаний: видимость контента в этой системе зависит от (1) успешной синдикации метаданных в Media Information Database и (2) фактической доступности контента для пользователя (наличие подписки).
  3. Критическая важность метаданных: Система полагается на агрегированные метаданные. Точность и полнота предоставляемых данных (названия, актеры, жанры, качество) критичны для того, чтобы контент был обнаружен по соответствующим запросам и фильтрам.
  4. Децентрализованная (Локальная) проверка доступа: Google перекладывает задачу определения статуса подписки на клиентское устройство и приложения провайдеров. Это подчеркивает важность корректной работы клиентских приложений для подтверждения доступа.
  5. Унификация пользовательского опыта: Google стремится стать центральным хабом для поиска контента, объединяя разрозненные источники в единый интерфейс и устраняя результаты, которые пользователь не может просмотреть.

Практика

Best practices (это мы делаем)

Хотя патент не относится к традиционному веб-SEO, он критически важен для медиакомпаний и специалистов по Video SEO, занимающихся дистрибуцией контента и оптимизацией его видимости на платформах Google (Google TV/Android TV).

  • Обеспечение полной синдикации метаданных: Гарантировать, что весь каталог контента корректно агрегируется Google (индексируется в Media Information Database). Предоставлять полные, точные и актуальные метаданные (Title, Genre, Actors, Quality, Availability Windows, Pricing).
  • Оптимизация метаданных для поиска и фильтрации: Прорабатывать метаданные с учетом того, как пользователи ищут контент и какие фильтры используют (например, точные данные о рейтинге MPAA, качестве видео 4K/HD). Это гарантирует видимость контента при использовании пользователем Filters.
  • Корректная интеграция клиентских приложений: Убедиться, что приложение провайдера на платформе корректно и быстро сообщает системе о статусе подписки пользователя (Subscription/Permission Data). Согласно патенту, если локальное приложение не подтвердит доступ, контент будет отфильтрован.
  • Реализация Deep Linking: Обеспечить бесшовный переход пользователя из результатов унифицированного поиска непосредственно к воспроизведению контента внутри приложения провайдера.

Worst practices (это делать не надо)

  • Предоставление неточных или неполных метаданных: Ошибки в данных или отсутствие ключевых метаданных (например, актеров или жанра) приведут к тому, что контент не будет найден в унифицированном поиске.
  • Игнорирование статуса доступности: Ошибки в работе клиентского приложения, из-за которых статус подписки определяется неверно, приведут к исключению контента из выдачи для подписчиков или к негативному опыту для неподписанных пользователей.
  • Отсутствие интеграции с агрегатором: Если контент не индексируется в Media Information Database, он полностью исключается из этого механизма поиска и теряет значительную часть потенциальной аудитории на платформе.

Стратегическое значение

Патент подтверждает стратегию Google на агрегацию и контроль над точкой входа пользователя в потребление контента. Для SEO-стратегов в медиа-индустрии это означает, что оптимизация видимости выходит за рамки традиционного веб-поиска и включает в себя оптимизацию под агрегаторы (Aggregator SEO). Ключевым фактором успеха становится не только качество контента, но и качество технической интеграции и обмена данными с доминирующими платформами.

Практические примеры

Сценарий: Оптимизация видимости нового сериала стримингового сервиса "StreamX" на платформе Google TV.

  1. Задача: Максимизировать обнаружение нового сериала в унифицированном поиске Google TV.
  2. Действие (Интеграция данных): StreamX перед запуском передает Google полный пакет метаданных: название, эпизоды, полный список актеров (для поиска по персоналиям), жанр ("Sci-Fi"), качество (4K HDR) и модель доступа ("Подписка").
  3. Действие (Техническая интеграция): StreamX обновляет свое приложение для Google TV, чтобы оно корректно сообщало системе о наличии у пользователя активной подписки (Subscription/Permission Data).
  4. Результат (Для подписчика): Когда подписчик ищет "Лучшие Sci-Fi сериалы", Google TV знает о его подписке (локальное определение). Media Content Query включает ключевые слова и идентификатор доступности для StreamX. Сервер включает новый сериал StreamX в результаты поиска.
  5. Результат (Для неподписчика): Если у пользователя нет подписки, приложение сообщает об отсутствии доступа. Согласно логике патента, система исключает этот сериал из результатов унифицированного поиска для данного пользователя.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в обычном поиске Google (google.com)?

Нет, этот патент не влияет на традиционное веб-SEO. Он описывает инфраструктуру специализированной поисковой системы для медиаконтента (например, Google TV), которая агрегирует данные от сторонних поставщиков (стриминговых сервисов, ТВ-каналов). Алгоритмы ранжирования веб-страниц в нем не рассматриваются.

Какое значение этот патент имеет для SEO-специалистов?

Для специалистов по веб-SEO значение минимально. Однако для стратегов, работающих в медиа-индустрии (Video SEO, Aggregator SEO), он критически важен. Патент описывает механизм попадания контента в агрегированную выдачу медиа-платформ Google. Понимание этой архитектуры необходимо для максимизации видимости контента в этих экосистемах.

Как Google определяет, есть ли у пользователя доступ к контенту (например, подписка на Netflix)?

Ключевая особенность патента в том, что определение доступа происходит локально на клиентском устройстве (Client Device). Система (например, Google TV) опрашивает установленные приложения (например, приложение Netflix), чтобы получить подтверждение активной подписки (Subscription/Permission Data).

Что такое "Media Information Database"?

Это централизованная база данных, в которую Google агрегирует метаданные о контенте из множества различных источников. Она содержит информацию о том, какие фильмы и сериалы существуют, их описание, актеров, жанр, а также где (на каком сервисе) и когда (расписание ТВ-программ) они доступны.

Описывает ли патент, как ранжируются результаты внутри этого унифицированного поиска?

Нет. Патент фокусируется исключительно на механизме фильтрации по доступности. Он описывает, как исключить недоступные результаты, но не упоминает алгоритмы ранжирования (например, по релевантности, популярности или качеству) оставшихся результатов.

Что самое важное для дистрибуции контента в контексте этого патента?

Самое важное — это обеспечение полной интеграции и точности данных. Необходимо убедиться, что (1) ваш каталог корректно индексируется в Media Information Database с полными метаданными, и (2) ваше приложение на платформе корректно сообщает системе о статусе подписки пользователя, чтобы контент не был ошибочно отфильтрован.

Включает ли этот поиск контент с моего локального DVR или медиа-сервера?

Да. Патент предусматривает, что клиентское устройство сканирует и индексирует локальные источники (Local Content Sources), такие как DVR или медиа-серверы. Информация об этом контенте (Locally Stored Content Data) затем включается в унифицированную поисковую выдачу наряду с результатами из онлайн-источников.

Как система обрабатывает изменения, например, если я только что оформил новую подписку?

Система реагирует динамически. Когда клиентское устройство обнаруживает изменение в доступных источниках (например, активацию новой подписки), оно включает обновленные идентификаторы доступности в следующий Media Content Query (Claim 12). Это позволяет серверу немедленно учитывать новый источник при фильтрации.

В чем разница между "Media Search Query" и "Media Content Query"?

Media Search Query — это исходный запрос, введенный пользователем (например, название фильма). Media Content Query — это обогащенный запрос, который устройство отправляет на сервер. Он включает ключевые слова, а также критически важные данные о том, к каким источникам у пользователя есть доступ (Accessible Content Source Identifiers) и примененные фильтры.

Является ли эта система примером метапоиска?

Да, это классический пример вертикального метапоиска. Система не хранит сам контент, а собирает данные из множества различных источников (вертикалей), обрабатывает запрос пользователя с учетом его локального контекста (доступных подписок) и смешивает результаты в единый унифицированный интерфейс.

Похожие патенты

Как Google ранжирует стриминговые сервисы и поставщиков медиаконтента в результатах поиска
Google использует персонализированный алгоритм для ранжирования поставщиков медиаконтента (фильмов, сериалов). Система учитывает наличие у пользователя подписок, установленных приложений, историю взаимодействий, стоимость контента, поддержку глубоких ссылок и популярность сервиса, чтобы определить, какие ссылки на просмотр показать первыми в выдаче.
  • US20170364598A1
  • 2017-12-21
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google агрегирует данные из разных индексов для создания специализированной выдачи по медиазапросам (Фильмы, Сериалы)
Google использует архитектуру для обработки медиазапросов (фильмы, сериалы). Система определяет, что запрос связан с медиа, и одновременно отправляет запросы в разные корпусы данных (структурированные данные, веб-индекс, картинки, расписания). Затем результаты агрегируются в единый специализированный интерфейс (например, Knowledge Panel или детальная страница сущности), предоставляя пользователю сводную информацию из разных источников.
  • US8533761B1
  • 2013-09-10
  • Knowledge Graph

  • Мультимедиа

  • Семантика и интент

Как Google использует контент, который вы смотрите (например, на ТВ), для автоматического переписывания и персонализации ваших поисковых запросов
Google может анализировать контент (фильмы, шоу, аудио), который пользователь потребляет на одном устройстве (например, ТВ), и использовать эту информацию как контекст для уточнения последующих поисковых запросов. Система распознает аудиовизуальный контекст и автоматически дополняет неоднозначные запросы пользователя, чтобы предоставить более релевантные результаты, в том числе на связанных устройствах (например, смартфоне).
  • US9244977B2
  • 2016-01-26
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google оптимизирует индексы медиа-контента для быстрого поиска и предотвращения перегрузки системы (Clumping)
Патент Google, описывающий инфраструктурную оптимизацию баз данных для сопоставления медиа (видео/аудио). Система использует машинное обучение на тренировочных данных для выбора оптимальных ключей поиска. Цель — предотвратить "clumping" (когда один ключ связан со слишком многими файлами), обеспечивая быстрый и эффективный поиск по отпечаткам контента.
  • US8184953B1
  • 2012-05-22
  • Индексация

  • Мультимедиа

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Популярные патенты

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google автоматически выбирает категории и контент для страниц сущностей, комбинируя данные о поведении пользователей и Knowledge Graph
Google использует механизм для автоматического создания страниц о сущностях (например, о фильмах или персонажах). Система определяет, какие категории (свойства) сущности наиболее интересны пользователям, сравнивая данные из Knowledge Graph с данными о том, что пользователи ищут или смотрят вместе с этой сущностью. Затем она наполняет эти категории популярным контентом.
  • US11036743B2
  • 2021-06-15
  • Knowledge Graph

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует контент веб-страниц для генерации, верификации и адаптации AI-ответов в поиске (SGE/AI Overviews)
Google использует Большие Языковые Модели (LLM) для создания генеративных сводок (AI Overviews/SGE). Для обеспечения точности система не полагается только на знания LLM, а обрабатывает контент из актуальных результатов поиска (SRDs). Патент описывает архитектуру этого процесса: как выбираются источники, как генерируется сводка на их основе (Grounding), как проверяется информация для добавления ссылок (Verification), и как ответ адаптируется под контекст и действия пользователя.
  • US20250005303A1
  • 2025-01-02
  • SERP

  • EEAT и качество

  • Персонализация

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google использует анализ многословных фраз для улучшения подбора синонимов с учетом грамматического согласования
Google анализирует, как пользователи одновременно меняют несколько слов в запросе (например, при изменении числа или рода). Подтверждая, что каждое измененное слово является лексическим или семантическим вариантом оригинала, Google идентифицирует «синонимы с N-граммным согласованием». Это позволяет системе улучшить понимание синонимов отдельных слов, даже если эти слова редко меняются поодиночке в определенных контекстах.
  • US7925498B1
  • 2011-04-12
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google динамически изменяет вес синонимов в ранжировании на основе поведения пользователей
Google не присваивает фиксированный вес синонимам (замещающим терминам) при ранжировании. Вес синонима динамически корректируется для каждого документа в зависимости от того, насколько релевантен исходный термин запроса этому документу. Эта релевантность определяется на основе поведенческих данных (клики, время просмотра), что позволяет точнее интерпретировать значение синонимов в контексте конкретной страницы.
  • US9116957B1
  • 2015-08-25
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

seohardcore