
Google использует систему для связи медиаконтента (например, видео на YouTube) со структурированными данными из Базы Знаний (Knowledge Graph). Описывается, как создаются ассоциации между видео и сущностями путем анализа метаданных, что позволяет пользователям искать контент по идентификаторам сущностей и автоматически тегировать медиафайлы, улучшая их обнаруживаемость.
Патент решает проблему ограниченности традиционного поиска по ключевым словам для медиаконтента (например, видео). Зачастую предоставленные пользователями метаданные (заголовки, описания, теги) не полностью описывают содержание контента, что снижает эффективность поиска. Кроме того, патент направлен на автоматизацию процесса тегирования, уменьшая зависимость от ручного ввода тегов, который может быть подвержен ошибкам и неточностям.
Запатентована система, которая создает и хранит ассоциации между единицами контента (Content Items) в медиа-хранилище (Media Storage) (например, видео, плейлисты, каналы) и идентификаторами (Identifications или Textual identification strings) из базы знаний (Knowledge Database). Эти идентификаторы представляют сущности или темы. Система использует эти ассоциации для улучшения поиска медиаконтента и для автоматического тегирования контента.
Система работает путем сопоставления метаданных (заголовков, описаний) медиаконтента со строками в Knowledge Database. Найденные связи сохраняются в Хранилище Ассоциаций (Association Store). При выполнении поиска (по ключевому слову/метаданным или идентификатору сущности) система обращается к Association Store для извлечения релевантных единиц контента, связанных идентификаторов или и того, и другого. Также система включает механизм для автоматического тегирования контента с использованием связанных с ним идентификаторов из базы знаний.
Высокая. Связывание любого контента со структурированными данными (Графом Знаний) является фундаментом современного семантического поиска. Этот патент крайне актуален для платформ вроде YouTube (упоминаемый как "media sharing web site"), демонстрируя базовые механизмы того, как Google использует сущности для понимания и организации нетекстового контента.
Значительное влияние (7/10). Хотя патент сфокусирован на медиа-платформах, он раскрывает ключевые механизмы того, как Google ассоциирует контент с сущностями. Понимание этого критически важно для Video SEO и максимизации видимости контента путем обеспечения его корректного сопоставления с Графом Знаний.
Knowledge Database (например, /en/president_of_the_USA).Media Storage.Content Items и Identifications.Content Item, такие как заголовок (title), описание (description) или теги. Указывается, что они могут быть созданы загрузчиком или зрителем контента. Используются для создания ассоциаций.Identifications.Claim 1 (Независимый пункт): Описывает основную систему поиска и её компоненты.
Knowledge Database (с узлами и текстовыми строками идентификации), Media Storage (с контентом и метаданными, созданными пользователями) и Association Store.Association Store генерирует и хранит ассоциации между контентом и идентификаторами. Генерация основана на соответствии (meeting at least one matching criteria) между метаданными контента и идентификаторами.Search Retrieving Unit получает поисковый запрос.Association Retrieval Unit извлекает ассоциацию между Content Item и как минимум одной Textual identification string. Извлечение происходит, если запрос соответствует (matching) либо метаданным контента, либо идентификатору.Output Unit отображает и Content Item, и извлеченную Textual identification string в ответ на запрос.Claim 2, 3, 4 (Зависимые): Детализируют сценарий поиска по идентификатору.
Content Item на основе этой первой строки (Claim 3).Content Item (Claim 4). Это механизм для поиска связанных сущностей через общий контент.Claim 5, 6 (Зависимые): Детализируют сценарий поиска по метаданным.
Content Item (Claim 5).Content Item, который был идентифицирован по этим метаданным (Claim 6).Изобретение охватывает процессы как на этапе индексирования, так и на этапе обработки запроса для улучшения поиска на медиа-платформах (например, YouTube).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит основной процесс создания ассоциаций. Система анализирует Content Items (видео) и их Metadata (заголовки, описания) из Media Storage. Она сравнивает эти метаданные с данными в Knowledge Database для поиска соответствующих Identifications (сущностей). Найденные ассоциации сохраняются в Association Store. Также на этом этапе работает механизм автоматического тегирования (Tag Performing Unit), который сохраняет результаты в Tag Database.
QUNDERSTANDING – Понимание Запросов
Когда пользователь выполняет поиск на медиа-платформе, система анализирует запрос. Она может определить, что запрос сам по себе является Textual identification string (идентификатором сущности из базы знаний) или содержит метаданные.
RANKING – Ранжирование (Retrieval)
На этапе поиска (retrieval) компонент Association Retrieval Unit использует Association Store для нахождения релевантного контента. Если запрос является идентификатором, система находит связанные с ним видео. Если запрос соответствует метаданным, система находит видео и связанные с ним идентификаторы.
Входные данные:
Выходные данные:
Content Items).Identifications).Knowledge Database.predetermined condition) или эвристик, установленных имплементатором системы. В качестве примеров эвристик упоминаются контент, связанный с определенной темой, или контент с определенным количеством просмотров (view count).Процесс А: Создание Ассоциаций (Индексирование)
Content Item и его Metadata (заголовок, описание, теги) из Media Storage.Knowledge Database.matching criteria), связь между Content Item и соответствующим Identification сохраняется в Association Store.Процесс Б: Автоматическое Тегирование (Индексирование)
Tag Determination Unit) выбирает Content Item или группу для тегирования на основе заданных эвристик или условий.Identifications из Association Store.Tag Performing Unit) присваивает эти Identifications в качестве тегов к Content Item.Tag Database и может быть передана на медиа-сайт для отображения.Процесс В: Обработка Поискового Запроса (Реальное время)
Identification (ID1), система ищет в Association Store связанные Content Items и извлекает их. Она также может извлечь *другие* Identifications (ID2), связанные с этим же контентом (поиск связанных сущностей).Content Item (через ключевые слова/метаданные), система находит его и извлекает все связанные с ним Identifications из Association Store.Knowledge Database.Nodes), представляющие темы/сущности, и текстовые строки идентификации (Textual identification strings).view count) как эвристики для выбора контента для автоматического тегирования.Knowledge Database для создания ассоциаций. Конкретные алгоритмы сопоставления или пороги (matching criteria) в патенте не детализированы.predetermined conditions) или эвристики (heuristics) для выбора целевого контента.Knowledge Database. Качество и полнота этих метаданных критичны.Identifications позволяет находить его по запросам, связанным с этими сущностями, даже если точные ключевые слова отсутствуют в метаданных, но семантическая связь установлена через Association Store.Knowledge Database. Это повышает точность, полноту и консистентность тегов по сравнению с ручным вводом пользователями.Эти рекомендации критически важны для Video SEO (например, на YouTube).
Association Store.Identifications и использует их для автоматического тегирования.Knowledge Database.Knowledge Database.Патент подтверждает важность Entity-First подхода даже для медиаконтента. Успех в Video SEO зависит не только от оптимизации под ключевые слова, но и от того, насколько хорошо контент интегрирован в семантическую сеть Google. Правильная ассоциация с сущностями обеспечивает лучшую видимость в поиске по связанным темам и, вероятно, является сильным сигналом для систем рекомендаций медиа-платформы.
Сценарий: Оптимизация видеообзора технологического продукта на YouTube
Identifications в Knowledge Database. Ассоциации сохраняются в Association Store. Видео автоматически тегируется этими сущностями и становится доступным для поиска по запросам, связанным с любой из них.К каким платформам применим этот патент?
Патент описывает "media sharing web site" (сайт для обмена медиафайлами), что напрямую относится к таким платформам, как YouTube, а также к другим сервисам, хранящим видео, музыку или текст. Механизмы, описанные здесь, лежат в основе того, как эти платформы организуют контент.
Как именно система связывает видео с сущностью (Identification)?
Согласно патенту, система анализирует Metadata (метаданные) видео, такие как заголовок, описание и теги. Затем она выполняет сопоставление (matching) этих метаданных с данными в Knowledge Database. Если соответствие найдено, ассоциация сохраняется.
Что такое "Knowledge Database" в контексте этого патента?
Это структурированная база данных, использующая графовую модель, где узлы представляют темы или сущности, а связи – отношения между ними. Примерами являются Freebase (упомянутый в патенте) и современный Google Knowledge Graph.
В чем преимущество автоматического тегирования, описанного в патенте?
Автоматическое тегирование использует авторитетные идентификаторы из Knowledge Database. Это делает процесс масштабируемым, более точным и менее подверженным ошибкам или спаму по сравнению с ручным вводом тегов пользователями.
Может ли одно видео быть связано с несколькими сущностями?
Да. В патенте указано, что каждая единица контента может быть связана с одним или несколькими Identifications из базы знаний. Это позволяет точно описывать контент, затрагивающий несколько тем.
Как SEO-специалист может повлиять на процесс ассоциации видео с сущностями?
Ключевой способ влияния – это оптимизация метаданных (заголовков, описаний и тегов). Необходимо использовать четкие, недвусмысленные названия сущностей, соответствующие Knowledge Graph, и предоставлять достаточный контекст в описании, чтобы облегчить системе процесс сопоставления.
Что произойдет, если метаданные видео некачественные или отсутствуют?
Если метаданные некачественные (например, кликбейт или отсутствие описания), системе будет сложно найти соответствия в Knowledge Database. В результате видео не будет ассоциировано с релевантными сущностями, что негативно скажется на его обнаруживаемости.
Как работает поиск связанных сущностей?
Патент описывает механизм (Claim 4), где при поиске по первому идентификатору система находит связанный контент, а затем находит второй идентификатор, также связанный с этим контентом. Это позволяет пользователю узнать о дополнительных релевантных темах.
Влияет ли этот механизм на рекомендации видео?
Хотя патент напрямую не описывает систему рекомендаций, установление точных ассоциаций между видео и сущностями создает богатый набор данных. Логично предположить, что эти семантические связи используются системами рекомендаций для предложения релевантного контента по схожим темам.
Использует ли система распознавание образов или речи для создания ассоциаций?
В данном патенте не упоминается использование распознавания образов или анализа аудиодорожки. Фокус сделан исключительно на сопоставлении текстовых метаданных (заголовок, описание, теги) с базой знаний.

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
SERP
Семантика и интент

Персонализация
Мультимедиа
Поведенческие сигналы

Мультимедиа
Семантика и интент
Персонализация

Семантика и интент
Персонализация
Поведенческие сигналы

Ссылки
SERP

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Local SEO
Антиспам
Поведенческие сигналы

Поведенческие сигналы
Ссылки
SERP

Структура сайта
Техническое SEO
Ссылки

Поведенческие сигналы
SERP

EEAT и качество
Техническое SEO
Ссылки

Персонализация
Семантика и интент
Local SEO
