
Google использует библиографические данные (название, актеры, длина) для поиска и идентификации конкретных видео на веб-страницах. Система анализирует текст, расположенный рядом с видеоплеером («associated text»), и вычисляет «оценку совпадения» (Occurrence Score), чтобы точно понять, какой именно фильм, клип или эпизод представлен на странице.
Патент решает проблему низкой точности (precision) результатов видеопоиска, вызванную недостатком метаданных и неоднозначностью описаний видеоконтента в интернете. Задача — разработать механизм для точной идентификации того, что конкретное видео на веб-странице соответствует известному видео-объекту (например, конкретному фильму, музыкальному клипу или эпизоду телешоу), описанному в базе библиографических данных.
Запатентована система идентификации видеоконтента (Video Identification Engine). Она сопоставляет видео, найденные на веб-ресурсах, с записями в базе библиографических данных (Database of Video Bibliographic Entries). Для этого система генерирует поисковые запросы на основе библиографических данных (например, название, режиссер, актеры), находит потенциальные ресурсы и вычисляет Occurrence Score. Эта оценка определяет, насколько хорошо библиографические данные совпадают с текстом, ассоциированным с видео на странице.
Система работает в несколько этапов:
Refinement Engine.adjacent text) с видеоконтентом.phrase boundaries).Высокая. Точная идентификация видеоконтента и его привязка к сущностям (Entities) в Knowledge Graph является критически важной задачей для Google. Это необходимо для функционирования вертикального поиска по видео, формирования видео-каруселей и других обогащенных результатов (Rich Results). Описанные методы анализа окружающего текста остаются актуальными для извлечения информации (Information Extraction).
Патент имеет высокое значение для SEO, особенно для Video SEO. Он детально описывает механизм, который Google использует для понимания того, какое именно видео размещено на странице. Если система не сможет точно сопоставить видео с известной библиографической записью (сущностью), видимость этого видео в специализированных поисковых вертикалях и блоках будет крайне ограничена. Патент дает четкие указания на важность текста, расположенного в непосредственной близости к видеоплееру.
Adjacent Text.Query Refinement) для исходного запроса с целью улучшения качества поиска. Анализирует логи поисковых сессий.Claim 1 (Независимый пункт): Описывает основной метод идентификации видео.
Occurrence Score для каждого ресурса. Оценка основана на трех ключевых факторах: adjacent) к видеоконтенту на ресурсе.uniform resource locator) ресурса.Occurrence Score удовлетворяет пороговому значению.Claim 3 (Зависимый): Уточняет, что сформулированный запрос может быть основан на уточнениях запроса (query refinements) для терминов из определенного поля библиографической записи.
Система может использовать данные из логов поиска (через Refinement Engine), чтобы понять, как лучше сформулировать запрос для поиска конкретного видео, а не просто использовать его название напрямую.
Claim 4 (Зависимый): Уточняет, что Occurrence Score основан на дифференцированном взвешивании полей библиографической записи.
Совпадение по одним полям (например, Название) может иметь больший вес в итоговой оценке, чем совпадение по другим (например, Актер второго плана).
Claim 5 (Зависимый): Уточняет, что Occurrence Score зависит от того, связан ли ассоциированный текст с границей фразы (phrase boundary) рядом с вхождением термина из библиографической записи.
Это механизм повышения точности. Система проверяет наличие знаков препинания или разделителей рядом с найденным термином, чтобы убедиться, что это точное совпадение фразы, а не случайное сочетание слов.
Claim 6 (Зависимый): Уточняет, что Occurrence Score зависит от количества экземпляров видеоконтента на ресурсе.
Ресурс может быть страницей видеогалереи. Система учитывает этот фактор при оценке уверенности.
Изобретение является частью процесса извлечения информации и индексирования контента.
CRAWLING – Сканирование и Сбор данных
Система обнаруживает и загружает ресурсы, содержащие видеоконтент.
INDEXING – Индексирование и извлечение признаков
Основной этап применения патента. Video Identification Engine работает как система извлечения признаков (Feature Extraction). Она анализирует проиндексированные ресурсы (из Collection of Resources) и пытается сопоставить найденный видеоконтент с известными сущностями из Database of Video Bibliographic Entries. Происходит анализ текста, прилегающего к видео, и расчет Occurrence Score. Результатом является аннотация ресурса, указывающая на связь с конкретной видео-сущностью.
RANKING / METASEARCH – Ранжирование / Метапоиск
Результаты работы системы (сохраненные ассоциации) используются на этих этапах. Когда пользователь вводит запрос на поиск видео (как указано в Claim 1), система использует предварительно рассчитанные ассоциации для отбора и ранжирования релевантных видеорезультатов, а также для формирования блоков, таких как Видео-карусели.
Входные данные:
Database of Video Bibliographic Entries (структурированные данные: название, длина, актеры и т.д.).Collection of Resources (индекс веб-страниц).Refinement Engine).Выходные данные:
Процесс идентификации видео для конкретной библиографической записи.
Refinement Engine для получения более эффективной формулировки на основе анализа логов поиска.associated text), например, текст, находящийся в непосредственной близости к видео при рендеринге (adjacent text).Occurrence Score. При расчете учитывается: phrase boundaries) рядом с совпадениями для повышения точности.Occurrence Score.Система использует следующие типы данных для идентификации видео:
associated text) или прилегающий к нему (adjacent text). Это основной источник данных для сопоставления.uniform resource locator) ресурса используется как один из факторов при расчете Occurrence Score (Claim 1).adjacent text.Database of Video Bibliographic Entries. Упомянутые поля включают: title, description, genre, director, producer, cast members, length, release date, awards, production company, song name, artist(s), album(s) и т.д.Методы расчета включают:
adjacent text). Расположение контента на странице имеет решающее значение для Video SEO.Video Bibliographic Entry). Это требует совпадения по нескольким атрибутам.phrase boundaries) указывает на стремление к высокой точности идентификации. Система пытается избежать ложных срабатываний, проверяя контекст и структуру предложений вокруг найденных атрибутов.Occurrence Score, что подтверждает использование характеристик URL (и, возможно, домена) для оценки достоверности контента.Query Refinements, основанные на поведении пользователей, для более эффективного поиска кандидатов.adjacent text.soft matching.phrase boundaries для подтверждения точности совпадений (например, "Фильм: [Название], Режиссер: [Имя]").Occurrence Score.Occurrence Score.adjacent text.Патент подтверждает стратегию Google по извлечению структурированных данных из неструктурированного текста для понимания контента и идентификации сущностей. Для успешного Video SEO недостаточно просто разместить видео на сайте; необходимо обеспечить условия, при которых Google сможет однозначно идентифицировать это видео. Это подчеркивает важность оптимизации макета страницы (Layout) и качества окружающего текста как ключевых факторов для видимости в видео-вертикалях поиска.
Сценарий: Оптимизация страницы музыкального клипа на сайте исполнителя
phrase boundaries): "Официальное видео на песню: 'Song X'. Исполнитель: Artist Y. Альбом: 'Album Z' (2025). Продолжительность: 3:45."Video Identification Engine анализирует adjacent text, успешно сопоставляет поля (Song Name, Artist, Album, Length) с библиографической записью, вычисляет высокий Occurrence Score и ассоциирует страницу с сущностью клипа. Страница получает приоритет в Google Видео и Видео-каруселях по соответствующим запросам.Что такое «Adjacent Text» (Прилегающий текст) и как он определяется?
Согласно патенту, Adjacent Text — это текст на ресурсе, который находится на расстоянии менее заданного порога от видеоконтента, когда ресурс рендерится в браузере или другом приложении. Это подчеркивает важность визуального расположения текста относительно видеоплеера.
Заменяет ли этот механизм необходимость использования разметки Schema.org (VideoObject)?
Нет, не заменяет. Патент описывает механизм извлечения информации из неструктурированного текста (associated text). Разметка Schema.org предоставляет структурированные метаданные напрямую. Рекомендуется использовать оба подхода: внедрять корректную разметку и оптимизировать прилегающий текст для максимальной уверенности системы в идентификации видео.
Что такое «Phrase Boundaries» (Границы фраз) и почему они важны для SEO?
Phrase Boundaries — это разделители, такие как знаки препинания (запятые, точки) или переводы строк. Система использует их для повышения точности сопоставления. Если атрибут (например, название фильма) отделен границей фразы, это снижает вероятность случайного совпадения слов. Для SEO это означает, что использование четкой структуры предложений при описании видео повышает уверенность Google.
Как URL влияет на идентификацию видео согласно патенту?
URL ресурса явно указан в Claim 1 как один из факторов, влияющих на расчет Occurrence Score. Хотя детали не раскрываются, это предполагает, что определенные шаблоны URL или характеристики домена могут повышать или понижать уверенность системы в том, что ресурс содержит искомое видео.
Что означает «дифференцированное взвешивание полей» при расчете Occurrence Score?
Это означает, что разные атрибуты видео имеют разный вес. Например, точное совпадение по уникальному названию может дать больший вклад в Occurrence Score, чем совпадение по жанру или имени менее известного актера. SEO-специалистам следует фокусироваться на точном указании наиболее важных и уникальных идентификаторов видео.
Как система обрабатывает страницы, на которых много видео (например, галереи)?
Патент учитывает это. В Claim 6 указано, что Occurrence Score зависит от количества экземпляров видеоконтента на ресурсе. Система должна уметь определять adjacent text для каждого отдельного видео на странице, чтобы корректно их идентифицировать.
Что такое «Soft Matching» (Мягкое сопоставление) в контексте этого патента?
Это техника сравнения текста, которая допускает небольшие различия. Для строковых полей (например, название) может использоваться расстояние редактирования (edit distance), позволяющее игнорировать мелкие ошибки или вариации. Для числовых полей (например, длина видео) допускается небольшая разница в значениях.
Использует ли система метаданные самого видеофайла?
В патенте упоминается, что associated text отделен от метаданных, которые являются частью самого видеофайла. Однако в некоторых реализациях (implementations) указано, что Occurrence Score может дополнительно основываться на совпадении библиографических данных с метаданными видеофайла (например, описание, дата производства).
Как используется «Refinement Engine» и что это значит для SEO?
Refinement Engine анализирует логи поисковых сессий, чтобы найти лучшие формулировки запросов для поиска конкретного видео. Это означает, что Google активно изучает, как пользователи ищут видео, и использует эти данные для улучшения процесса идентификации. Для SEO это подчеркивает важность понимания интента и формулировок, используемых целевой аудиторией.
Какова основная рекомендация для сайтов с большим количеством видеоконтента?
Основная рекомендация — обеспечить чистоту макета и четкую ассоциацию между каждым видео и его текстовым описанием. Необходимо, чтобы ключевые идентификаторы (название, автор/режиссер, длина) находились в непосредственной визуальной близости к соответствующему плееру и были четко сформулированы.

Семантика и интент
Мультимедиа
Индексация

EEAT и качество
Поведенческие сигналы
SERP

Мультимедиа
SERP
Семантика и интент

Мультимедиа
Индексация
Семантика и интент

Ссылки
Индексация
Мультимедиа

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
SERP
Индексация

Поведенческие сигналы
SERP

Поведенческие сигналы
SERP
Антиспам

Ссылки
SERP

Индексация
Семантика и интент
Ссылки

Семантика и интент
Персонализация
Поведенческие сигналы

Ссылки
Краулинг
Техническое SEO

Персонализация
Поведенческие сигналы
SERP
