
Google (в частности, YouTube, упомянутый в патенте) использует итеративный процесс для генерации списков связанного контента. Система анализирует метаданные (заголовок, описание, теги) просматриваемого элемента и создает упорядоченный список ключевых слов. Затем она формирует внутренний поисковый запрос и автоматически уточняет его — сужая добавлением слов или расширяя удалением слов — пока не будет найдено оптимальное количество похожих результатов.
Патент решает проблему автоматического подбора релевантного и оптимального по количеству набора связанного контента (related items) для отображения рядом с основным элементом (например, блок «Похожие видео»). Традиционные методы, основанные на фиксированных ключевых словах из поиска пользователя или на популярности, часто дают неточные результаты. Изобретение предлагает метод динамической генерации оптимального поискового запроса, основанного непосредственно на метаданных самого элемента.
Запатентован метод итеративного обнаружения связанного контента (видео, аудио, документы). Система анализирует метаданные (metadata) исходного элемента и создает упорядоченный список слов (ordered list), ранжированный по значимости. На основе этого списка формируется внутренний поисковый запрос. Этот запрос итеративно модифицируется (путем добавления или удаления слов) до тех пор, пока количество полученных результатов не попадет в заданный диапазон (set range).
Механизм работает следующим образом:
TF-IDF.Word Frequency Profile).Средняя. Патент подан в 2008 году. Современные рекомендательные системы в значительной степени перешли на нейросетевые подходы (embeddings) и коллаборативную фильтрацию. Однако описанный метод, основанный на анализе метаданных и итеративном поиске (балансировка Precision/Recall), остается фундаментальным и, вероятно, используется как компонент гибридных систем, особенно для «холодного старта» (новый контент).
Влияние на традиционное SEO (веб-поиск) минимальное. Однако патент имеет высокое значение (70/100) для оптимизации на контентных платформах (Video SEO), таких как YouTube (который прямо упоминается в патенте как подходящая реализация). Он демонстрирует конкретный механизм, где оптимизация метаданных (Title, Description, Tags) напрямую влияет на генерацию рекомендаций и «Похожих видео», что является значительным источником трафика на таких платформах.
Title (Название), Description (Описание) и Tags (Теги).TF-IDF).Ordered list.Патент содержит несколько схожих независимых пунктов, описывающих процесс для видео (Claim 1) и обобщенный для элементов контента (Claim 19).
Claim 1 и 19 (Независимые пункты): Описывают основной метод идентификации набора связанных элементов.
ordered list) из метаданных первого элемента.search query) с использованием выбранного набора слов из списка.set range), происходит итеративная модификация запроса и его повторная обработка. Модификация включает: ordered list в запрос (сужение поиска).Claim 2 и 20 (Зависимые): Уточняют, что создание упорядоченного списка включает ранжирование слов как функцию частоты (frequency) каждого слова в метаданных. Это может быть сырая частота (raw frequency) или нормализованная (например, TF-IDF).
Claim 3 и 21 (Зависимые): Уточняют, что формирование запроса включает выбор нескольких наиболее высокоранжированных слов (highest ranking words).
Claim 4 и 26 (Зависимые): Вводят механизм персонализации.
word frequency profile) для пользователя на основе ранее просмотренного им контента.revising) упорядоченного списка на основе этого профиля. Это может включать переранжирование слов (Claim 5) или добавление слов из профиля (Claim 6).Claims 22-25 (Зависимые от 19): Уточняют возможные модификации списка слов с использованием NLP: проверка орфографии (spell checking), стемминг (stemming), добавление синонимов (synonyms), удаление неподходящих слов (inappropriate words).
Этот патент не относится напрямую к архитектуре Google Web Search. Он описывает механизм работы системы рекомендаций внутри контентной платформы, такой как YouTube (упомянутой в патенте как Video Hosting Website).
INDEXING – Индексирование (на платформе)
На этом этапе система извлекает и индексирует метаданные (Title, Description, Tags) загружаемого контента. Также обрабатывается история просмотров пользователей для создания и обновления их Word frequency profiles. Могут рассчитываться глобальные метрики (например, IDF для TF-IDF).
RANKING / RETRIEVAL (Генерация рекомендаций)
Это основная область применения патента. Когда пользователь просматривает элемент контента (или когда контент загружается), активируется система генерации рекомендаций (Related Videos Server).
Ordered list of words.Video Search Server).Set Range. Процесс повторяется до получения оптимального набора.Входные данные:
Word frequency profile пользователя.Set Range (желаемое количество рекомендаций).Выходные данные:
Алгоритм может применяться в двух режимах:
dynamically at the time of the request). Это позволяет учитывать персонализацию.Related Videos Database).Пороговые значения: Ключевым условием является Set Range (например, 15-30 результатов). Алгоритм работает до тех пор, пока это условие не будет выполнено.
Процесс идентификации связанных элементов.
TF-IDF.Word frequency profile пользователя (его истории просмотров), или в список могут быть добавлены слова из профиля пользователя.Threshold/Set Range).Title (Название), Description (Описание) и Tags (Теги) исходного элемента. Это основа для генерации Ordered list of words.Word frequency profile, который используется для персонализации (пересмотра Ordered list).Ordered list. Патент упоминает сырую частоту (raw frequency) или нормализованную.corpus wide) или специфично для пользователя (user-specific).stemming), проверка орфографии (spell checking), добавление синонимов (synonyms) и удаление стоп-слов/нежелательных слов.Title, Description, Tags) являются основным источником информации для генерации списка связанных элементов в этой системе. Качество метаданных напрямую влияет на то, где контент будет рекомендован.TF-IDF, это подчеркивает важность уникальных и описательных терминов, а не только общих слов.Word frequency profile. Это означает, что разные пользователи могут получить разные рекомендации для одного и того же видео, так как система адаптирует внутренний запрос под их историю.Рекомендации применимы для Video SEO (YouTube и аналогичные платформы) для повышения видимости в блоках «Похожие видео».
Title, Description и Tags. Они являются топливом для этого алгоритма рекомендаций.ordered list и гарантирует их использование во внутренних поисковых запросах. Общие термины менее ценны.Ordered lists будут похожи.TF-IDF (где переспам может исказить анализ).Ordered list и будет вынуждена использовать слишком широкие запросы, что приведет к нерелевантным рекомендациям.Патент подчеркивает стратегическую важность оптимизации под системы рекомендаций (Discovery) на контентных платформах. Трафик из рекомендаций часто превышает трафик из прямого поиска. Понимание того, что метаданные напрямую используются для генерации этих рекомендаций (по крайней мере, в рамках описанной системы), делает оптимизацию Title, Description и Tags ключевым элементом стратегии Video SEO, направленной на увеличение охвата.
Сценарий: Оптимизация видеообзора нового смартфона для показа рядом с официальным запуском на YouTube.
Ordered List (например: ["Бренд", "Модель", "Запуск", "Официальный"]).Описывает ли этот патент алгоритмы ранжирования Google Web Search?
Нет. Этот патент не связан с ранжированием в основном веб-поиске Google. Он описывает конкретный механизм для генерации списка "Связанных элементов" (Related Items) на контентных платформах. В тексте патента YouTube (YOUTUBE™) упоминается в качестве подходящего примера реализации.
Насколько важны Title, Description и Tags согласно этому патенту?
Они критически важны для этого механизма. Эти метаданные являются источником информации для генерации упорядоченного списка слов (Ordered list), из которого затем формируются внутренние поисковые запросы для поиска связанных видео. Качество оптимизации этих полей напрямую влияет на рекомендации.
Как система определяет, какие слова в метаданных важнее других?
Система ранжирует слова на основе их частоты (frequency) в метаданных исходного видео. Также упоминается возможность использования более сложных метрик, таких как TF-IDF, которые оценивают важность слов с учетом их уникальности в рамках всей коллекции контента.
Что такое "итеративное обнаружение" в контексте этого патента?
Это процесс автоматической корректировки поискового запроса. Система не просто выполняет один запрос, а итеративно (пошагово) изменяет его: добавляет слова, если результатов слишком много (сужает поиск), или убирает слова, если результатов слишком мало (расширяет поиск). Это продолжается до тех пор, пока не будет найдено оптимальное количество рекомендаций (Set Range).
Учитывает ли этот алгоритм персонализацию и историю пользователя?
Да, патент описывает механизм персонализации. Система использует "Профиль частотности слов" (Word frequency profile) пользователя, основанный на ранее просмотренном им контенте. Этот профиль используется для пересмотра упорядоченного списка слов, что позволяет адаптировать рекомендации под интересы конкретного пользователя.
Как SEO-специалист может использовать эту информацию для оптимизации видео на YouTube?
Необходимо сосредоточиться на точной и полной оптимизации метаданных. Важно использовать уникальные и релевантные ключевые слова (учитывая TF-IDF) и обеспечивать их естественную частоту. Также полезно анализировать метаданные популярных видео в нише и использовать схожие термины, чтобы "присоединиться" к их рекомендациям.
Актуален ли этот патент, учитывая современные нейросетевые подходы к рекомендациям (Embeddings)?
Хотя современные системы в значительной степени полагаются на нейронные сети и векторные представления (embeddings), базовые принципы использования метаданных остаются важными. Описанный механизм может использоваться как часть гибридной системы, для обработки "холодного старта" (новые видео или пользователи) или как резервный вариант.
Что произойдет, если у видео очень короткое описание и нет тегов?
Системе будет сложнее сгенерировать качественный упорядоченный список слов. Вероятно, она будет опираться только на слова из названия. Это может привести к генерации слишком широких поисковых запросов и, как следствие, к менее релевантным рекомендациям, отображаемым рядом с этим видео.
Использует ли система NLP для анализа метаданных?
Да. Патент упоминает, что сгенерированный упорядоченный список слов может быть модифицирован с использованием таких методов, как проверка орфографии (spell checking), стемминг (stemming), включение синонимов и удаление стоп-слов или нежелательных слов. Это стандартные этапы NLP-обработки текста.
Происходит ли расчет связанных видео в реальном времени?
Патент допускает оба варианта. Расчет может происходить динамически в момент запроса страницы пользователем. Также система может рассчитать оптимальный поисковый запрос или сам набор связанных видео заранее (например, при загрузке видео) и сохранить его в базе данных для ускорения отдачи.

Мультимедиа
Индексация
Семантика и интент

Мультимедиа
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы

Семантика и интент
SERP
Поведенческие сигналы

Ссылки
Поведенческие сигналы
Мультимедиа

Поведенческие сигналы
SERP
Мультимедиа

Семантика и интент
Поведенческие сигналы
SERP

Персонализация
SERP
Ссылки

Персонализация
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP

Индексация
Поведенческие сигналы
Семантика и интент

Поведенческие сигналы
Ссылки

Ссылки
Поведенческие сигналы
Мультимедиа

Local SEO
Антиспам
Поведенческие сигналы

SERP
Семантика и интент
Поведенческие сигналы
