Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google анализирует мультимедийные потоки (видео/аудио) и генерирует поисковые запросы, приоритизируя существительные и контекст

    FINDING WEB PAGES RELEVANT TO MULTIMEDIA STREAMS (Поиск веб-страниц, релевантных мультимедийным потокам)
    • US9152713B1
    • Google LLC
    • 2015-10-06
    • 2003-04-08
    2003 Мультимедиа Патенты Google Семантика и интент

    Патент Google описывает систему анализа потокового контента (видео, аудио). Система конвертирует поток в текст и использует методы IR/NLP (TF-IDF, стемминг) для извлечения тем и генерации запросов. Ключевыми особенностями являются явная приоритизация существительных и словосочетаний, а также учет истории контекста для определения смены темы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу автоматического дополнения мультимедийных потоков (Multimedia Stream), таких как ТВ-трансляции, видео, радио или аудио, релевантной контекстной информацией из интернета (веб-документами) в реальном времени. Это позволяет предоставлять пользователю дополнительную информацию по обсуждаемым темам без ручного вмешательства со стороны пользователя или производителя контента.

    Что запатентовано

    Запатентована система автоматической генерации запросов на основе анализа потокового контента. Она включает Query Generation Component, использующий методы Information Retrieval (TF-IDF, стемминг) с явной приоритизацией существительных (Nouns) и словосочетаний (Compounds). Система также учитывает историю потока для определения контекста (History Technique). Вторым ключевым элементом является Post Processing Component, который фильтрует и переранжирует результаты поиска на основе их прямой схожести с исходным потоком.

    Как это работает

    Система работает следующим образом:

    • Конвертация и Сегментация: Мультимедийный поток конвертируется в текст (субтитры или распознавание речи) и делится на сегменты (Text Segment T), например, каждые 15 секунд.
    • Генерация запроса: Для сегмента рассчитываются веса терминов. Система дает больший вес существительным (Noun Boosting) и словосочетаниям. Учитывается контекст из предыдущих сегментов, если тема не сменилась. Наиболее весомые термины формируют запрос.
    • Поиск: Запрос отправляется в поисковую систему.
    • Постобработка: Полученные результаты переранжируются (Similarity Re-Ranking) на основе прямого векторного сходства с текстовым сегментом и фильтруются (Filtering) для удаления нерелевантного контента.

    Актуальность для SEO

    Высокая. Хотя основная заявка датируется 2003 годом и описанные методы (TF-IDF, стемминг) являются классикой IR, задача анализа и понимания мультимедийного контента критически важна для Google (YouTube, Подкасты, индексация видео). Фундаментальные принципы извлечения ключевых тем, приоритизации сущностей (выраженных существительными) и обнаружения смены темы остаются актуальными и лежат в основе современных систем.

    Важность для SEO

    Влияние на традиционное веб-SEO среднее (6/10), так как патент не описывает ранжирование в основном поиске. Однако он имеет критическое значение для Video SEO (VSEO) и оптимизации аудиоконтента. Патент детально раскрывает, как Google анализирует содержание потока (аудиодорожку/субтитры), какие слова считает наиболее важными (существительные, словосочетания) и как определяет тематический контекст.

    Детальный разбор

    Термины и определения

    Aging (Старение)
    Процесс уменьшения весов терминов из исторического контекста (StemVectorOld) с течением времени или при изменении темы. Используется коэффициент затухания (например, 0.9).
    Boosting (Бустинг)
    Механизм пост-обработки. Использование дополнительных весомых терминов из текстового сегмента (не вошедших в основной запрос) для переранжирования результатов поиска.
    Compound (Словосочетание/Составной термин)
    Два слова, часто встречающиеся вместе (например, «veterans administration»). Обрабатываются как единая единица и могут получать повышенный вес.
    Filtering (Фильтрация)
    Метод постобработки для удаления документов, которые недостаточно похожи на текущий текстовый сегмент или являются дубликатами.
    idf (Inverse Document Frequency)
    Обратная частота документа. Метрика редкости термина в индексе поисковой системы.
    Noun Boosting (Приоритизация существительных)
    Техника присвоения более высокого веса терминам, идентифицированным как существительные (Nouns), при генерации запроса (с помощью коэффициента c).
    Similarity Re-Ranking (Переранжирование по схожести)
    Метод постобработки, при котором рассчитывается схожесть между текстовым сегментом и полученными документами (через скалярное произведение их векторов), и результаты переупорядочиваются.
    Similarity Score (s) (Оценка схожести)
    Метрика схожести между двумя векторами. Рассчитывается как скалярное произведение (dot-product).
    Stem/Stemming (Стем/Стемминг)
    Основа слова. Процесс приведения слова к его основе (в патенте предлагается использовать первые 5 букв) для группировки связанных терминов.
    Stem Vector (Вектор стемов)
    Структура данных, представляющая текстовый сегмент. Содержит стемы и их агрегированные веса.
    StemVectorOld
    Вектор стемов, представляющий историю контекста (например, сумма векторов предыдущих трех сегментов).
    tf (Term Frequency)
    Частота термина в текущем текстовом сегменте T.

    Ключевые утверждения (Анализ Claims)

    Патент US9152713B1 является продолжением (continuation) и фокусируется на конкретных аспектах генерации запросов и пост-обработки.

    Claim 1 (Независимый пункт): Описывает метод поиска релевантных документов для мультимедийного потока.

    1. Конвертация части мультимедийного потока в текст.
    2. Генерация поискового запроса из терминов в текстовом сегменте. Этот шаг детализирован:
      • Генерация веса для групп терминов (группы формируются по общему стему).
      • Вес термина генерируется на основе значения (value), которое зависит от типа термина.
      • Это значение выше, если тип термина — существительное (noun), чем если это другой тип (Noun Boosting).
      • Выбор конкретных терминов из групп с наивысшими весами для включения в запрос.
    3. Идентификация документов на основе запроса.
    4. Расчет оценки (score) для документа на основе схожести (similarity) между текстовым сегментом и документом (Similarity Re-Ranking).
    5. Ранжирование документа на основе этой оценки.
    6. Предоставление информации о ранжированном документе.

    Ядром изобретения в этом патенте является комбинация двух механизмов: (1) Генерация запроса с явной приоритизацией существительных и (2) Последующее переранжирование результатов на основе прямого сравнения схожести.

    Claim 2, 3 (Зависимые): Детализируют расчет оценки схожести.

    Оценка схожести рассчитывается как скалярное произведение (dot product) вектора схожести текстового сегмента и вектора схожести документа. Это подтверждает использование классической модели векторного пространства (Vector Space Model).

    Где и как применяется

    Патент описывает приложение (Application Layer), которое использует базовую архитектуру поиска Google как инструмент.

    INDEXING – Индексирование (Взаимодействие)
    Система использует данные, рассчитанные на этом этапе, в частности, статистику idf для всех терминов в индексе поисковой системы.

    QUNDERSTANDING – Понимание Запросов (Применение — Генерация)
    Основная часть патента (Query Generation Component) посвящена анализу контента (текстового потока) и его преобразованию в структурированный запрос. Используются NLP и IR для определения важных терминов и контекста.

    RANKING – Ранжирование (Взаимодействие)
    Сгенерированный запрос отправляется в основной поисковый движок для получения первичного набора ранжированных результатов.

    RERANKING – Переранжирование (Применение — Постобработка)
    Полученные результаты обрабатываются Post Processing Component. Происходит переранжирование (Similarity Re-Ranking, Boosting) и фильтрация (Filtering) для адаптации результатов к точному контексту медиапотока.

    Входные данные:

    • Мультимедийный поток (аудио/видео).
    • Данные idf из поисковой системы.
    • Лингвистические данные (Части речи для Noun Boosting).
    • Первичные результаты поиска от поискового движка.

    Выходные данные:

    • Отфильтрованный и переранжированный список веб-документов, релевантных текущему контексту потока.

    На что влияет

    • Конкретные типы контента: Видео (YouTube, стримы, новостные трансляции), аудио (подкасты, радио). Патент напрямую влияет на то, как Google понимает содержание этого контента (VSEO).
    • Приложения и сервисы: Влияет на системы рекомендаций и контекстного поиска в сервисах, работающих с мультимедиа.

    Когда применяется

    • Условия работы: Алгоритм применяется при обработке контента — либо в реальном времени (для потокового вещания), либо офлайн (при индексации видео/аудио файлов).
    • Триггеры активации: Анализ и генерация запросов происходят периодически (например, каждые 15 секунд) на основе нового текстового сегмента.
    • Специфические условия (History Technique): Система постоянно оценивает схожесть (s) между сегментами. Если схожесть высокая (Similar, выше порога a1), контекст накапливается. Если схожесть низкая (Dissimilar, ниже порога a2), происходит детекция смены темы и контекст сбрасывается.

    Пошаговый алгоритм

    Ниже описан наиболее сложный вариант реализации (A5-HIST), включающий учет контекста, стемминг и словосочетания.

    1. Конвертация и Сегментация: Мультимедийный поток конвертируется в текст. Извлекается текущий текстовый сегмент T.
    2. Расчет весов терминов: Для каждого термина в T рассчитывается вес. В описании патента упоминается формула (3): c*tf*idf^2. Коэффициент ‘c’ (Noun Boosting) критически важен:
      • c = 1.0 для существительных (Nouns).
      • c = 1.2 для словосочетаний (Compounds).
      • c = 0.5 в остальных случаях.
    3. Стемминг и Группировка: Термины группируются по стемам. Веса внутри группы суммируются. Создается текущий Stem Vector.
    4. Учет истории (History Technique):
      • Вычисляется StemVectorOld (например, сумма векторов предыдущих трех сегментов).
      • Рассчитывается оценка схожести s (скалярное произведение) между текущим Stem Vector и StemVectorOld.
    5. Детекция смены темы и Старение (Aging): Оценка s сравнивается с порогами (a1, a2):
      • Similar (s > a1): Тема стабильна. StemVectorOld умножается на константу старения (например, 0.9).
      • Somewhat Similar (a2 < s < a1): Тема меняется. StemVectorOld умножается на меньший коэффициент.
      • Dissimilar (s < a2): Тема сменилась. StemVectorOld игнорируется (обнуляется).
    6. Создание нового вектора: Текущий Stem Vector складывается с состаренным StemVectorOld.
    7. Генерация запроса: Из нового вектора выбираются X (например, 2) стемов с наибольшим весом. Для каждого стема выбирается наиболее весомый термин. Эти термины формируют запрос.
    8. Поиск и Постобработка:
      • Запрос выполняется, получаются документы.
      • Similarity Re-Ranking: Рассчитывается схожесть между сегментом T и каждым документом. Результаты пересортировываются.
      • Filtering: Удаляются документы с низкой схожестью (ниже порога b) или дубликаты.

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст, извлеченный из мультимедийного потока (субтитры или распознанная речь). Это основной источник данных.
    • Лингвистические факторы: Критически важные данные. Система определяет часть речи термина. Существительные (Nouns) идентифицируются для применения Noun Boosting (коэффициент ‘c’).
    • Структурные факторы: Система идентифицирует двухсловные составные фразы (Compounds).
    • Временные факторы: Используется последовательность текстовых сегментов (история) для определения контекста и выявления смены темы. Применяется механизм «старения» (Aging).
    • Системные данные: Значения idf, предварительно рассчитанные на основе индекса поисковой системы.

    Какие метрики используются и как они считаются

    • TF-IDF и его варианты: Фундаментальные метрики для определения важности слова. Патент предлагает разные формулы, например, tf*idf и tf*idf^2 (последняя сильнее выделяет редкие слова).
    • Коэффициент c (Noun Boosting): Множитель для веса термина, зависящий от его типа. В патенте приведены примеры: Существительное=1.0, Составная фраза (Compound)=1.2, Остальное=0.5. Используется в формуле расчета веса (например, c*tf*idf^2).
    • Stem Weight (Вес стема): Агрегированный вес группы терминов с общим стемом (сумма весов терминов).
    • Similarity Score (s): Метрика схожести между двумя векторами. Рассчитывается как скалярное произведение (dot product).
    • Aging Factor (Фактор старения): Коэффициент (например, 0.9), используемый для уменьшения веса предыдущих контекстов в History Technique.
    • Пороговые значения (a1, a2, b, p, g): Эмпирически подобранные значения для принятия решений:
      • a1 (например, 0.001), a2 (например, 0.0003): Пороги для определения смены темы.
      • b, p, g: Пороги для фильтрации результатов на этапе постобработки.

    Выводы

    1. Явная приоритизация существительных и фраз (Noun Boosting): Ключевой инсайт (подтвержденный в Claim 1) — система программно придает значительно больший вес существительным (Nouns, c=1.0) и составным фразам (Compounds, c=1.2) по сравнению с другими словами (c=0.5). Это подчеркивает фокус на объектах и понятиях (сущностях) при определении тематики.
    2. Критическая важность NLP и IR для анализа мультимедиа: Патент демонстрирует, как Google использует комбинацию NLP (определение частей речи) и классических IR техник (TF-IDF, стемминг, векторные модели) для понимания содержания аудио и видео контента через его текстовое представление.
    3. Контекст и Детекция смены темы: Система не анализирует сегменты изолированно. Механизм History Technique отслеживает контекст, накапливая веса, но также имеет четкий механизм (Similarity Score и пороги) для определения момента смены темы и сброса контекста.
    4. Важность специфичности терминов (IDF): Использование вариаций TF-IDF (например, tf*idf^2) указывает на приоритет редких и специфичных терминов при определении релевантности.
    5. Постобработка и Прямая релевантность: Система активно переранжировывает стандартную выдачу (Similarity Re-Ranking) на основе прямой векторной схожести между контентом потока и найденными документами, гарантируя максимальную релевантность контексту.

    Практика

    Best practices (это мы делаем)

    Рекомендации направлены в первую очередь на оптимизацию видео и аудио контента (VSEO), чтобы помочь системам Google правильно интерпретировать его содержание.

    • Оптимизация аудиодорожки и субтитров: Обеспечьте высокое качество звука, четкое произношение и загружайте точные субтитры. Система напрямую использует этот текст для анализа.
    • Насыщение контента релевантными существительными (Nouns): Активно используйте существительные и именованные сущности, которые четко определяют тему. Благодаря Noun Boosting, эти слова получат повышенный вес (c=1.0) при анализе тематики.
    • Использование устоявшихся словосочетаний (Compounds): Четко проговаривайте общепринятую терминологию и фразы. Система идентифицирует их как важные концепции и может дать им наибольший вес (c=1.2).
    • Использование специфичной терминологии (Высокий IDF): Используйте термины, специфичные для вашей ниши. Они имеют более высокий idf и получат больший вес при анализе (особенно при использовании формулы tf*idf^2).
    • Четкое структурирование и поддержание контекста: Организуйте контент логически. Поддержание четкой тематической направленности позволяет системе накопить контекст (History Technique). При переходе к новой теме используйте явные сигналы, чтобы система корректно определила смену темы.

    Worst practices (это делать не надо)

    • «Водянистый» контент и обилие общих фраз: Речь, в которой доминируют глаголы, прилагательные и общие фразы при низкой плотности значимых существительных, затрудняет извлечение конкретной темы. Вес не-существительных значительно ниже (c=0.5).
    • Низкое качество аудио и игнорирование субтитров (VSEO): Нечеткая артикуляция или ошибки в автоматических субтитрах не позволят системе корректно извлечь ключевые фразы и определить тематику.
    • Хаотичное переключение между темами: Контент, который быстро переключается между темами без логических переходов, затрудняет системе использование исторического контекста. Система будет постоянно сбрасывать контекст.

    Стратегическое значение

    Патент подтверждает стратегическую важность оптимизации самого содержания мультимедийного контента (VSEO), а не только его метаданных. Понимание того, как Google извлекает темы из потока информации, приоритизируя существительные и словосочетания, является ключом к созданию контента, который будет эффективно индексироваться. Это также демонстрирует ранний фокус Google на объектах и понятиях, что является предвестником современного акцента на сущностях (Entities) и Knowledge Graph.

    Практические примеры

    Сценарий: Оптимизация образовательного видео по SEO для YouTube.

    1. Задача: Повысить видимость видео, посвященного «E-E-A-T».
    2. Действия (на основе патента):
      • Вместо общего обсуждения «качества сайта», спикер должен четко и многократно проговаривать ключевые Nouns и Compounds: «E-E-A-T signals», «Experience», «Expertise», «Authoritativeness», «Trust», «Quality Rater Guidelines».
      • Система применит Noun Boosting (c=1.0 или c=1.2). Так как эти термины специфичны (высокий IDF), их общий вес будет высоким.
      • Спикер посвящает каждому аспекту E-E-A-T отдельный блок времени, позволяя History Technique накопить контекст по каждому из них, и делает четкие переходы между блоками.
      • Загружаются точные субтитры, содержащие эти термины.
    3. Ожидаемый результат: Система Google точно определяет ключевые темы видео. Видео лучше ранжируется по запросам, связанным с E-E-A-T, и чаще появляется в рекомендациях или как дополнительный контент.

    Вопросы и ответы

    Как этот патент влияет на SEO для YouTube и видеоконтента (VSEO)?

    Он влияет напрямую и имеет высокое значение для VSEO. Патент описывает методы, которые Google использует для понимания содержания видео путем анализа аудиодорожки или субтитров. Система извлекает ключевые темы, используя стемминг, TF-IDF, приоритизацию существительных и анализ контекста. Оптимизация речи и субтитров под эти механизмы позволяет системе максимально точно интерпретировать содержание видео.

    Что такое Noun Boosting (Приоритизация существительных) и почему это важно?

    Noun Boosting — это техника, при которой система присваивает больший вес существительным по сравнению с другими частями речи при определении важности термина. Это подтверждено в Claim 1. Это важно, потому что существительные (и сущности) лучше всего описывают тему контента. Создатели контента должны насыщать свою речь ключевыми существительными.

    Какие конкретные веса используются для разных типов слов?

    В описании патента (техника A3-STEM/A4-COMP) приводится пример коэффициента ‘c’: c=1.0 для существительных (Nouns), c=1.2 для словосочетаний (Compounds) и c=0.5 для остальных слов. Это означает, что словосочетания считаются наиболее важными для определения темы, а существительные вдвое важнее других частей речи.

    Как система определяет, что тема в видео или аудио сменилась?

    Для этого используется History Technique (A5-HIST). Система сравнивает вектор текущего сегмента контента (Stem Vector) с вектором предыдущего контекста (StemVectorOld). Если схожесть (Similarity Score s) падает ниже определенного порога (a2, например 0.0003), система фиксирует смену темы (Dissimilar) и перестает учитывать предыдущий контекст.

    Что такое составные фразы (Compounds) в контексте этого патента?

    Compounds — это двухсловные устоявшиеся термины, которые система рассматривает как единое целое (например, «search engine»). Патент предполагает, что таким фразам может присваиваться даже больший вес (например, коэффициент 1.2), чем отдельным существительным (1.0), так как они более точно определяют тему.

    Как работает Similarity Re-Ranking?

    Similarity Re-Ranking — это этап постобработки. Система сравнивает вектор текстового сегмента из потока с вектором каждого найденного документа (используя модель векторного пространства и TF-IDF) и рассчитывает их прямую схожесть (скалярное произведение). Результаты переупорядочиваются так, чтобы документы, наиболее лексически похожие на исходный контент, были выше.

    Актуальны ли эти методы (TF-IDF, стемминг) в эпоху нейросетей (BERT, MUM)?

    Методы относятся к классическому Information Retrieval (уровень 2003 года). Современные системы используют более сложные нейросетевые модели. Однако базовые принципы — важность специфичных терминов (высокий IDF) и фокус на объектах и понятиях (существительные/сущности) — остаются фундаментальными для понимания контента и могут использоваться в гибридных системах.

    Что такое «Aging» (старение) контекста?

    «Aging» — это процесс уменьшения веса терминов из предыдущих сегментов при расчете текущего контекста. Если текущая тема похожа на предыдущую, веса уменьшаются незначительно (например, умножаются на 0.9). Если тема начинает меняться, веса уменьшаются агрессивнее. Это гарантирует, что самые последние термины имеют наибольшее влияние.

    Насколько критично качество распознавания речи или субтитров для работы этой системы?

    Критически важно. Весь механизм основан на тексте, полученном из мультимедийного потока. Если конвертация выполнена некачественно (речь невнятная, субтитры неточные), система не сможет корректно выделить ключевые термины. Поэтому высокое качество аудио и точные субтитры являются базовым требованием для VSEO.

    Каков главный вывод из этого патента для создания контента?

    Главный вывод заключается в том, что для машинного понимания контента (особенно мультимедийного) критически важна его насыщенность конкретными, релевантными существительными и общепринятыми словосочетаниями. Контент должен быть четко структурирован, сфокусирован и использовать ясную терминологию.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.