Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google уточняет поисковые запросы, анализируя, что пользователь смотрит по ТВ или на стриминге

    SYSTEM AND METHOD FOR ENHANCING USER SEARCH RESULTS BY DETERMINING A STREAMING MEDIA PROGRAM CURRENTLY BEING DISPLAYED IN PROXIMITY TO AN ELECTRONIC DEVICE (Система и метод улучшения результатов поиска пользователя путем определения программы потокового мультимедиа, отображаемой в данный момент вблизи электронного устройства)
    • US10114895B2
    • Google LLC
    • 2018-10-30
    • 2011-06-30
    2011 Мультимедиа Патенты Google Персонализация Семантика и интент

    Google может определять, какую ТВ-программу или потоковое видео смотрит пользователь, сопоставляя его поисковые запросы с контентом, доступным в его локации в это же время. Если корреляция найдена, система модифицирует исходный запрос, добавляя термины из программы (например, уточняя модель автомобиля из телешоу), чтобы предоставить более релевантные контекстуальные результаты.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неоднозначности или излишней обобщенности поисковых запросов, вводимых пользователями во время потребления медиаконтента (ТВ, стриминг) — сценарий «второго экрана». Пользователи часто ищут информацию, связанную с тем, что они смотрят, но используют общие термины (например, ищут «Porsche», смотря передачу о модели «911 Turbo»). Система призвана улучшить релевантность выдачи, распознав этот непосредственный контекст и уточнив запрос пользователя.

    Что запатентовано

    Запатентована система для контекстуального улучшения поиска путем определения того, какая streaming multimedia program (программа потокового мультимедиа) воспроизводится вблизи (in proximity) пользователя. Система сопоставляет тематические категории поискового запроса с категориями медиаконтента, доступного в локации пользователя в тот же time window (временной интервал). Если корреляция обнаружена, система модифицирует исходный запрос, добавляя релевантные термины из метаданных идентифицированной программы.

    Как это работает

    Ключевой механизм основан на корреляции контекстных сигналов:

    • Сбор данных: Система получает запрос, фиксирует время его отправки (time window) и определяет локацию пользователя (через IP, GPS или профиль).
    • Определение контекста: Система определяет, какие streaming multimedia programs доступны пользователю в этой локации в данный момент, используя базу данных расписаний.
    • Категоризация: Запрос и доступные программы анализируются для извлечения связанных с ними наборов категорий (set of categories).
    • Сопоставление: Система сравнивает категории запроса с категориями программ, используя matching function для вычисления оценки корреляции (score).
    • Идентификация программы: Программа с наивысшей оценкой корреляции предполагается как та, которую смотрит пользователь.
    • Модификация запроса: Система извлекает дополнительные релевантные термины из метаданных программы и добавляет их к исходному запросу.
    • Выполнение поиска: Поиск осуществляется по модифицированному, более точному запросу.

    Актуальность для SEO

    Высокая. Контекстуальный поиск и понимание непосредственного окружения пользователя (Ambient Computing) являются ключевыми направлениями развития Google. Поведение пользователей, использующих несколько экранов одновременно, повсеместно. Механизм использования внешних данных в реальном времени для модификации запросов крайне актуален в 2025 году.

    Важность для SEO

    Патент имеет значительное стратегическое влияние на SEO (7.5/10). Он напрямую затрагивает этап понимания и переписывания запросов (Query Understanding). Он демонстрирует, как Google может радикально изменить интерпретацию запроса на основе внешнего контекста в реальном времени, не связанного с историей поиска. Для SEO это означает, что оптимизация под изолированный ключевой запрос может быть недостаточной; необходимо учитывать контекст, в котором этот запрос может быть задан, и связанные с ним сущности, которые Google может добавить к запросу.

    Детальный разбор

    Термины и определения

    Category List / Set of Categories (Список / Набор категорий)
    Набор тематических категорий (и, возможно, их весов Weight), связанных с поисковым запросом или программой. Используется для классификации контента и запроса.
    Interesting Entities (Интересующие сущности)
    Важные слова в тексте, такие как имена людей, названия мест и продуктов. Упоминаются в описании как фокус для NLP при генерации профилей для повышения эффективности.
    Matching Function (Функция сопоставления)
    Алгоритм, используемый для расчета степени сходства или корреляции (Score) между двумя наборами категорий (запроса и программы).
    Proximity (Близость)
    Условие, при котором медиапрограмма отображается на втором устройстве (например, ТВ) в пределах видимости или слышимости пользователя первого устройства (например, смартфона), с которого отправляется запрос.
    Query Profile Database (База данных профилей запросов)
    Хранилище данных, содержащее профили для ранее выполненных запросов, включая термины запроса и связанный с ним Category List.
    Streaming Multimedia Program (Программа потокового мультимедиа)
    Медиаконтент (ТВ-шоу, фильм, стрим), доступный пользователю через различные каналы вещания (кабельное, эфирное, спутниковое, интернет-стриминг).
    Television Program Information Database (База данных информации о телевизионных программах)
    Хранилище метаданных о программах: время показа, канал, описание, актеры, жанр, связанные термины и Category List. В патенте также называется Repository of streaming multimedia related information.
    Time Window (Временной интервал)
    Период времени, в течение которого был получен запрос. Используется для определения того, какие программы были доступны в этот момент.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод улучшения поисковых запросов, связанных с потоковым мультимедиа.

    1. Система получает поисковый запрос от первого устройства пользователя в течение time window.
    2. Система обращается к репозиторию информации о потоковом мультимедиа, чтобы определить одну или несколько streaming multimedia programs, доступных для просмотра в этот time window.
    3. Идентифицируется первый набор категорий (first set of categories), связанных с полученным запросом.
    4. Для каждой доступной программы идентифицируется соответствующий второй набор категорий (second set of categories).
    5. Система определяет, что первая программа отображается на втором устройстве рядом (in proximity) с первым устройством, путем сравнения первого набора категорий с каждым вторым набором категорий.
    6. Определяются дополнительные поисковые термины, релевантные как определенной программе, так и полученному запросу.
    7. Полученный запрос модифицируется путем добавления этих дополнительных терминов.
    8. Идентифицируются результаты поиска, соответствующие модифицированному запросу, и они отображаются на первом устройстве.

    Claim 2, 3 и 4 (Зависимые пункты): Детализируют механизм определения программы (инференс).

    Определение программы включает генерацию оценки (score) для каждой доступной программы на основе сравнения наборов категорий (Claim 2). Программы упорядочиваются в соответствии с этими оценками (Claim 3). Программа с наивысшей оценкой выбирается как та, которую смотрит пользователь (Claim 4).

    Claim 5 (Зависимый): Уточняет состав информации о потоковом мультимедиа.

    Информация включает время показа, информацию о канале, название, описание, информацию о сериале, актерский состав и жанр. Эти данные служат источником для категоризации и извлечения дополнительных терминов.

    Claim 8 (Зависимый от 1): Уточняет функцию сравнения.

    Сравнение наборов категорий включает применение matching function, которая вычисляет количество совпадений между категориями в первом наборе и категориями во втором наборе.

    Где и как применяется

    Изобретение применяется на нескольких этапах поисковой архитектуры, обеспечивая контекстуальное улучшение запроса.

    INDEXING – Индексирование и извлечение признаков
    Система должна индексировать внешние данные: Television Program Information Database. Это включает сбор расписаний, метаданных и, самое главное, генерацию Category List для каждой программы. Также система предварительно рассчитывает или индексирует Query Profile Database.

    QUNDERSTANDING – Понимание Запросов
    Основное применение патента. На этом этапе система выполняет:

    1. Категоризацию запроса: Определение Category List для входящего запроса.
    2. Контекстуализацию: Использование времени и местоположения для определения доступного медиаконтента в реальном времени.
    3. Корреляцию: Сопоставление категорий запроса с категориями медиаконтента.
    4. Модификацию запроса (Query Modification): Переписывание запроса путем добавления терминов, если контекст идентифицирован с высокой уверенностью.

    RANKING – Ранжирование
    На этом этапе система выполняет поиск, используя уже модифицированный запрос. Это означает, что результаты будут смещены в сторону интента, определенного на этапе QUNDERSTANDING.

    Входные данные:

    • Исходный поисковый запрос.
    • Временная метка запроса (Time Window).
    • Данные о местоположении пользователя (IP, GPS, данные профиля).
    • Query Profile Database.
    • Television Program Information Database.

    Выходные данные:

    • Модифицированный поисковый запрос.
    • Результаты поиска, соответствующие модифицированному запросу.

    На что влияет

    • Специфические запросы: Наибольшее влияние оказывается на широкие или неоднозначные запросы (например, имена собственные, названия брендов), которые могут иметь разные значения в зависимости от контекста (например, «Ягуар» как животное, автомобиль или спортивная команда).
    • Типы контента: Влияет на ранжирование контента, связанного с сущностями, часто упоминаемыми в медиа: знаменитости, продукты, локации, события в реальном времени (спорт, новости).
    • Типы устройств: Особенно актуально для мобильных устройств, используемых как «второй экран» во время просмотра ТВ.

    Когда применяется

    • Триггеры активации: Алгоритм активируется при получении поискового запроса в реальном времени. Система проверяет возможность контекстуальной модификации.
    • Условия применения: Механизм применяется, если система обнаруживает достаточно высокую корреляцию (Score) между категориями запроса и категориями медиаконтента, доступного в данный момент времени и в данной локации.
    • Пороговые значения: Активация модификации запроса, вероятно, происходит только если рассчитанная оценка корреляции превышает определенный порог уверенности. Если порог не достигнут, поиск может быть выполнен без модификации.

    Пошаговый алгоритм

    Процесс А: Определение просматриваемой программы

    1. Получение запроса и контекста: Система получает запрос, фиксирует время (Time Window) и определяет местоположение устройства.
    2. Идентификация доступных программ: Система обращается к Television Program Information Database для получения списка программ, доступных в данном местоположении в течение Time Window.
    3. Категоризация запроса: Идентифицируется первый набор категорий (First Set of Categories) для запроса. Это может быть сделано динамически с помощью NLP или путем поиска в Query Profile Database.
    4. Категоризация программ: Для каждой доступной программы извлекается второй набор категорий (Second Set of Categories) из ее метаданных.
    5. Вычисление оценок (Scoring): Для каждой программы применяется Matching Function к первому и второму наборам категорий для генерации оценки корреляции (Score).
    6. Ранжирование программ: Список возможных программ упорядочивается по сгенерированным оценкам.
    7. Выбор программы: Программа с наивысшей оценкой выбирается как та, которую, вероятно, смотрит пользователь.

    Процесс Б: Модификация запроса

    1. Доступ к метаданным: Система получает доступ к полным метаданным выбранной программы.
    2. Определение дополнительных терминов: Система определяет Additional Search Terms, которые релевантны как выбранной программе, так и исходному запросу. Это делается на основе анализа сущностей (Interesting Entities) в метаданных программы.
    3. Модификация: Дополнительные термины добавляются к исходному запросу.
    4. Выполнение поиска: Система выполняет поиск по модифицированному запросу и возвращает результаты пользователю.

    Какие данные и как использует

    Данные на входе

    Система использует комбинацию данных о пользователе, запросе и внешних данных о медиаконтенте.

    • Географические факторы: Местоположение устройства (полученное через IP-адрес, GPS или данные профиля пользователя). Критически важно для определения списка доступных локальных трансляций.
    • Временные факторы: Точное время запроса (Time Window). Используется для фильтрации программ, транслируемых в данный момент.
    • Контентные факторы (Медиа): Метаданные из Television Program Information Database. Патент упоминает: время показа (Show Times), информацию о канале (Channel Information), описание программы (Program Description), информацию об актерах (Cast Information), жанр (Genre Information) и связанные термины (Related Terms).
    • Системные данные: Query Profile Database, включающая категории и веса, связанные с определенными запросами.

    Какие метрики используются и как они считаются

    • Category Weight (Вес категории): Числовое значение, измеряющее релевантность между запросом/программой и конкретной тематической категорией.
    • Concept Clusters (Концептуальные кластеры): В описании патента упоминается, что Category ID может соответствовать концептуальному кластеру, полученному в результате процесса кластеризации.
    • Score (Оценка корреляции): Основная метрика для определения просматриваемой программы. Рассчитывается путем применения Matching Function.
    • Matching Function (Функция сопоставления): Алгоритм для расчета схожести. Патент указывает, что это может быть любая функция, вычисляющая сходство между двумя наборами, например, коэффициент корреляции или функция, подсчитывающая количество совпадений (Claim 8).
    • Методы анализа текста (NLP): Для генерации Category Lists из описаний программ или анализа запросов используется обработка естественного языка (NLP), с фокусом на извлечении «интересных сущностей» (interesting entities) — люди, места, продукты.

    Выводы

    1. Контекст реального времени критичен для QUNDERSTANDING: Патент демонстрирует, как Google может использовать внешние данные в реальном времени (расписание и содержание медиа) для радикального изменения интерпретации запроса. Это выходит за рамки стандартной персонализации и переходит к пониманию текущей ситуации пользователя (Ambient Computing).
    2. Категоризация как основа сопоставления: Механизм полагается на способность системы точно классифицировать как поисковые запросы, так и медиаконтент по набору категорий (Category List). Сходство определяется на уровне этих категорий, а не только по ключевым словам.
    3. Агрессивное уточнение запроса: Если контекст определен с высокой степенью уверенности, Google активно модифицирует запрос, чтобы сделать его более специфичным. Это смещает результаты поиска от общих к контекстуально релевантным (например, запрос [автомобиль] может быть изменен на [Ford Mustang 1968], если эта модель обсуждается в программе).
    4. Важность локации и времени: Местоположение и время являются ключевыми фильтрами для определения релевантного контекста. Релевантность запроса может меняться поминутно в зависимости от того, что транслируется.
    5. От сущностей к контексту: Система использует метаданные программы (сущности, такие как актеры, названия продуктов, описания) для категоризации и последующей модификации запроса. Это подтверждает важность сущностей (Entities) в поиске как способа понимания контекста.

    Практика

    Best practices (это мы делаем)

    • Обеспечение четкой семантической структуры и категоризации контента: Необходимо создавать контент так, чтобы поисковые системы могли легко и однозначно его категоризировать. Это повышает вероятность того, что контент будет соответствовать запросу, который Google контекстуально модифицировал. Используйте структурированные данные и ясную тематическую направленность.
    • Фокус на конкретных сущностях (Entity Optimization): При оптимизации под широкие запросы убедитесь, что вы также покрываете конкретные связанные сущности. Например, если вы оптимизируете страницу под «Jaguar» (автомобиль), убедитесь, что конкретные модели (например, «F-Type») также присутствуют. Если пользователь ищет «Jaguar» во время просмотра обзора F-Type, Google может модифицировать запрос до «Jaguar F-Type».
    • Real-time SEO и использование медиа-повестки: Отслеживайте, какие темы, продукты или личности активно освещаются в медиа (ТВ, популярные стримы, спортивные события). Создание контента, связанного с этими трендами, увеличивает шансы на получение трафика от контекстуально модифицированных запросов пользователей, потребляющих этот медиаконтент.
    • Насыщенные метаданные для видеоконтента (для вещателей): Если вы производите стриминговый контент, предоставляйте поисковым системам максимально полные метаданные (детальные описания, теги, сущности, расписание). Это облегчит Google категоризацию контента и его связывание с запросами.

    Worst practices (это делать не надо)

    • Создание неоднозначного контента: Контент, который сложно отнести к конкретной категории или который пытается охватить слишком много несвязанных тем, будет плохо работать в системах, основанных на категоризации и контекстуальном сопоставлении.
    • Игнорирование связанных сущностей: Оптимизация только под высокочастотные «head terms» без проработки связанных специфических сущностей (моделей, имен, локаций) приведет к потере трафика по уточненным (модифицированным) запросам.
    • Игнорирование контекста реального времени: Полагаться только на «вечнозеленый» контент и не адаптировать стратегию под текущие медиасобытия означает упускать возможность ранжироваться по автоматически уточненным запросам.

    Стратегическое значение

    Патент подтверждает стратегический приоритет Google на понимание контекста пользователя в момент поиска (ситуативный поиск). Для SEO это означает, что традиционный подход «ключевое слово -> страница» становится менее надежным. Стратегия должна смещаться в сторону «контекст -> сущность -> страница». Понимание того, как медиапотребление влияет на поисковое поведение и интерпретацию запросов, становится важным элементом для прогнозирования трафика и оптимизации контента.

    Практические примеры

    Сценарий: Разрешение неоднозначности запроса во время трансляции (Пример из патента, FIG. 10)

    1. Событие: Транслируется автомобильное шоу (например, «Top Gear»), где обсуждаются спорткары, включая Ferrari F550.
    2. Действия пользователя: Пользователь смотрит шоу и вводит на смартфоне неоднозначный запрос «F550». (Это может быть также автомобиль Ford F-550 или камера Fujifilm F550).
    3. Работа системы Google:
      • Google определяет, что в локации пользователя в это время идет автомобильное шоу.
      • Система сравнивает категории запроса «F550» с категориями шоу («Автомобили», «Спорткары»). Корреляция высока.
      • Система определяет, что пользователь смотрит шоу, и извлекает специфические термины из метаданных, например, «Ferrari».
      • Запрос модифицируется, например, в «Ferrari F550».
    4. Результат для SEO: Сайты, оптимизированные под спорткар Ferrari, получают приоритет в выдаче, в то время как сайты об автомобилях Ford F-550 или камерах Fujifilm отфильтровываются, несмотря на точное совпадение с исходным запросом.

    Вопросы и ответы

    Означает ли этот патент, что Google подслушивает разговоры или анализирует звук с микрофона?

    Нет, в данном патенте такой механизм не описан. Система работает исключительно на основе корреляции между текстом поискового запроса и метаданными медиаконтента, доступного в его локации в то же время. Контекст определяется через сопоставление времени, места и тематических категорий.

    Как система определяет категории для запросов и медиаконтента?

    Патент упоминает использование предварительно рассчитанных баз данных (Query Profile Database и Television Program Information Database), где элементам присвоены категории и веса. Также упоминается возможность динамической генерации категорий с использованием NLP и фокусом на извлечении «интересных сущностей» (interesting entities) из метаданных.

    Как это влияет на исследование ключевых слов?

    Это подчеркивает необходимость выхода за рамки анализа изолированных ключевых слов и перехода к анализу тем, сущностей и контекстов. Необходимо учитывать, в каких ситуациях пользователь может вводить запрос и какие дополнительные термины могут быть добавлены Google на основе внешнего контекста, например, популярного медиаконтента.

    Может ли этот механизм снизить мой трафик по общим запросам?

    Да, это возможно. Если ваш сайт ранжируется по общему запросу (например, «лучшие кроссовки»), но в момент поиска пользователь смотрит передачу о конкретной модели (например, «Nike Air Max 2025»), система может модифицировать запрос, добавив название модели. Если ваш контент не релевантен этой конкретной модели, вы можете не появиться в выдаче по модифицированному запросу.

    Как я могу оптимизировать свой контент под этот механизм?

    Ключевая стратегия — это создание семантически богатого контента, который четко категоризирован и содержит конкретные сущности (имена, модели, локации). Если ваш контент точно соответствует модифицированному (уточненному) запросу, вы получите преимущество. Также полезно отслеживать медиа-тренды в вашей нише и применять тактики Real-Time SEO.

    Применяется ли этот механизм только к ТВ или также к стриминговым сервисам типа Netflix (VOD)?

    Патент использует термин Streaming Multimedia Program, что подразумевает охват всех видов потокового мультимедиа, включая интернет-стриминг, а не только традиционное ТВ. Если у Google есть доступ к метаданным о том, что доступно на платформе, механизм может быть применен, хотя он наиболее эффективен для контента, просматриваемого в определенное время (линейное вещание).

    Как система узнает, какие программы доступны в моей локации?

    Система использует местоположение пользователя (определенное по IP-адресу, GPS или данным профиля) для запроса к Television Program Information Database. Эта база данных агрегирует информацию о расписаниях вещания и доступности стримингового контента, привязанную к географическим регионам.

    Что такое Matching Function и как она работает?

    Matching Function — это алгоритм, который принимает на вход два набора категорий (от запроса и от программы) и вычисляет оценку их сходства (Score). Патент упоминает, что это может быть коэффициент корреляции или функция, подсчитывающая количество совпадений между категориями. Цель — количественно оценить, насколько тематика запроса пересекается с тематикой программы.

    Что важнее в контексте этого патента: качество страницы или контекст запроса?

    Контекст запроса является определяющим в этом патенте. Система сначала пытается понять контекст и модифицировать запрос, и только потом применяет стандартные алгоритмы ранжирования качества и релевантности страниц к этому модифицированному запросу. Без понимания контекста даже качественная страница может быть признана нерелевантной уточненному интенту.

    Описывает ли этот патент также рекомендации ТВ-шоу на основе поиска?

    Да, хотя основные Claims (1-20) сосредоточены на модификации запроса на основе просмотра ТВ, в описании патента также рассматривается обратный механизм (Television Program Suggestion System): рекомендация телевизионных программ пользователю на основе его текущих поисковых запросов и выявленных из них интересов.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.