Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google выявляет краткосрочные (темпоральные) связи между ключевыми словами на основе текущих событий для отбора контента

    TEMPORAL CONTENT SELECTION (Временной отбор контента)
    • US10628453B1
    • Google LLC
    • 2020-04-21
    • 2013-06-24
    2013 Патенты Google Свежесть контента Семантика и интент

    Google анализирует свежие документы (новости, социальные сети) и сравнивает их с историческими данными, чтобы выявить новые, внезапно возникшие ассоциации между терминами. Это позволяет системе понять меняющийся контекст и временно связать термины. Эти «временные связи» затем используются для более релевантного отбора контента (преимущественно рекламы) во время актуальности события.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему неспособности систем, основанных на исторических данных, улавливать быстро меняющийся социальный контекст (changing social context). Когда происходят текущие события (новости, тренды), ранее не связанные термины или сущности могут внезапно стать связанными. Изобретение направлено на выявление этих возникающих, временных ассоциаций (temporal meaning) для улучшения релевантности отбора контента.

    Что запатентовано

    Запатентована система (Temporal Content Selector), которая различает устоявшиеся исторические совместные упоминания ключевых слов (historical keyword co-occurrences) и новые, возникающие упоминания. Система создает «временные связи» (Temporal Links) между недавно связанными ключевыми словами (включая концепции и сущности). Ключевым аспектом патента (согласно Claims) является механизм предоставления этих временных связей поставщикам контента (например, рекламодателям), позволяя им выбирать (opt-in) и использовать эти краткосрочные ассоциации для таргетинга.

    Как это работает

    Система работает путем сравнения текущих данных с историческим базовым уровнем:

    • Базовый уровень: Анализируются исторические документы (например, энциклопедии, словари) для создания первой структуры данных (First Data Structure), содержащей устоявшиеся ассоциации.
    • Обнаружение трендов: Анализируются свежие документы (например, новостные ленты, социальные сети).
    • Сравнение: Выявляются совместные упоминания в свежих данных, которых НЕТ в исторической базе. Они сохраняются во второй структуре данных (Second Data Structure).
    • Связывание: Если новое совместное упоминание достаточно частое (всплеск frequency of co-occurrence) и достоверное, создается Temporal Link.
    • Управление сроком: Ссылке присваивается атрибут продолжительности (Duration Attribute) с ограниченным сроком действия, который может динамически корректироваться.
    • Применение: Эти связи предоставляются поставщикам контента, которые могут выбрать их (opt-in) для использования на сервере отбора контента (Content Selection Server).

    Актуальность для SEO

    Высокая. Понимание возникающих тенденций, «свежего» контекста и событий в реальном времени имеет решающее значение для современных систем поиска и рекомендаций контента (таких как Google News, Discover и рекламные платформы). Способность системы адаптироваться к меняющемуся социальному контексту остается ключевой задачей.

    Важность для SEO

    Влияние на SEO среднее (6/10). Патент в первую очередь сфокусирован на системах «Отбора Контента» (Content Selection), что подразумевает рекламные системы (AdTech). Claims явно описывают интерфейс для поставщиков контента (Content Providers). Однако базовый механизм выявления возникающих взаимосвязей критически важен для понимания того, как Google интерпретирует свежий контент и обрабатывает запросы, требующие свежести (QDF). Он подчеркивает важность своевременного создания контента (Newsjacking).

    Детальный разбор

    Термины и определения

    Aggregator (Агрегатор)
    Компонент системы (например, online site aggregator или веб-краулер), который сканирует и анализирует онлайн-документы для выявления совместных упоминаний ключевых слов.
    Content Selection Server (Сервер отбора контента)
    Система, которая использует временные связи для выбора релевантного контента (в первую очередь, рекламы) в ответ на запрос.
    Duration Attribute (Атрибут продолжительности)
    Характеристика Temporal Link, определяющая срок ее действия (limited amount of time). Может быть фиксированным или динамическим.
    First Data Structure (Первая структура данных)
    База данных, содержащая Historical keyword co-occurrences, полученные из анализа устоявшихся источников. Служит базовым уровнем.
    Frequency of Co-occurrence (Частота совместного употребления)
    Метрика, показывающая, как часто два ключевых слова встречаются вместе в наборе свежих документов за определенный период.
    Keyword Linker (Связчик ключевых слов)
    Компонент, который оценивает новые совместные упоминания на предмет достоверности (credibility) и частоты, и создает Temporal Links.
    Second Data Structure (Вторая структура данных)
    База данных новых совместных упоминаний, найденных в свежих документах и отсутствующих в First Data Structure.
    Temporal Link (Временная связь)
    Связь между ключевыми словами (или сущностями/концепциями), указывающая на краткосрочную ассоциацию, основанную на текущих событиях.

    Ключевые утверждения (Анализ Claims)

    Анализ Claims 1-20 патента US10628453B1 показывает четкий фокус на применении технологии поставщиками контента (рекламодателями).

    Claim 1 (Независимый пункт): Описывает метод применения темпоральных связей с участием поставщика контента.

    1. Система идентифицирует наборы темпорально связанных ключевых слов (temporally linked keyword sets). Связь действует ограниченное время (limited amount of time) после обнаружения их совместного упоминания.
    2. Система предоставляет данные об этих наборах для отображения в пользовательском интерфейсе (UI) клиентского устройства поставщика контента (content provider).
    3. Система обнаруживает выбор (opt-in) конкретного набора через этот интерфейс.
    4. В течение ограниченного времени система распространяет (distributing) контент данного поставщика, используя эту временную связь.

    Ядром изобретения, защищенным этим пунктом, является система, которая позволяет поставщикам контента (рекламодателям) явно выбирать или соглашаться (opt-in) на использование этих возникающих темпоральных ассоциаций для таргетинга своего контента.

    Claim 2 (Зависимый от 1): Детализирует процесс распространения контента.

    Система получает запрос, содержащий первое ключевое слово из выбранного набора. Основываясь на временной связи, она выбирает контент поставщика, который связан со вторым ключевым словом из набора (отличным от первого), и передает его в ответ на запрос. Это механизм, при котором запрос по термину А может вызвать показ контента, таргетированного на темпорально связанный термин Б.

    Claim 4 (Зависимый от 1): Описывает триггер для создания этих наборов.

    Обнаружение увеличения количества документов, включающих оба ключевых слова, и генерация временно связанного набора в ответ на это увеличение.

    Claims 5 и 6 (Зависимые от 1): Описывают динамическую корректировку продолжительности связи.

    Ограниченное время может динамически корректироваться на основе показателей эффективности (performance metric, например, CTR) (Claim 5) или на основе продолжающейся частоты совместной встречаемости (frequency of co-occurrence) (Claim 6).

    Claim 7 (Зависимый от 1): Описывает географическую локализацию.

    Темпоральная связь может быть ограничена определенной географической областью. Система использует связь для распространения контента в этой области, но не за ее пределами.

    Где и как применяется

    Изобретение затрагивает инфраструктуру сбора данных, их анализа и применения в системах отбора контента.

    CRAWLING и INDEXING – Сканирование, Индексирование и Сбор данных
    Aggregator постоянно сканирует и парсит как исторические источники (энциклопедии, словари), так и свежие источники (новостные ленты, социальные сети). Извлекаются признаки, включая ключевые слова, сущности и временные метки (publish time stamp).

    QUNDERSTANDING (Обработка данных / Понимание Контекста)
    Система обрабатывает данные в офлайн-режиме или близком к реальному времени. Она строит First Data Structure и Second Data Structure. Keyword Linker анализирует вторую структуру, проверяет достоверность (credibility) и частоту новых связей и генерирует Temporal Links. Достоверность может проверяться путем анализа уникальности источников и даже анализа обратных ссылок (backlinks) для определения связанности документов (упомянуто в Description патента).

    RANKING / METASEARCH (Content Selection / Отбор контента)
    Content Selection Server использует эти ссылки в реальном времени. Когда поступает запрос, система проверяет наличие активных Temporal Links и использует их для выбора контента, если поставщик контента активировал эту функцию (opt-in, согласно Claim 1).

    Входные данные:

    • Исторические и свежие онлайн-документы с временными метками.
    • Данные о достоверности источников (уникальность, ссылки).
    • Выбор темпоральных связей поставщиками контента (Opt-in).
    • Метрики производительности (CTR).
    • Пользовательские запросы.

    Выходные данные:

    • Наборы темпорально связанных ключевых слов (Temporal Links) с атрибутами (Duration Attribute, география).
    • Отобранный контент (например, реклама).

    На что влияет

    • Типы контента и системы: В первую очередь влияет на системы отбора контента и рекламы (Google Ads). В органическом поиске механизм влияет на интерпретацию контента в Google News, Discover и на обработку запросов, требующих свежести (QDF).
    • Специфические запросы: Запросы, связанные с текущими событиями, трендовыми темами, где контекст меняется быстро.
    • Ниши: Новостные медиа, развлечения, политика, спорт и любые области, подверженные быстрым изменениям контекста.
    • Географические ограничения: Система может создавать гео-специфичные темпоральные ссылки (Claim 7).

    Когда применяется

    • Триггеры активации (Генерация ссылки): (1) Выявление нового совместного упоминания в свежих данных, которого нет в исторических. (2) Частота этого совместного упоминания превышает порог (frequency of occurrence threshold) и подтверждена достоверность (credibility).
    • Триггеры активации (Применение ссылки): (1) Ссылка активна (не истек срок действия Duration Attribute). (2) Поставщик контента выбрал эту темпоральную ссылку для использования в таргетинге (согласно Claim 1).

    Пошаговый алгоритм

    Фаза А: Генерация базового уровня (Офлайн)

    1. Сбор исторических данных: Aggregator парсит исторические источники (энциклопедии, словари).
    2. Генерация исторических связей: Создается First Data Structure, содержащая устоявшиеся совместные упоминания ключевых слов.

    Фаза Б: Генерация темпоральных связей (Офлайн / Близко к реальному времени)

    1. Сбор свежих данных: Aggregator парсит свежие источники (новости, социальные сети), фиксируя publish time stamps.
    2. Идентификация и Фильтрация: Выявляются пары ключевых слов в свежих данных. Система удаляет пары, которые уже присутствуют в First Data Structure.
    3. Генерация новых связей: Создается Second Data Structure.
    4. Валидация (Keyword Linker): Анализируется частота (Frequency of Co-occurrence), достоверность и уникальность источников. Проверяется, не являются ли источники связанными (например, один автор, домен или связанность через backlinks – согласно Description).
    5. Связывание: Если пороги частоты и достоверности достигнуты, создается Temporal Link.
    6. Назначение атрибутов: Ссылке присваивается Duration Attribute (фиксированный или динамический) и, возможно, географические атрибуты.
    7. Обслуживание: Мониторинг эффективности (CTR) или частоты для корректировки динамической продолжительности. Удаление ссылки по истечении срока.

    Фаза В: Применение связей (Реальное время)

    1. Предоставление интерфейса: Идентифицированные Temporal Links предоставляются поставщикам контента через UI.
    2. Выбор поставщиком (Opt-in): Система получает выбор от поставщика контента на использование конкретной ссылки (Claim 1).
    3. Обработка запроса: Поступает запрос на контент.
    4. Проверка ссылок: Система ищет активные, выбранные поставщиком Temporal Links, связанные с ключевыми словами запроса.
    5. Отбор контента: Контент поставщика распространяется с использованием ссылки (например, выбирается реклама, связанная с темпорально привязанным ключевым словом, а не с исходным).

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Текст онлайн-документов (исторических и свежих). Используются для выявления ключевых слов и концепций. В Description упоминается использование методов семантического анализа (например, probabilistic latent semantic analysis).
    • Технические факторы: URL/Домены. Используются для определения авторитетности источника и уникальности совместных упоминаний.
    • Временные факторы: Временные метки публикаций (publish time stamps). Критически важны для различения свежего контента от исторического и для расчета частоты за период.
    • Ссылочные факторы: В Description патента упоминается анализ обратных ссылок (backlinks) для определения связанности онлайн-документов и оценки достоверности (credibility) совместных упоминаний (защита от манипуляций одним источником).
    • Географические факторы: Географическое положение, связанное с документом (geographic characteristic). Используется для создания гео-специфичных темпоральных ссылок (Claim 7).
    • Поведенческие факторы: Показатели эффективности (performance metric), такие как CTR или Conversion Rate. Используются для динамической корректировки Duration Attribute (Claim 5).
    • Данные Провайдеров: Явный выбор (opt-in) темпоральных связей поставщиками контента через интерфейс (Claim 1).

    Какие метрики используются и как они считаются

    • Frequency of Co-occurrence (Частота совместного упоминания): Подсчет количества уникальных совместных упоминаний двух терминов в свежих документах в течение определенного временного окна.
    • Пороги достоверности и частоты: Минимальная частота и метрики уникальности источников, необходимые для создания Temporal Link.
    • Duration Attribute (Атрибут продолжительности): Метрика, определяющая время жизни ссылки. Может быть динамическим, корректируемым на основе продолжающейся частоты упоминаний или показателей эффективности.

    Выводы

    1. Разделение исторического и текущего контекста: Патент описывает четкий механизм для выявления возникающих, краткосрочных связей между концепциями на основе текущих событий, и их отделения от исторических норм. Исторические данные (First Data Structure) используются как базовая линия для выявления новизны (Second Data Structure).
    2. Обнаружение трендов на основе частотности и достоверности: Система полагается на всплеск частоты совместной встречаемости (frequency of co-occurrence) и проверяет достоверность источников (включая анализ уникальности и связанности через backlinks) для идентификации значимых трендов и отсеивания спама или совпадений.
    3. Временный характер связей: Создаваемые ссылки (Temporal Links) явно временные, с определенной продолжительностью (Duration Attribute), которая может динамически адаптироваться к жизненному циклу новости или эффективности (CTR).
    4. Критичность взаимодействия с поставщиком контента (Opt-in): Ключевым аспектом, защищенным патентом (Claim 1), является применение в рекламных системах (Content Selection), требующее явного выбора (opt-in) рекламодателем трендовых ассоциаций через интерфейс.
    5. Фундамент для QDF и Real-Time Поиска: Хотя применение описано для рекламы, технология выявления временных связей критически важна для понимания контекста в реальном времени, что является основой для алгоритмов QDF (Query Deserves Freshness) и систем вроде Google News/Discover.

    Практика

    ВАЖНО: Патент в значительной степени ориентирован на системы отбора контента/рекламы, что подтверждается Claim 1. Однако лежащая в его основе технология выявления темпоральных связей имеет критическое значение для органического поиска и контент-стратегии.

    Best practices (это мы делаем)

    • Использование новостной повестки (Newsjacking) и скорость: Быстро создавайте высококачественный контент вокруг срочных новостей и возникающих ассоциаций. Поскольку эти связи имеют ограниченный срок действия (Duration Attribute), скорость публикации имеет решающее значение для захвата трендового трафика.
    • Семантическая ясность и связи сущностей: Четко формулируйте взаимосвязь между сущностями в вашем контенте. Используйте естественные совместные упоминания (co-occurrence) в тексте и заголовках. Это помогает Aggregator правильно идентифицировать и верифицировать связь.
    • Построение авторитетности в новостном контексте: Развивайте сайт как достоверный источник свежей информации. Это увеличивает вероятность того, что ваш контент будет быстро обработан Aggregator и учтен при формировании темпоральных связей, что критично для Google News и Discover.
    • Оптимизация под QDF: Понимание темпоральных связей помогает понять, когда Google активирует алгоритмы свежести (QDF) для определенных запросов, и оптимизировать контент под этот интент.

    Worst practices (это делать не надо)

    • Попытки форсировать ассоциации (Spam): Попытки искусственно создать Temporal Link путем скоординированных упоминаний на низкокачественных сайтах. Система использует проверки достоверности и анализ связанности документов (в том числе через backlinks, как указано в Description) для фильтрации таких манипуляций.
    • Игнорирование текущих событий: Стратегия, основанная только на «вечнозеленом» контенте, упускает возможности для привлечения трафика в моменты, когда контекст запросов быстро меняется из-за новостей.
    • Медленная реакция на тренды: Создание контента по угасающему тренду неэффективно, так как Temporal Link, вероятно, уже истек или его актуальность снижена.

    Стратегическое значение

    Патент подтверждает инвестиции Google в анализ контекста в реальном времени. Он демонстрирует, как Google отделяет «то, что обычно верно» (исторические данные) от «того, что происходит прямо сейчас» (темпоральные данные). Для SEO-специалистов это подчеркивает, что релевантность динамична. Способность быстро реагировать на изменения в информационной среде (Real-Time SEO) становится важным конкурентным преимуществом.

    Практические примеры

    Сценарий: Использование темпоральной связи для органического трафика (Newsjacking)

    1. Событие: Известный спортсмен (Сущность А) неожиданно сфотографирован в кроссовках малоизвестного бренда (Сущность Б).
    2. Действие SEO-специалиста: Сайт обзоров обуви немедленно публикует подробную статью, анализирующую это событие и модель обуви.
    3. Механизм работы системы: Aggregator Google фиксирует всплеск совместных упоминаний «Сущности А» и «Сущности Б» в новостях и социальных сетях. Система подтверждает, что это новая ассоциация (отсутствует в First Data Structure). Создается Temporal Link.
    4. Результат: В течение следующих 48–72 часов поисковые запросы по «Сущности А» могут показывать больше контента, связанного с «Сущностью Б» (и наоборот), особенно в Google News и Discover (активация QDF). Своевременно опубликованная статья имеет хорошие позиции для сбора этого трендового трафика.

    Вопросы и ответы

    Что такое «Temporal Link» (Временная связь) простыми словами?

    Это способ для Google понять, что два термина, которые обычно не связаны друг с другом, временно стали связанными из-за текущего события. Например, если президент упомянул конкретное телешоу, Google создаст временную связь между «президент» и «телешоу». Эта связь существует только пока новость актуальна.

    Этот патент больше про SEO или про рекламу (PPC)?

    Патент в первую очередь описывает применение для Content Selection, что означает рекламу. Claim 1 прямо описывает интерфейс для поставщиков контента (рекламодателей), позволяющий им выбирать (opt-in) эти временные связи для таргетинга. Однако технология, лежащая в основе выявления этих связей, используется Google для понимания свежего контекста, что влияет и на органический поиск (QDF, Google News, Discover).

    Как Google определяет, является ли связь исторической или темпоральной?

    Система поддерживает две базы данных. Первая (First Data Structure) содержит исторические связи, собранные из надежных источников вроде энциклопедий. Вторая (Second Data Structure) содержит связи из свежих документов (новости, соцсети). Если связь появляется во второй базе, но отсутствует в первой, она считается темпоральной (новой).

    Как долго действуют эти темпоральные связи?

    Патент указывает, что ссылкам присваивается атрибут продолжительности (Duration Attribute). Он может быть фиксированным или динамическим. Динамическая продолжительность может продлеваться, если термины продолжают часто упоминаться вместе в новостях (Claim 6), или корректироваться на основе показателей эффективности, например CTR (Claim 5).

    Как система защищается от спамеров, пытающихся искусственно связать термины?

    Система проверяет достоверность (credibility) и уникальность источников. Если совместное упоминание происходит только на одном домене или от одного автора, Keyword Linker может не создать Temporal Link. Также в Description патента упоминается анализ обратных ссылок (backlinks) для определения связанности документов и предотвращения манипуляций.

    Как SEO-специалисту использовать это знание для контент-стратегии?

    Необходимо быстро реагировать на появление новых ассоциаций в вашей нише (Newsjacking). Если вы видите, что две ранее несвязанные темы начинают часто упоминаться вместе в новостях, это сигнал о формировании тренда. Быстрое создание качественного контента, освещающего эту новую связь, позволит собрать трендовый органический трафик.

    Как этот патент связан с алгоритмом QDF (Query Deserves Freshness)?

    Этот патент описывает механизм, который может служить одним из ключевых сигналов для активации QDF. Идентификация Temporal Link для ключевого слова является сильным индикатором того, что контекст этого слова изменился и пользователям требуется самый свежий контент, отражающий этот новый контекст.

    Влияет ли география на временные связи?

    Да, патент (Claim 7) упоминает возможность анализа географических характеристик (geographic characteristic), связанных с новой ассоциацией. Если тренд актуален только для определенного региона, система может создать Temporal Link, который будет активен только для пользователей или запросов из этого региона.

    Требуется ли ручное вмешательство для создания этих связей?

    Процесс генерации связей автоматизирован (анализ данных и применение порогов). Однако процесс применения в рекламе (согласно Claim 1) требует ручного действия со стороны рекламодателя, который должен выбрать (opt-in) использование конкретной временной связи через пользовательский интерфейс.

    Какие источники Google считает «историческими», а какие «свежими»?

    В качестве исторических источников упоминаются онлайн-энциклопедии, словари, биографии. В качестве свежих источников упоминаются онлайн-новости, новостные ленты (news feeds) и документы из социальных сетей. Критерием разделения является временная метка публикации (publish time stamp) и тип источника.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.