Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует графы социальных связей и поведения пользователей для генерации рекомендаций видео и рекламы (на примере YouTube)

    VIDEO-RELATED RECOMMENDATIONS USING LINK STRUCTURE (Рекомендации, связанные с видео, с использованием структуры ссылок)
    • US8533236B1
    • Google LLC
    • 2013-09-10
    • 2007-11-01
    2007 Shumeet Baluja Мультимедиа Патенты Google Персонализация Поведенческие сигналы

    Google использует гетерогенный граф для анализа взаимосвязей между пользователями, видео, группами и рекламой в социальных сетях (например, YouTube). Система итеративно распространяет «метки интереса» (labels) через эти связи, используя алгоритмы типа Adsorption. Это позволяет генерировать релевантные рекомендации видео или рекламы для пользователя, даже если у него мало собственной истории просмотров, основываясь на интересах его социального окружения.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему генерации релевантных рекомендаций (видеоконтента или рекламы) в условиях разреженности данных (data sparsity) или «холодного старта». Система позволяет вывести (infer) вероятные интересы пользователя, даже если он имеет ограниченную историю взаимодействий (просмотров, кликов) или не предоставил явную информацию о себе. Это достигается путем анализа интересов связанных с ним сущностей (друзей, групп, схожих пользователей) в социальной сети.

    Что запатентовано

    Запатентован метод вывода меток интереса (inferred labels) для сущностей (пользователей, видео, рекламы, групп) в социальной сети. Суть изобретения заключается в построении гетерогенного графа, связывающего эти сущности, и применении алгоритмов итеративного распространения (iterative propagation), таких как Adsorption, для передачи меток через этот граф. Это определяет вероятные интересы сущности на основе интересов ее соседей.

    Как это работает

    Система функционирует следующим образом:

    • Построение графа: Создается граф, где узлы (Nodes) представляют сущности (пользователи, видео, группы, реклама). Ребра (Edges) представляют связи (дружба, просмотр видео, членство в группе).
    • Взвешивание связей: Ребрам присваиваются веса (Weights) на основе силы или частоты взаимодействия (levels of interaction).
    • Инициализация меток (Injection): Определенным узлам (Injection Nodes), например, конкретным видео, присваиваются начальные статические значения меток (initial label values).
    • Итеративное распространение (Propagation): Используется алгоритм (например, Adsorption) для распространения меток по графу. На каждой итерации значение метки узла обновляется на основе взвешенных значений меток его соседей.
    • Нормализация и стабилизация: Значения меток нормализуются. Процесс повторяется до стабилизации.
    • Генерация рекомендаций: Итоговые значения меток (Label Values) используются для выбора релевантного контента или рекламы.

    Актуальность для SEO

    Высокая. Алгоритмы рекомендаций, основанные на графах и коллаборативной фильтрации, являются ядром современных платформ контента, таких как YouTube (который упоминается в описании патента как пример социальной сети) и Google Discover. Принцип использования структуры связей для вывода интересов остается крайне актуальным для понимания распространения контента.

    Важность для SEO

    Патент имеет критическое значение (8/10) для Video SEO (YouTube Optimization) и стратегий продвижения на рекомендательных платформах. Он раскрывает механизм, как поведенческие и социальные взаимодействия напрямую влияют на обнаружение контента (Discovery). Для традиционного веб-поиска влияние минимально, но патент подтверждает экспертизу Google в использовании поведенческих графов для определения релевантности за пределами текстового анализа.

    Детальный разбор

    Термины и определения

    Adsorption Algorithm (Алгоритм Адсорбции)
    Итеративный алгоритм распространения меток, описанный в патенте. На каждой итерации узел «поглощает» (адсорбирует) взвешенные значения меток от своих соседей по графу.
    Edge (Ребро)
    Связь между двумя узлами в графе, представляющая отношения (дружба, просмотр, членство). Ребра могут иметь вес (Weight).
    Graph (Граф)
    Структура данных из узлов и ребер. В данном патенте используется гетерогенный граф, содержащий узлы разных типов (пользователи, видео, реклама и т.д.).
    Inferred Label (Выведенная метка)
    Метка интереса, присвоенная узлу не на основе явных действий, а в результате работы алгоритма распространения.
    Injection Node (Узел инъекции / Узел-источник)
    Узел в графе, которому присваивается начальное, статическое значение метки. Эти узлы служат источниками меток для распространения по сети.
    Iterative Propagation (Итеративное распространение)
    Процесс многократного обновления значений меток узлов на основе значений меток их соседей.
    Label Value (Значение метки)
    Числовая оценка (часто нормализованная от 0 до 1), указывающая на предполагаемый уровень интереса или релевантности метки для данного узла.
    Levels of Interaction (Уровни взаимодействия)
    Метрики активности между пользователями (частота посещений профилей, комментарии, сообщения), используемые для расчета веса ребер.
    Node (Узел)
    Элемент графа, представляющий сущность (пользователя, видео, группу, рекламу, жанр).
    Random Walk (Случайное блуждание)
    Альтернативный алгоритм, упомянутый в описании патента, для оценки значений меток путем моделирования случайных переходов по графу.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод использования социального графа для генерации рекомендаций.

    1. Система получает информацию о взаимодействиях между пользователями социальной сети.
    2. Генерируется граф, где узлы представляют пользователей, а ребра — отношения между ними.
    3. Части узлов присваиваются начальные значения меток (initial label values), указывающие на уровень интереса к связанному контенту.
    4. Определяются итоговые значения меток для узлов на основе итеративного распространения (iterative propagation) начальных значений через ребра графа.
    5. Ключевой механизм: на каждой итерации значение метки конкретного узла определяется путем комбинирования значений меток соседних узлов, связанных с ним.
    6. На основе итоговых значений меток идентифицируются пользователи, которым будет предоставлен контент, связанный с конкретной меткой.

    Ядром изобретения является применение итеративного распространения значений на графе социальных взаимодействий для определения релевантности контента для пользователей, которые могли явно не взаимодействовать с этим контентом.

    Claim 2 (Зависимый от 1): Уточняет механизм взвешивания связей.

    1. Определяются уровни взаимодействия (levels of interaction) между пользователями.
    2. Ребрам графа присваиваются веса (weights) на основе этих уровней.
    3. Значения меток определяются с использованием этих весов.

    Это означает, что более активные или тесные социальные связи сильнее влияют на распространение меток интереса.

    Claims 3-7 (Зависимые от 2): Детализируют, что может считаться «уровнем взаимодействия».

    • Частота посещения профилей других пользователей (Claim 3).
    • Время, проведенное на профилях других пользователей (Claim 4).
    • Комментирование профилей других пользователей (Claim 5).
    • Количество или длина сообщений (email, IM), отправленных другим пользователям (Claims 6, 7).

    Где и как применяется

    Этот патент описывает инфраструктуру системы рекомендаций, применяемую на платформах Google с социальной составляющей и медиаконтентом (например, YouTube).

    CRAWLING & INDEXING (Сбор данных и Построение Графа)
    На этих этапах система собирает данные и строит граф:

    • Сбор данных о пользователях, контенте (видео, жанры) и взаимодействиях (просмотры, дружба, группы, клики по рекламе).
    • Data Structure Generator создает граф сущностей и связей.
    • Relationship Determination Module определяет веса ребер на основе интенсивности взаимодействий (levels of interaction).

    RANKING (Расчет Рекомендаций)
    Основной вычислительный этап.

    • Inferred Label Generator запускает алгоритм итеративного распространения (например, Adsorption) для вычисления Inferred Labels и их значений для всех узлов. Этот процесс может выполняться офлайн или периодически.

    RERANKING (Генерация и Показ Рекомендаций)
    Этап применения рассчитанных данных.

    • Когда пользователь запрашивает контент (например, загружает главную страницу), система использует вычисленные значения меток для его узла, чтобы выбрать и ранжировать наиболее релевантные видео или рекламу для показа в реальном времени.

    Входные данные:

    • Профили пользователей (User Profile Content).
    • История просмотров видео (User Video History Content).
    • Журналы активности (User Activity Log Content), включая взаимодействия и клики по рекламе.
    • Информация о классификации видео (Video Genre Index).

    Выходные данные:

    • Таблица значений меток (Label Value Table) для всех сущностей в графе.
    • Рекомендованные видео или реклама для конкретного пользователя или контекста.

    На что влияет

    • Типы контента: В первую очередь влияет на видеоконтент и рекламу на социальных платформах.
    • Типы запросов: Наибольшее влияние на Discovery (обнаружение контента) и персонализированные рекомендации (главная страница, блок «следующее видео»), а не на ответы по явному поисковому запросу.

    Когда применяется

    • Условия работы: Алгоритм применяется для генерации рекомендаций при доступе пользователя к платформе или при выборе рекламы.
    • Триггеры активации: Особенно эффективен, когда явных данных о предпочтениях пользователя недостаточно (проблема «холодного старта»), но доступна информация о его связях (социальных или поведенческих).

    Пошаговый алгоритм (Adsorption Algorithm)

    Подготовка:

    1. Генерация графа: Создание узлов (пользователи, видео и т.д.) и ребер (связей).
    2. Взвешивание ребер: Определение весов ребер на основе интенсивности взаимодействия.
    3. Выбор меток и инъекция: Определение Injection Nodes (например, Видео-узлы). Им присваивается начальное значение метки (например, 1.0).

    Итеративный процесс:

    1. Инициализация: Установка счетчика итераций. Значения меток для не-инъекционных узлов обнуляются.
    2. Цикл итераций: Повторение до стабилизации или заданного числа итераций.
    3. Обход узлов: Для каждого не-инъекционного узла выполняется пересчет значений его меток.
    4. Расчет вклада соседей: Для каждой метки система суммирует вклады от всех соседних узлов. Вклад соседа рассчитывается как Вес ребра между узлами, умноженный на Значение этой метки у соседа (на предыдущей итерации).
    5. Обновление значения метки: Новое значение метки узла устанавливается равным сумме вкладов соседей.
    6. Нормализация: После обхода всех узлов значения меток для каждого узла нормализуются (например, так, чтобы их сумма равнялась 1.0).

    Какие данные и как использует

    Данные на входе

    Система использует разнообразные данные для построения графа и определения весов связей:

    • Поведенческие факторы (User Activity Log, User Video History):
      • Просмотры видео (частота, время). Критично для связей Пользователь-Видео.
      • Клики по рекламе (Advertisements Selected).
      • Взаимодействия: комментарии, частота и длительность посещения чужих профилей, электронная почта, сообщения (Claims 3-7). Критично для определения веса ребер между пользователями.
    • Социальные факторы (User Profile):
      • Явные связи (Friendships), членство в группах (Group Membership).
    • Контентные факторы: Метаданные видео, описания групп. Используются для определения жанров и формирования имплицитных групп.
    • Пользовательские факторы: Демографическая информация (Demographic Information). Используется для связи пользователей с имплицитными группами (например, «Подростки» на основе возраста).

    Какие метрики используются и как они считаются

    • Label Value (Значение метки): Основная метрика, определяющая релевантность метки для узла. Рассчитывается итеративно через алгоритм Adsorption.
    • Edge Weight (Вес ребра): Метрика силы связи между двумя узлами. Рассчитывается на основе levels of interaction (частота коммуникации, просмотров и т.д.). Чем выше вес, тем сильнее распространение меток через это ребро.
    • Методы вычислений: Используется итеративный алгоритм Adsorption. В описании патента (псевдокод) указан механизм расчета: значение метки L на узле n на итерации t+1 обновляется путем добавления вклада от соседа m: n_{L,t+1} = n_{L,t+1} + ({w_{mn}} * m_{L,t}), где w_{mn} – вес ребра между m и n, а m_{L,t} – значение метки L на узле m на предыдущей итерации t.
    • Нормализация: Значения меток на узле нормализуются, чтобы выразить относительный вклад каждой метки.

    Выводы

    1. Рекомендации через Ассоциации (Guilt by Association): Патент демонстрирует, что интересы пользователя определяются не только его прямыми действиями, но и действиями его социального окружения (друзей, групп) и пользователей со схожим поведением (смотревших те же видео). Интересы распространяются по сети.
    2. Гетерогенный Граф как Модель Интересов: Google объединяет разные типы сущностей (пользователи, контент, реклама) в единый граф. Это позволяет информации перетекать между ними — социальная связь или общий паттерн просмотра может привести к рекомендации контента, который пользователь сам не искал.
    3. Критичность Силы Связей (Edge Weights): Не все связи одинаковы. Система явно учитывает интенсивность взаимодействия (комментарии, сообщения, частота просмотров) для определения веса связи. Более сильные связи эффективнее передают метки интереса.
    4. Преодоление «Холодного старта»: Механизм позволяет генерировать рекомендации при минимальной истории пользователя, если известны его связи. Это критически важно для вовлечения новых пользователей.
    5. Универсальность подхода: Изменяя тип Injection Nodes (источника меток), система может использовать тот же алгоритм для разных задач: рекомендовать видео пользователям, подбирать рекламу для видео или предлагать пользователям вступить в группы.

    Практика

    ВАЖНО: Патент описывает внутренние механизмы систем рекомендаций (например, YouTube), а не ранжирование в веб-поиске. Все рекомендации ниже относятся к Video SEO и стратегиям продвижения контента на рекомендательных платформах.

    Best practices (это мы делаем)

    • Стимулирование значимых взаимодействий (Interaction Strength): Необходимо мотивировать пользователей на действия, которые увеличивают вес связей (Edge Weights). Повторные просмотры, длинные сессии (Watch Time) и активное обсуждение (комментарии) усиливают связи между пользователями и видео. Это напрямую усиливает эффект распространения меток вашего контента.
    • Ориентация на сообщества (User Groups): Создавайте контент, который резонирует с определенными сообществами (явными или имплицитными группами интересов). Популярность видео внутри плотной группы приведет к его рекомендации другим членам этой группы через механизм распространения меток.
    • Оптимизация под совместный просмотр (Co-Watching): Анализируйте, что еще смотрит ваша аудитория. Создание контента, который встраивается в существующие паттерны просмотра и связан с другими авторитетными видео в нише, помогает связать ваш контент с релевантными кластерами пользователей в графе.
    • Стратегический посев для запуска распространения: Используйте таргетированное продвижение для инициации первых просмотров (injection) у целевой, активной аудитории. Как только контент получает просмотры от связанных пользователей, алгоритм распространения подключается и расширяет охват через их связи.

    Worst practices (это делать не надо)

    • Накрутка просмотров нецелевым трафиком или ботами: Привлечение случайных, не связанных пользователей неэффективно и вредно. Это создает «шумные» связи в графе. Если эти пользователи не имеют релевантных связей или их интересы не пересекаются, алгоритм распространения не сможет эффективно передавать метки вашего видео целевой аудитории.
    • Игнорирование социальной составляющей и сообщества: Рассматривать платформу только как хостинг, игнорируя комментарии и взаимодействие. Это приводит к слабому графу связей вокруг контента и снижает потенциал рекомендаций.
    • Фокус только на метаданных и ключевых словах: Полагаться исключительно на оптимизацию заголовков и описаний. Система рекомендаций, описанная в патенте, в первую очередь опирается на поведенческий и социальный граф, а не на текстовую релевантность.

    Стратегическое значение

    Патент подтверждает, что в основе современных систем рекомендаций лежат сложные поведенческие и социальные графы. Для SEO-специалистов это означает, что оптимизация под Discovery (обнаружение контента) требует смещения фокуса с традиционных факторов на понимание аудитории, ее связей и паттернов поведения. Стратегия должна быть направлена на интеграцию контента в социальную и поведенческую ткань платформы.

    Практические примеры

    Сценарий: Продвижение нового видео на YouTube (Обзор нового гаджета)

    1. Задача: Максимизировать охват нового обзора смартфона.
    2. Применение патента (Построение графа и Инъекция): Проводится таргетированный посев (email-рассылка, пост в профильном сообществе) для привлечения первых зрителей, которые уже активно смотрят техно-обзоры и имеют сильные связи на платформе (активные комментаторы, подписчики других техно-каналов). Это создает начальные узлы инъекции с сильными связями.
    3. Применение патента (Распространение меток): Алгоритм Adsorption начинает работать. Пользователь А (техно-энтузиаст) посмотрел видео (сильный вес связи из-за высокого удержания). Система видит, что Пользователь Б часто взаимодействует с Пользователем А или смотрит те же каналы (связь в графе).
    4. Результат: Метка видео быстро распространяется от Пользователя А к Пользователю Б и другим связанным узлам (look-alike аудитория). Видео рекомендуется Пользователю Б, даже если он не искал обзор этого смартфона в этот момент.

    Вопросы и ответы

    Как этот патент связан с традиционным SEO для веб-страниц?

    Напрямую он не описывает ранжирование веб-страниц в поиске. Однако он демонстрирует технические возможности Google по анализу графов поведения пользователей и социальных связей для определения релевантности контента. Эти методы в первую очередь применяются в системах рекомендаций, таких как YouTube или Google Discover, а не в основном веб-поиске.

    Что такое гетерогенный граф в контексте этого патента?

    Это граф, который содержит узлы разных типов (пользователи, видео, группы, реклама, жанры) и связи между ними. В отличие от простого социального графа (только пользователи и дружба), гетерогенный граф позволяет моделировать сложные взаимодействия, например, как просмотр видео связан с членством в группе и как это влияет на выбор рекламы.

    Что такое алгоритм «Адсорбции» (Adsorption)?

    Это итеративный алгоритм распространения меток. Представьте, что интересы (метки) — это жидкость, которая распространяется по сети труб (связям) от источников (узлов инъекции). Алгоритм описывает, как эта жидкость распространяется и смешивается в узлах (пользователях). В итоге каждый узел приобретает определенный набор меток, основанный на том, откуда пришла «жидкость» и насколько широкими были «трубы» (вес связей).

    Как система определяет вес связи (Edge Weight) между пользователями?

    Патент явно указывает (Claims 2-7), что вес определяется на основе «уровня взаимодействия» (levels of interaction). Сюда входят частота и длительность посещения профилей друг друга, количество комментариев, а также объем и частота личных сообщений (email, IM). Чем активнее взаимодействие, тем выше вес связи и сильнее влияние на рекомендации.

    Может ли этот механизм рекомендовать контент, совершенно не связанный с моими предыдущими интересами?

    Да, если ваши социальные связи (друзья или группы) или пользователи со схожим поведением проявляют сильный интерес к новому контенту. Алгоритм распространения может передать метку этого нового контента вашему узлу, особенно если связь с источником интереса имеет высокий вес. Это механизм обнаружения нового через окружение.

    Как SEO-специалисту повлиять на работу этого алгоритма для продвижения видео на YouTube?

    Необходимо сосредоточиться на создании контента, который стимулирует высокое вовлечение (увеличивает вес связей) и формирование сообщества (создает плотный граф). Важно привлекать первичных зрителей, которые имеют сильные связи на платформе (правильный посев). Это ускоряет распространение меток вашего видео.

    Используется ли этот механизм для выбора рекламы?

    Да, патент явно описывает использование механизма для рекомендаций рекламы. Рекламные объявления также являются узлами в графе. Если выбрать их в качестве меток для распространения, система сможет определить, каким пользователям или при просмотре каких видео наиболее релевантно показать конкретную рекламу.

    Что такое имплицитные группы и как они формируются?

    Имплицитные группы формируются автоматически на основе общих характеристик или поведения, а не явного вступления. Например, система может создать группу на основе демографии (возраст) или на основе схожей истории просмотров (например, «Любители Кошек»). Членство в такой группе является дополнительным ребром в графе для распространения меток.

    В чем разница между Injection Node и обычным узлом?

    Injection Node (узел инъекции) служит источником меток и имеет фиксированное, статическое значение метки (например, Видео А всегда имеет метку «Видео А» со значением 1.0). Обычные узлы (например, пользователи) имеют динамические значения меток, которые меняются в процессе итераций по мере того, как они «поглощают» метки от своих соседей.

    Насколько важны повторные просмотры видео согласно этому патенту?

    Повторные просмотры очень важны. Они могут использоваться для увеличения веса ребра (Edge Weight) между пользователем и видео. Более высокий вес означает, что метка этого видео будет сильнее распространяться от этого пользователя к его социальному окружению и похожим пользователям, увеличивая вероятность рекомендаций.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.