
Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.
Патент решает проблему неточности традиционных систем рекомендаций контента, которые полагаются преимущественно на метаданные (ключевые слова, теги) или общую популярность. Эти методы часто предлагают контент, который не соответствует реальным интересам пользователя в данный момент. Изобретение направлено на повышение релевантности рекомендаций (например, блока «Похожие видео») за счет анализа фактических паттернов поведения пользователей для выявления контента, который они совместно потребляют и положительно оценивают.
Запатентована система и метод определения связанных элементов цифрового контента (digital content items), таких как видео, аудио или документы, с использованием коллаборативной фильтрации. Система анализирует журналы доступа (access log) для выявления co-occurring positive interactions (совместно встречающихся позитивных взаимодействий). Если пользователи часто позитивно взаимодействуют с Элементом А и Элементом Б в течение ограниченного временного интервала (locality of time), система определяет эти элементы как связанные, даже если у них нет общих метаданных.
Система работает путем офлайн-анализа поведенческих данных:
sliding window (скользящего окна, например, 1 час).co-occurrence matrix (матрицу совместной встречаемости). Связанный контент ранжируется на основе общего количества позитивных совместных появлений.Высокая. Хотя патент относительно старый, описанные в нем принципы коллаборативной фильтрации, основанной на поведенческих сигналах (таких как время просмотра и поведение в рамках сессии), являются фундаментальными для современных рекомендательных систем, включая YouTube (который явно упоминается в патенте). Понимание этих механизмов остается критически важным для оптимизации контента в 2025 году.
Патент имеет высокое значение (8/10) для SEO на платформах, управляемых рекомендациями (например, YouTube SEO). Он описывает основной механизм, лежащий в основе блоков рекомендаций («Похожие видео»), которые являются важным источником трафика. Патент подчеркивает первостепенную важность поведенческих сигналов (удержание аудитории, время просмотра, вовлеченность) над традиционной оптимизацией метаданных для обнаружения контента через рекомендации.
locality of time).Sliding Window.Claim 1 (Независимый пункт): Описывает основной метод выбора набора связанных цифровых элементов контента.
co-occurring positive interactions для пар контента (первый и второй элемент). Ключевое условие: интерес пользователя к обоим элементам должен проявиться в пределах locality of time (временной близости).count) этих взаимодействий для пар по всем пользователям.Ядро изобретения — использование подсчета совместных позитивных взаимодействий в ограниченном временном промежутке как основного фактора для определения и ранжирования связанного контента.
Claim 5 и 6 (Зависимые): Вводят концепцию взвешивания и временного распада.
Совместное позитивное взаимодействие может быть представлено вещественным весом (real number weight), основанным на мере расстояния (distance measure). Этот вес может уменьшаться (decayed) в зависимости от продолжительности времени между просмотром первого и второго элемента.
Взаимодействия, более близкие по времени, считаются более сильным сигналом связи, чем те, что произошли дальше друг от друга (даже в пределах скользящего окна).
Claim 7 (Зависимый): Предлагает альтернативный метод ранжирования.
Ранжирование связанных элементов может основываться, по крайней мере частично, на общем времени просмотра (total viewing time) каждого из связанных элементов.
Система может предпочесть контент с большим суммарным временем просмотра, даже если количество совместных появлений у него меньше.
Claim 13 (Зависимый): Описывает фильтрацию данных.
Процесс включает фильтрацию количества совместно встречающихся позитивных взаимодействий для удаления взаимодействий, указывающих на то, что доступ к контенту осуществлялся программным обеспечением (ботами).
Изобретение применяется в рамках платформы хостинга контента (например, YouTube) и затрагивает этапы индексирования поведенческих данных и ранжирования рекомендаций.
CRAWLING – Сбор данных (Data Acquisition)
На этом этапе происходит непрерывная запись пользовательских взаимодействий (User Events) в журнал доступа к контенту (Content Access Log).
INDEXING – Индексирование и извлечение признаков (Offline Processing)
Основная работа алгоритма происходит здесь. User Interaction Analysis Server периодически (например, ежедневно) обрабатывает логи. На этом этапе происходит классификация взаимодействий (позитивные/негативные) и расчет Co-occurrence Matrix. Это офлайн-процесс, который извлекает поведенческие признаки и связи между контентом.
RANKING / RERANKING – Ранжирование (Система рекомендаций)
Когда пользователь просматривает элемент контента, система в реальном времени обращается к предварительно рассчитанным данным. Она извлекает список связанных элементов и ранжирует их на основе метрик из Co-occurrence Matrix для отображения пользователю (например, в боковой панели «Похожие видео»).
Входные данные:
Content Access Log, содержащий: User ID, Content ID, Временная метка, Тип взаимодействия (Play, Rate, Rewind, Bookmark, Copy и т.д.), Продолжительность просмотра (Time Offset).Выходные данные:
Co-occurrence Matrix.Процесс анализа взаимодействий (Офлайн)
Content Access Log.reproduction event), добавление в закладки (bookmarking event) – позитивное.Sliding Window (например, 1 час) к последовательности.Co-occurrence Matrix увеличивается.total viewing time) связанных элементов.Патент полностью сосредоточен на поведенческих факторах, извлеченных из логов.
Bookmarking event (добавление в закладки), Reproduction events (копирование, вставка, сохранение, печать – для изображений, документов, веб-страниц).time stamps) событий используются для секвенирования и применения скользящего окна.Positive Interaction. Короткие просмотры или негативные реакции не создают связи.Watch Time используется дважды: сначала для определения того, является ли взаимодействие позитивным (на основе порогов), а затем как возможная альтернативная метрика для ранжирования рекомендаций (Total Viewing Time).Sliding Window гарантирует, что связи основаны на поведении в рамках одной сессии. Система также может перезапускать окно при новом поиске, что указывает на смену интереса пользователя.Рекомендации в первую очередь касаются YouTube SEO и оптимизации контента под рекомендательные системы.
Positive Interaction. Необходимо преодолеть пороги (например, >30 сек или >25-75% просмотра). Используйте сильные хуки и поддерживайте вовлеченность на протяжении всего контента.reproduction event) или добавлять в закладки (bookmarking event).Co-occurring Positive Interactions и попадания в рекомендации.Watch Time Ratio). Это генерирует Negative Interaction, и такой контент не будет рекомендоваться системой.Co-occurrence Matrix.Этот патент описывает фундаментальные принципы работы рекомендательных систем, таких как YouTube. Он подтверждает, что Google активно использует поведенческие данные для понимания взаимосвязей между контентом. Для SEO-стратегии это означает, что успех на платформах, управляемых рекомендациями, зависит от способности создавать контент, который не только привлекает клик, но и удерживает внимание пользователя на длительное время и стимулирует дальнейшее потребление контента в рамках платформы.
Сценарий: Попадание в рекомендации к популярному видео на YouTube
Positive Interaction), сразу после этого (в пределах Sliding Window) посмотрели ваше видео о Ferrari (и также остались довольны – Positive Interaction).Watch Time Ratio (например, >75% для гарантии позитивного взаимодействия).Co-occurring Positive Interactions между двумя видео, увеличит счетчик в Co-occurrence Matrix, и ваше видео начнет ранжироваться в списке рекомендаций к обзору Porsche.Что конкретно считается «Позитивным взаимодействием» (Positive Interaction) согласно патенту?
Патент приводит несколько конкретных примеров. Ключевыми являются: просмотр значительной части контента (например, >75% длины видео), просмотр в течение определенного абсолютного времени (например, >30 секунд), высокая оценка (например, 5/5 звезд). Также учитываются действия, указывающие на повторное потребление (перемотка назад) или сохранение контента (копирование, добавление в закладки).
Что считается «Негативным взаимодействием» (Negative Interaction)?
Негативные взаимодействия включают очень короткие просмотры (например, <5 секунд), просмотр малой части контента (например, <25%), низкие оценки (1/5 звезд). Также к негативным сигналам относятся действия, указывающие на неудовлетворенность: выполнение нового поиска сразу после начала просмотра или открытие других веб-страниц.
Насколько важно время просмотра (Watch Time) согласно этому патенту?
Время просмотра критически важно. Оно используется как минимум в двух контекстах. Во-первых, для определения того, было ли взаимодействие позитивным (преодоление порога). Во-вторых, общее накопленное время просмотра (Total Viewing Time) может использоваться как альтернативный метод ранжирования связанных видео (Claim 7), что может быть даже важнее, чем просто количество совместных просмотров.
Как работает «Скользящее окно» (Sliding Window) и каков его размер?
Sliding Window определяет временной интервал, в течение которого два просмотра считаются связанными. Патент предлагает фиксированный размер (например, 1 час), но также описывает динамические варианты. Окно может быть короче для очень активных пользователей или может перезапускаться, если пользователь вводит новый поисковый запрос, что сигнализирует о смене интереса.
Влияют ли ключевые слова и теги на этот алгоритм рекомендаций?
Нет. Описанный механизм является системой коллаборативной фильтрации, которая полагается исключительно на поведенческие данные пользователей (что они смотрят вместе), а не на метаданные контента. Связь устанавливается, даже если у контента нет общих ключевых слов или тегов.
Как я могу использовать этот патент для улучшения SEO моего YouTube-канала?
Ключевая стратегия — максимизировать время просмотра и удержание аудитории, чтобы гарантировать классификацию взаимодействия как позитивного. Также важно создавать контент, который является логическим продолжением популярных тем в вашей нише, чтобы перехватить аудиторию конкурентов и сгенерировать позитивные совместные появления с их видео.
Что такое «Временной распад» (Time Decay) и как он влияет на рекомендации?
Патент описывает возможность взвешивания совместных появлений на основе времени между ними (Claim 6). Если пользователь посмотрел Видео А и сразу же Видео Б, эта связь получит больший вес, чем если бы он посмотрел Видео Б через 45 минут после Видео А (даже если оба просмотра попали в часовое окно). Это усиливает важность непосредственного потока сессии.
Как система борется с накруткой просмотров ботами?
Патент явно упоминает фильтрацию активности программного обеспечения (ботов) (Claim 13). Система анализирует скорость доступа пользователя. Аномально высокая скорость (например, просмотр 100 видео за 2 минуты, как указано в описании) идентифицируется как активность бота, и эти данные исключаются из анализа.
Может ли этот алгоритм связывать разные типы контента (например, видео и статью)?
Да. Хотя примеры в патенте сосредоточены на видео (YouTube), в тексте и Claims четко указано, что метод применим к любым Digital Content Items, включая документы, изображения, аудио и веб-страницы. Система может определить, что пользователи, прочитавшие определенный документ, часто затем смотрят определенное видео.
Учитывает ли система, в каком порядке был просмотрен контент?
Да. В описании патента указано, что счетчик в Co-occurrence Matrix предпочтительно обновляется однонаправленно (uni-directionally). Если позитивное взаимодействие с V_i предшествует позитивному взаимодействию с V_j, то увеличивается счетчик для пары (V_i, V_j), но не для (V_j, V_i). Это позволяет строить рекомендации типа "Следующее видео".

Поведенческие сигналы
Мультимедиа
Персонализация

Поведенческие сигналы
Мультимедиа
Персонализация

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Мультимедиа
Поведенческие сигналы

Поведенческие сигналы
Персонализация

Мультиязычность
Поведенческие сигналы
SERP

Ссылки

Knowledge Graph
Семантика и интент
Поведенческие сигналы

Поведенческие сигналы
SERP
Мультимедиа

Ссылки
SERP
EEAT и качество

Семантика и интент
SERP
Поведенческие сигналы

Свежесть контента
Антиспам
Ссылки

Поведенческие сигналы

Индексация
Ссылки
SERP

Структура сайта
SERP
Ссылки
