Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google ранжирует пользователей и посты в социальных сетях на основе вероятности взаимодействия

    RANKING USERS AND POSTS IN SOCIAL NETWORKING SERVICES (Ранжирование пользователей и постов в социальных сетях)
    • US8972402B1
    • Google LLC
    • 2015-03-03
    • 2012-05-31
    2012 Kumar Mayur Thakur Патенты Google Персонализация Поведенческие сигналы

    Патент Google, описывающий систему ранжирования контента и авторов внутри социальной сети. Система вычисляет вероятность того, что получатель взаимодействует с постом (комментарий, шейр, одобрение), и использует эти данные для расчета оценок популярности автора (User Ranking Score) и актуальности поста (Item Ranking Score), учитывая затухание актуальности со временем.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу определения наиболее интересного и вовлекающего контента (постов) и наиболее авторитетных пользователей (авторов) внутри социальной сети (social networking service). Цель — улучшить порядок отображения контента в лентах активности (activity stream) пользователей или в результатах внутреннего поиска по социальной сети, отдавая приоритет тем элементам, которые с наибольшей вероятностью вызовут взаимодействие.

    Что запатентовано

    Запатентована система для расчета вероятностных оценок ранжирования для пользователей и отдельных единиц контента в социальной сети. Система использует исторические данные о взаимодействиях (interaction data), таких как лайки, комментарии и репосты, для прогнозирования будущих взаимодействий. На основе этих прогнозов вычисляются две ключевые метрики: User Ranking Score (оценка пользователя) и Item Ranking Score (оценка контента), причем последняя учитывает фактор затухания актуальности со временем (time decay).

    Как это работает

    Система работает путем анализа исторических взаимодействий между автором и получателями его контента:

    • Оценка вероятности взаимодействия: Для каждой пары (автор, получатель) система вычисляет вероятность того, что получатель взаимодействует с контентом автора, на основе прошлых данных (например, отношение числа взаимодействий к числу полученных постов).
    • Расчет User Ranking Score: Система агрегирует эти индивидуальные вероятности (Recipient-Specific User Ranking Scores) по всем получателям автора, чтобы получить общий User Ranking Score.
    • Расчет Item Ranking Score: Для конкретного поста система агрегирует вероятности взаимодействия от всех его получателей, формируя начальную оценку (Initial Item Ranking Score).
    • Применение Time Decay: Начальная оценка поста уменьшается с течением времени с момента публикации, чтобы отразить снижение актуальности.
    • Ранжирование: Полученные оценки используются для упорядочивания пользователей или постов при отображении результатов поиска или лент активности внутри социальной сети.

    Актуальность для SEO

    Низкая для Web SEO. Патент строго сфокусирован на ранжировании внутри social networking services (таких как Google+, который был активен на момент подачи заявки). Хотя концепции вовлеченности и авторитетности автора актуальны, описанные механизмы привязаны к структуре социальной сети (ленты, прямые контакты) и не описывают применение в ранжировании веб-поиска.

    Важность для SEO

    Минимальное влияние (1/10). Патент имеет минимальное значение для стандартных SEO-стратегий, направленных на продвижение в веб-поиске Google. Он описывает алгоритмы ранжирования исключительно внутри социальной сети. В патенте нет информации о том, как эти социальные сигналы или рассчитанные оценки (User Ranking Score) используются для ранжирования веб-документов в основном индексе Google.

    Детальный разбор

    Термины и определения

    Activity Stream (Лента активности)
    Графически отображаемая коллекция единиц контента, которые были распространены пользователю от его контактов в социальной сети.
    Initial Item Ranking Score (RS_IINIT) (Начальная оценка ранжирования контента)
    Агрегированная оценка поста до применения фактора затухания со временем. Рассчитывается как сумма Recipient-Specific Item Ranking Scores.
    Interaction Data (Данные о взаимодействии)
    Данные, представляющие взаимодействия получателей с контентом. Примеры включают: репост (sharing), комментирование (commenting) и одобрение (endorsing) контента.
    Item Ranking Score (RS_ITEM) (Оценка ранжирования контента)
    Итоговая оценка единицы контента (поста), используемая для ранжирования. Рассчитывается путем умножения Initial Item Ranking Score на фактор Time Decay. Отражает текущую актуальность и вовлеченность.
    Recipient-Specific Item Ranking Score (RS_IREC) (Оценка ранжирования контента для конкретного получателя)
    Вероятность того, что конкретный получатель взаимодействует с конкретным постом.
    Recipient-Specific User Ranking Score (RS_REC или RS_RECI) (Оценка ранжирования пользователя для конкретного получателя)
    Вероятность того, что конкретный получатель взаимодействует с контентом, распространяемым данным пользователем (автором), основанная на истории их взаимодействий.
    Social Graph (Социальный граф)
    Структура данных, отражающая связи между пользователями в социальной сети (например, прямые контакты).
    Time Decay (ω) (Затухание со временем)
    Параметр, используемый для снижения оценки ранжирования контента с течением времени после его публикации.
    User Ranking Score (RS_USER) (Оценка ранжирования пользователя)
    Общая оценка пользователя (автора), отражающая его популярность или вовлеченность аудитории. Рассчитывается как агрегация (сумма) всех Recipient-Specific User Ranking Scores этого пользователя.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод ранжирования пользователей и контента в социальной сети.

    1. Система идентифицирует набор единиц цифрового контента, распространенного пользователем.
    2. Система получает данные о взаимодействии (interaction data) двух или более получателей с этим набором контента.
    3. На основе этих данных определяется количество взаимодействий каждого получателя и общее количество распространенных единиц контента.
    4. Система вычисляет: (i) Recipient-Specific User Ranking Score для каждого получателя и (ii) Item Ranking Score для каждой единицы контента.
    5. Расчет Recipient-Specific User Ranking Score основывается на (i) количестве взаимодействий данного получателя и (ii) количестве единиц контента, полученных данным получателем.
    6. Система сохраняет эти оценки и обеспечивает отображение контента на основе User Ranking Score и Item Ranking Score.

    Claim 3 (Зависимый): Уточняет расчет глобальной оценки пользователя.

    Глобальный User Ranking Score для пользователя определяется путем агрегации (суммирования) Recipient-Specific User Ranking Scores по всем получателям.

    Claim 4 (Зависимый): Определяет природу Recipient-Specific User Ranking Score.

    Эта оценка рассчитывается как вероятность того, что получатель будет взаимодействовать с единицей контента, распространяемой данным пользователем.

    Claim 6 (Зависимый): Детализирует процесс расчета Item Ranking Score.

    1. Для каждого получателя определяется Recipient-Specific Item Ranking Score.
    2. Эти оценки агрегируются для определения Initial Item Ranking Score.
    3. Определяется параметр Time Decay для данной единицы контента.
    4. Initial Item Ranking Score снижается (degrading) на основе параметра Time Decay для получения итогового Item Ranking Score.

    Claim 8 и 10 (Зависимые): Описывают применение оценок в контексте поиска внутри социальной сети.

    • Если результаты поиска содержат набор пользователей (Claim 8), система получает их User Ranking Scores, определяет порядок ранжирования и отображает пользователей в этом порядке.
    • Если результаты поиска содержат набор единиц контента (Claim 10), система получает их Item Ranking Scores, определяет порядок ранжирования и отображает контент в этом порядке.

    Где и как применяется

    Изобретение применяется исключительно в рамках social networking service. Оно не связано напрямую со стандартной архитектурой веб-поиска Google, но его можно условно сопоставить с этапами обработки данных внутри социальной платформы.

    CRAWLING & INDEXING (Социальной сети)
    На этом этапе система собирает и индексирует данные, необходимые для расчетов:

    • Данные о контенте и распространении: Посты, время их публикации, автор, список получателей (ACL).
    • Interaction Data: Все взаимодействия пользователей с контентом (комментарии, репосты, одобрения).
    • Исторические данные: Поддерживаются счетчики взаимодействий и доставок для каждой пары автор-получатель.

    RANKING (Социальной сети)
    На этом этапе происходит вычисление метрик. Это может происходить периодически (офлайн) или динамически (в момент взаимодействия).

    • Вычисляются User Ranking Scores и Item Ranking Scores с использованием вероятностных моделей и исторических данных.
    • Применяется Time Decay к оценкам контента.

    RERANKING / METASEARCH (Социальной сети)
    Финальное применение оценок для отображения.

    • При генерации Activity Stream для пользователя посты упорядочиваются на основе их Item Ranking Scores.
    • При выполнении поиска внутри социальной сети результаты (профили пользователей или посты) упорядочиваются с использованием соответствующих оценок.

    Входные данные:

    • Набор постов, распространенных пользователем.
    • Interaction data от получателей этих постов.
    • Social Graph (для определения получателей/контактов).
    • Временные метки публикаций.

    Выходные данные:

    • User Ranking Score для автора.
    • Item Ranking Score для каждого поста.
    • Упорядоченный список пользователей или постов для отображения.

    На что влияет

    • Конкретные типы контента: Влияет на все типы цифрового контента, распространяемого в социальной сети (текстовые посты, изображения, видео, ссылки).
    • Специфические запросы: Влияет на результаты внутреннего поиска в социальной сети, когда ищутся пользователи или посты. Также влияет на порядок контента в ленте активности (Activity Stream).

    Когда применяется

    • Триггеры активации:
      • Генерация ленты активности для пользователя.
      • Выполнение поискового запроса пользователем внутри социальной сети.
      • Обновление данных (периодическое или динамическое после нового взаимодействия).
    • Временные рамки: Item Ranking Score постоянно меняется из-за фактора Time Decay и новых взаимодействий. User Ranking Score меняется по мере накопления новых исторических данных о взаимодействиях.

    Пошаговый алгоритм

    Процесс А: Расчет User Ranking Score (RS_USER)

    1. Идентификация получателей: Определяется набор получателей (например, прямые контакты автора), которые получали контент от пользователя.
    2. Сбор исторических данных: Для каждого получателя (i) извлекаются данные:
      • Q[i]: Количество взаимодействий получателя i с контентом автора.
      • T[i]: Общее количество единиц контента, полученных получателем i от автора.
    3. Расчет Recipient-Specific User Ranking Score (RS_REC): Для каждого получателя вычисляется вероятность взаимодействия по формуле: RS_REC[i] = (Q[i] + α) / (T[i] + β) (где α и β — константы для сглаживания).
    4. Агрегация: Вычисляется глобальный User Ranking Score как сумма индивидуальных оценок: RS_USER = Σ RS_REC[i].
    5. Хранение: User Ranking Score сохраняется (например, в индексе пользователей).

    Процесс Б: Расчет Item Ranking Score (RS_ITEM)

    1. Идентификация получателей поста: Определяется набор получателей конкретного поста.
    2. Расчет Recipient-Specific Item Ranking Score (RS_IREC): Для каждого получателя (i) вычисляется вероятность взаимодействия с этим постом. Это может быть основано на исторических данных (аналогично RS_REC) или установлено в максимум (например, 1), если взаимодействие уже произошло.
    3. Расчет Initial Item Ranking Score (RS_IINIT): Вычисляется начальная оценка поста как сумма индивидуальных оценок: RS_IINIT = Σ RS_IREC[i].
    4. Определение Time Decay (ω): Вычисляется время (t), прошедшее с момента публикации поста. Рассчитывается фактор затухания. В описании патента приводится пример формулы: ω = 1/t^k.
    5. Расчет итоговой оценки: Вычисляется финальный Item Ranking Score путем применения затухания: RS_ITEM = (RS_IINIT) * (ω).
    6. Хранение: Item Ranking Score сохраняется (например, в наборе данных поста).

    Процесс В: Применение оценок при поиске

    1. Получение запроса: Система получает поисковый запрос внутри социальной сети.
    2. Получение результатов: Генерируется набор результатов (пользователи и/или посты).
    3. Извлечение оценок: Если результаты содержат пользователей, извлекаются их User Ranking Scores. Если содержат посты, извлекаются их Item Ranking Scores.
    4. Определение порядка: Результаты сортируются на основе извлеченных оценок (например, в порядке убывания).
    5. Отображение: Результаты предоставляются пользователю в определенном порядке.

    Какие данные и как использует

    Данные на входе

    • Поведенческие факторы: Ключевые данные для расчета. Interaction data (одобрения, репосты, комментарии). Исторические счетчики взаимодействий (Q, G) и счетчики полученных постов (T, F) для пар автор-получатель.
    • Временные факторы: Время публикации поста (используется для расчета Time Decay). Период, за который собираются исторические данные.
    • Структурные факторы (Социальные): Social Graph или списки контактов используются для определения набора получателей контента.

    Какие метрики используются и как они считаются

    Система использует вероятностную модель (похожую на Байесовскую оценку) для расчета метрик.

    • RS_REC (Вероятность взаимодействия получателя с автором): RS_REC[i] = (Q[i] + α) / (T[i] + β).
      • Q[i] = число взаимодействий получателя i с автором.
      • T[i] = число постов, полученных получателем i от автора.
      • α и β = константы (например, от 0.5 до 1), используемые для сглаживания и предоставления оценки при отсутствии исторических данных (приоры).
    • RS_USER (Общая оценка автора): RS_USER = Σ RS_REC[i]. Отражает общее количество ожидаемых взаимодействий с контентом автора в будущем.
    • RS_IREC (Вероятность взаимодействия получателя с постом): Может рассчитываться аналогично RS_REC или устанавливаться в 1, если взаимодействие произошло.
    • RS_IINIT (Начальная оценка поста): RS_IINIT = Σ RS_IREC[i].
    • Time Decay (ω): Фактор затухания, зависящий от времени (t) с момента публикации.
    • RS_ITEM (Итоговая оценка поста): RS_ITEM = (RS_IINIT) * (ω).

    Выводы

    1. Фокус на взаимодействиях внутри социальной сети: Патент описывает сложную систему для измерения и прогнозирования вовлеченности пользователей исключительно в контексте социальной сети (например, Google+). Он не предоставляет доказательств использования этих сигналов в веб-поиске Google.
    2. Персонализированные вероятности как основа ранжирования: Ядром системы является расчет вероятности взаимодействия между конкретными парами пользователей (автор-получатель) на основе их истории. Это указывает на высоко персонализированный подход к оценке релевантности контента.
    3. Авторитет пользователя как сумма ожидаемых взаимодействий: User Ranking Score определяется не общим количеством контента или ссылок, а агрегированной вероятностью того, что его аудитория будет взаимодействовать с его будущим контентом.
    4. Актуальность контента и Time Decay: Патент явно включает механизм Time Decay для Item Ranking Score. Это означает, что актуальность поста быстро снижается со временем, независимо от его начальной популярности.
    5. Инфраструктурный характер патента: Патент описывает внутренние процессы платформы социальной сети и не содержит прямых рекомендаций для SEO-специалистов, работающих с веб-поиском.

    Практика

    Практическое применение в SEO

    ВАЖНО: Патент является инфраструктурным и описывает механизмы ранжирования внутри социальной сети (например, Google+). Он не дает практических выводов для SEO-специалистов, занимающихся продвижением сайтов в веб-поиске Google.

    Best practices (это мы делаем)

    Не применимо к веб-поиску.

    Если рассматривать патент в контексте работы с социальными сетями (SMM), то он подтверждает важность стимулирования реального взаимодействия (комментарии, репосты, лайки) с контентом. Важно, чтобы подписчики были активными, так как система оценивает вероятность взаимодействия (Engagement Rate).

    Worst practices (это делать не надо)

    Не применимо к веб-поиску.

    В контексте SMM: Накрутка подписчиков, которые не взаимодействуют с контентом, неэффективна. Согласно модели, если число получателей (T) увеличивается, а число взаимодействий (Q) нет, то Recipient-Specific User Ranking Score будет снижаться.

    Стратегическое значение

    Патент демонстрирует технический подход Google к измерению качества и авторитетности на основе данных о поведении пользователей и взаимодействиях. Он подтверждает использование вероятностных моделей для прогнозирования ценности контента. Хотя этот конкретный патент ограничен социальными сетями, он иллюстрирует общую философию Google: оценка качества через измеримое вовлечение пользователей и учет актуальности (Time Decay).

    Практические примеры

    Практических примеров для SEO нет, так как патент описывает работу социальной сети. Ниже приведен пример работы алгоритма внутри социальной сети.

    Сценарий: Ранжирование постов в ленте активности

    1. Пользователи: Получатель (П). Автор А и Автор Б.
    2. История Автора А: П получил от А 100 постов (T=100) и взаимодействовал с 5 из них (Q=5). Вероятность взаимодействия (RS_REC) ≈ 5%.
    3. История Автора Б: П получил от Б 20 постов (T=20) и взаимодействовал с 10 из них (Q=10). Вероятность взаимодействия (RS_REC) ≈ 50%.
    4. Новые посты: Автор А и Автор Б публикуют новые посты одновременно.
    5. Расчет Initial Item Ranking Score: Система использует вероятности взаимодействия для расчета начальных оценок постов. Пост Автора Б получит значительно более высокую начальную оценку для Получателя П.
    6. Time Decay: Так как посты опубликованы одновременно, фактор затухания одинаков.
    7. Результат: В ленте активности Получателя П пост Автора Б будет показан выше поста Автора А, так как его итоговый Item Ranking Score выше.

    Вопросы и ответы

    Означает ли этот патент, что лайки и репосты в социальных сетях являются фактором ранжирования в Google Поиске?

    Нет. Патент строго описывает методы ранжирования пользователей и постов внутри социальной сети (social networking service). В тексте нет упоминаний об использовании этих сигналов или рассчитанных оценок (User Ranking Score, Item Ranking Score) для ранжирования документов в основном веб-поиске Google. SEO-специалистам не следует использовать этот патент как доказательство влияния социальных сигналов на веб-ранжирование.

    Что такое User Ranking Score и как он рассчитывается?

    User Ranking Score — это общая оценка пользователя (автора) в социальной сети, которая отражает ожидаемый уровень вовлеченности его аудитории. Он рассчитывается путем суммирования индивидуальных вероятностей взаимодействия (Recipient-Specific User Ranking Scores) по всем его контактам. Если у автора много контактов, которые часто взаимодействуют с его контентом, его User Ranking Score будет высоким.

    Что такое Item Ranking Score и почему он отличается от User Ranking Score?

    Item Ranking Score — это оценка конкретного поста. Она также рассчитывается на основе агрегированных вероятностей взаимодействия с этим конкретным постом. Ключевое отличие заключается в том, что к Item Ranking Score применяется фактор Time Decay (затухание со временем). Это означает, что даже очень популярный пост от авторитетного пользователя быстро потеряет свои позиции в ленте по мере устаревания.

    Как работает механизм Time Decay в этом патенте?

    Механизм Time Decay (ω) снижает начальную оценку поста (Initial Item Ranking Score) в зависимости от времени (t), прошедшего с момента публикации. В патенте приводится пример формулы ω = 1/t^k. Это означает, что чем старше пост, тем ниже будет его итоговый Item Ranking Score, что приводит к понижению его позиций в лентах активности или результатах поиска внутри социальной сети.

    Имеет ли этот патент отношение к E-E-A-T или Author Authority в веб-поиске?

    Прямого отношения нет. Патент описывает способ расчета авторитетности автора (User Ranking Score) на основе вовлеченности его аудитории внутри социальной сети. Хотя концептуально это похоже на измерение авторитетности, технические сигналы, используемые здесь (прямые взаимодействия в социальной сети), отличаются от тех, которые Google использует для оценки E-E-A-T в веб-поиске.

    Что такое Recipient-Specific User Ranking Score?

    Это ключевой элемент системы. Он представляет собой вероятность того, что конкретный получатель будет взаимодействовать с контентом от конкретного автора. Он рассчитывается на основе истории их взаимодействий: отношение количества взаимодействий к общему количеству полученных постов. Например, если вы взаимодействовали с 3 из 10 постов от друга, ваша индивидуальная оценка для этого друга будет около 30%.

    Используются ли в расчетах константы α и β?

    Да, в формуле расчета вероятности (Q + α) / (T + β) используются константы α и β. Они служат для сглаживания данных и позволяют системе предоставить оценку (приорную вероятность) даже для новых пользователей или пар, у которых еще нет истории взаимодействий. Это стандартная практика в вероятностных моделях.

    Может ли пользователь с небольшим количеством подписчиков иметь высокий User Ranking Score?

    Да. Если небольшое количество подписчиков очень активно взаимодействует с контентом автора (высокий процент взаимодействий), его User Ranking Score может быть выше, чем у пользователя с большим количеством пассивных подписчиков. Система фокусируется на качестве и вовлеченности связей, а не только на их количестве.

    Где именно используются эти оценки ранжирования?

    Согласно патенту, они используются в двух основных сценариях внутри социальной сети. Во-первых, для упорядочивания постов в ленте активности (Activity Stream) пользователя. Во-вторых, для ранжирования результатов поиска (как постов, так и профилей пользователей) при выполнении запроса внутри социальной сети.

    Какова практическая польза этого патента для SEO-специалиста сегодня?

    Практическая польза для задач веб-SEO минимальна. Однако патент полезен для глубокого понимания того, как Google подходит к разработке алгоритмов ранжирования на основе поведенческих данных. Он демонстрирует использование вероятностных моделей и важность учета временного фактора (актуальности) при оценке контента, что является общим принципом в информационном поиске.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.