Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует фильтры свежести, актуальности и качества для интеграции социального и персонализированного контента в поиск

    SELECTIVE PRESENTATION OF CONTENT TYPES AND SOURCES IN SEARCH (Выборочное представление типов и источников контента в поиске)
    • US20240176835A1
    • Google LLC
    • 2024-05-30
    • 2013-01-09
    2013 SERP Патенты Google Персонализация Свежесть контента

    Google использует этот механизм для интеграции персонализированного контента (из социальных сетей и подписок пользователя) в общую поисковую выдачу. Система применяет сложное дерево решений, чтобы определить, когда показывать этот контент, основываясь на его свежести (Recency), тематической актуальности (Topicality Score) и общем качестве/релевантности для пользователя (Post Score), а также адаптируясь под трендовые запросы.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему интеграции релевантного пользовательского контента (User-Generated Content, UGC) из социальных сервисов и подписок в стандартные результаты поиска. Цель — повысить персонализацию и своевременность выдачи, предоставив контент из социального графа пользователя (Social Graph), но при этом строго отфильтровать низкокачественный или неактуальный социальный «шум».

    Что запатентовано

    Запатентована система для выборочного смешивания (blending) контента из трех различных источников: публичного веба, социального графа пользователя и его подписок. Ядром изобретения является алгоритм (дерево решений), который оценивает UGC на основе специфических метрик — Topicality Score (актуальность темы), Post Score/Overall Score (общее качество/релевантность) и Recency (свежесть) — и контекста запроса (Trending Query), чтобы решить, следует ли включать его в выдачу.

    Как это работает

    Система работает в несколько этапов:

    • Идентификация: Определяется пользователь, его социальный граф и список подписок.
    • Анализ запроса: Система определяет, является ли запрос трендовым (Trending Query).
    • Параллельный поиск: Извлекаются кандидаты из трех корпусов: публичный веб, социальный контент и контент из подписок.
    • Фильтрация UGC: Социальный контент проходит через дерево решений с адаптивными порогами:
      • Путь 1 (Real-time): Очень свежий И высокоактуальный (высокий Topicality Score) контент.
      • Путь 2 (Trending): Если запрос трендовый, пороги снижаются (допускается умеренная свежесть/актуальность).
      • Путь 3 (Quality): Если первые два условия не выполнены, требуется высокая общая оценка (Post Score).
    • Смешивание: Отобранные результаты из всех трех корпусов объединяются в финальную SERP.

    Актуальность для SEO

    Высокая/Средняя. Хотя патент является продолжением заявки с приоритетом от 2012 года (эпоха Google+), описанные механизмы оценки UGC крайне актуальны в 2025 году. Интеграция пользовательского контента (например, через Perspectives, форумы) и персонализация на основе подписок (например, YouTube, Discover) являются ключевыми направлениями поиска. Описанная логика фильтрации по свежести, актуальности и качеству универсальна.

    Важность для SEO

    Значительное влияние (7/10). Влияние на публичное SEO косвенное, так как патент описывает механизмы персонализации. Однако он критически важен для понимания того, как Google алгоритмически оценивает UGC и как контент с платформ, основанных на подписках и социальном взаимодействии, конкурирует за место в основной SERP. Это влияет на общую стратегию видимости и дистрибуции контента за пределами традиционного веб-сайта.

    Детальный разбор

    Термины и определения

    Access Controlled Content (Контент с контролируемым доступом)
    Контент с настройками приватности, доступный только определенным пользователям (например, личные посты, email, чаты).
    Post Score / Overall Score (PS_POST) (Общая оценка поста)
    Метрика, отражающая качество UGC и его релевантность для конкретного ищущего пользователя. Эта оценка персонализирована.
    Recency (t_DIFF) (Свежесть)
    Разница во времени между моментом запроса и временной меткой UGC (создание, комментарий, репост).
    Social Graph (Социальный граф)
    Набор связей пользователя (люди, ресурсы) в пределах определенной степени разделения. Включает контакты из разных сетей. Вес связей может зависеть от частоты взаимодействия.
    Subscription Search Results (Результаты поиска по подпискам)
    Контент из сервисов, на которые явно подписан пользователь (блоги, видеоканалы, новостные ленты).
    Topicality Score (TS_POST) (Оценка актуальности/тематичности)
    Метрика, указывающая степень, в которой UGC относится к поисковому запросу ИЛИ к актуальной теме, представляющей интерес (matter of interest), например, к новостям.
    Trending Search Query (Трендовый поисковый запрос)
    Запрос, частота использования которого превысила пороговое значение за определенный период времени.
    User-Generated Content (UGC) (Пользовательский контент)
    Контент, созданный с помощью социальных сервисов (соцсети, мессенджеры, блоги и т.д.).

    Ключевые утверждения (Анализ Claims)

    Примечание: В данном патенте US20240176835A1 Claim 1 отменен (canceled). Анализ основан на актуальной формуле изобретения, начиная с Claim 2.

    Claim 2 (Независимый пункт): Описывает архитектуру системы поиска, интегрирующую контент из трех разных источников.

    1. Система получает поисковый запрос и идентификатор пользователя.
    2. Определяются Social search results: UGC из социальных сетей, основанный на Social Graph пользователя.
    3. Определяются Subscription search results: Контент из сервисов подписки, основанный на профиле пользователя.
    4. Определяются Publicly available search results: Публичные веб-ресурсы.
    5. Система определяет финальный набор результатов на основе всех трех типов (социальные, подписные, публичные) и предоставляет их пользователю.

    Ядро изобретения — это система, которая выполняет поиск одновременно по трем различным корпусам данных (один публичный и два персонализированных) и объединяет их.

    Claim 9 и 10 (Зависимые): Уточняют природу социального графа.

    Степень разделения в социальном графе может основываться на частоте взаимодействия (frequency of interaction) пользователя с контактом. Это указывает на динамический характер социального графа, где вес связей зависит от активности пользователя.

    Claims 13-15 (Зависимые, Метод): Детализируют оценку социальных результатов.

    Система получает оценки (scores) для UGC, включая Topicality Score, который указывает на соответствие UGC запросу (Claim 14) или актуальной теме интереса (Claim 15).

    Claims 16-17 (Зависимые, Метод): Уточняют контекст для отбора.

    Определение социальных результатов может основываться на ассоциации с недавно созданным контентом (Recency) (Claim 16) или трендовым запросом (Trending Query) (Claim 17).

    Где и как применяется

    Изобретение затрагивает несколько ключевых этапов поиска для обеспечения персонализации и смешивания результатов.

    INDEXING – Индексирование и извлечение признаков
    Индексируется UGC и контент из подписок. Рассчитываются и сохраняются метрики Topicality Score (TS_POST) и Post Score (PS_POST). Строятся и обновляются социальные графы пользователей, включая веса связей на основе частоты взаимодействия.

    QUNDERSTANDING – Понимание Запросов
    Система определяет, является ли входящий запрос трендовым (Trending Search Query), так как это влияет на логику отбора UGC.

    RANKING – Ранжирование (Отбор кандидатов)
    Происходит параллельный отбор кандидатов из трех разных корпусов: публичного веба, социального индекса и индекса подписок.

    METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
    Основной этап применения патента. Здесь применяется дерево решений, чтобы определить, следует ли включать конкретный UGC в выдачу. Система использует метрики (TS_POST, PS_POST, Recency) и контекст (Trending Query) для принятия этого решения. Затем результаты из трех корпусов смешиваются (Blending). Также определяется формат отображения (например, интеграция изображений в поиск по картинкам).

    Входные данные:

    • Поисковый запрос и User ID.
    • Социальный граф и список подписок пользователя.
    • Индексированный UGC с метриками (TS, PS, временные метки).
    • Индикатор трендовости запроса.

    Выходные данные:

    • Смешанная страница результатов поиска (SERP), интегрирующая публичные, социальные и подписные результаты.

    На что влияет

    • Типы контента: В первую очередь влияет на UGC (посты в соцсетях, блоги, фото, видео) и контент из подписок (статьи, видео с каналов).
    • Специфические запросы: Сильное влияние на запросы, связанные с недавними событиями (QDF), трендовые запросы, а также запросы, где важен социальный контекст или рекомендации (обзоры, мнения).
    • Форматы контента: Система учитывает формат. Например, если UGC содержит только изображение без текста, оно может быть показано в результатах поиска картинок.
    • Персонализация: Механизм является основой для глубокой персонализации выдачи на основе активности и интересов пользователя.

    Когда применяется

    • Условия работы: Алгоритм применяется, когда пользователь авторизован (идентифицирован) и в его персонализированных индексах найден релевантный контент.
    • Условия отображения UGC: UGC отображается только при достижении строгих пороговых значений, определенных в дереве решений. Существует три пути для включения UGC:
      • Путь 1 (Real-time): Высокая свежесть И высокая актуальность (строгие пороги).
      • Путь 2 (Trending): Запрос трендовый И умеренная свежесть И умеренная актуальность (мягкие пороги).
      • Путь 3 (Quality): Высокий Post Score (если Пути 1 и 2 не пройдены).

    Пошаговый алгоритм

    Этап 1: Инициализация и обработка запроса

    1. Определение User ID, получение социального графа и списка подписок.
    2. Получение поискового запроса.
    3. Определение, является ли запрос трендовым (Trending Query).

    Этап 2: Получение результатов

    1. Выполнение параллельного поиска в трех корпусах: публичном, социальном, подписном.
    2. Получение наборов кандидатов.

    Этап 3: Логика отбора UGC (Дерево решений)

    Для каждого элемента социального UGC:

    1. Извлечение данных: Получить TS_POST, PS_POST, временную метку. Рассчитать свежесть (t_DIFF).
    2. Проверка 1 (Путь Real-time):
      • Условие: (t_DIFF < t_THR1 (строгий порог свежести)) И (TS_POST >= TS_THR1 (высокий порог актуальности)).
      • Если ДА: Включить UGC. Завершить проверку.
    3. Проверка 2 (Путь Trending Context): (Если Проверка 1 не пройдена)
      • Условие: Запрос трендовый И (t_DIFF < t_THR2 (мягкий порог свежести)) И (TS_POST >= TS_THR2 (средний порог актуальности)).
      • Если ДА: Включить UGC. Завершить проверку.
    4. Проверка 3 (Путь Quality Fallback): (Если Проверки 1 и 2 не пройдены)
      • Условие: (PS_POST >= PS_THR ( порог качества)).
      • Если ДА: Включить UGC.
      • Если НЕТ: Не включать UGC.

    Этап 4: Смешивание и отображение

    1. Объединить публичные результаты, результаты подписок и отобранный UGC.
    2. Определить формат и позицию отображения.
    3. Отобразить смешанную SERP пользователю.

    Какие данные и как использует

    Данные на входе

    • Пользовательские и Поведенческие факторы:
      • User ID, Социальный граф (список контактов).
      • Частота взаимодействия (frequency of interaction) — используется для определения веса связей в графе (Claim 10).
      • Список подписок пользователя (блоги, каналы).
    • Временные факторы:
      • Временные метки UGC (создание, комментарий, репост) для расчета свежести.
    • Контентные факторы:
      • Текст и медиа-контент внутри UGC. Используются для расчета Topicality Score и определения формата отображения.
    • Системные данные:
      • Данные о частоте запросов для определения Trending Search Query.

    Какие метрики используются и как они считаются

    • Topicality Score (TS_POST): Оценка тематичности/актуальности. Рассчитывается на основе соответствия UGC запросу или актуальным событиям/темам (matter of interest).
    • Post Score / Overall Score (PS_POST): Общая оценка. Персонализированная метрика, основанная на качестве UGC и его релевантности для конкретного пользователя.
    • Recency (t_DIFF): Свежесть. Вычисляется как разница между текущим временем и временной меткой UGC.
    • Пороговые значения: Система использует адаптивный набор порогов:
      • t_THR1, TS_THR1: Строгие пороги свежести и актуальности (Путь 1).
      • t_THR2, TS_THR2: Мягкие пороги для трендовых запросов (Путь 2). При этом t_THR1 < t_THR2 (допускается более старый контент) и TS_THR1 > TS_THR2 (требуется более высокая актуальность для Пути 1).
      • PS_THR: Порог общей оценки (Путь 3).

    Выводы

    1. Архитектура тройного смешивания: Google систематически объединяет результаты из трех разных корпусов: публичного веба, социального графа и подписок. Это подтверждает фундаментальную роль персонализации в поиске.
    2. Сложная и адаптивная фильтрация UGC: Отбор социального контента основан на многоступенчатом дереве решений, которое адаптируется к контексту запроса (трендовости). UGC не попадает в выдачу автоматически.
    3. Иерархия ценности UGC: Система явно приоритизирует контент. Наивысший приоритет у контента, который одновременно очень свежий и высокоактуальный (Real-time). Трендовые запросы снижают эти пороги. Качество (Post Score) используется как резервный механизм для отображения ценного, но не срочного контента.
    4. Персонализированная оценка качества: Post Score учитывает не только качество контента, но и его релевантность для конкретного пользователя, вероятно, используя данные о связях и взаимодействиях в социальном графе.
    5. Динамический социальный граф: Частота взаимодействия влияет на вес связей в социальном графе (Claim 10), подтверждая, что социальные сигналы не статичны и зависят от поведения пользователя.
    6. Гибкость представления: Система определяет не только *что* показывать, но и *где* (например, интеграция изображений из UGC в поиск по картинкам, если отсутствует текст).

    Практика

    Best practices (это мы делаем)

    • Максимизация Topicality и Свежести (QDF): Для контента, чувствительного ко времени (новости, события), скорость публикации и четкое соответствие актуальной теме критичны. Это повышает Topicality Score и улучшает Recency, увеличивая шансы на попадание в выдачу через Путь 1 (Real-time) или Путь 2 (Trending).
    • Развитие базы подписок (Критически важно): Патент выделяет Subscription Search Results как отдельный корпус. Наращивание числа подписчиков на ваши каналы (блоги, YouTube) напрямую увеличивает потенциальный охват вашего контента в персонализированной SERP этой аудитории.
    • Повышение качества и вовлеченности (Post Score): Работайте над качеством контента и его соответствием интересам аудитории. Высокий Post Score (Путь 3) позволяет «вечнозеленому» качественному контенту появляться в выдаче, даже если он не свежий.
    • Стимулирование взаимодействия: Поощряйте комментарии и репосты. Взаимодействия могут обновлять временную метку UGC, улучшая показатель свежести. Кроме того, частота взаимодействия усиливает связи в социальном графе.

    Worst practices (это делать не надо)

    • Создание низкокачественного UGC или социальный спам: Контент низкого качества получит низкий Post Score и будет отфильтрован, даже если он свежий или тематически релевантный.
    • Игнорирование актуальной повестки и трендов: Отсутствие реакции на тренды снижает Topicality Score и упускает возможность использования смягченных порогов (Путь 2) для трендовых запросов.
    • Фокус только на публичном SEO: Игнорирование стратегий UGC и подписок означает упущение значительной части персонализированной поисковой выдачи, где этот контент напрямую конкурирует с публичными результатами за внимание пользователя.

    Стратегическое значение

    Патент демонстрирует стремление Google создать глубоко персонализированный поиск, агрегирующий данные из всех сфер цифровой жизни пользователя. Для SEO это означает, что стратегия должна быть комплексной, охватывая не только веб-сайт, но и платформы UGC, социальные сети и подписные каналы. Успех требует формирования авторитета на этих платформах и создания лояльной аудитории (подписчиков), чей контент будет интегрирован в их персональную выдачу.

    Практические примеры

    Сценарий 1: Путь Real-time (Путь 1) – Запуск продукта

    1. Событие: Крупный бренд запускает новый продукт.
    2. Действие: Авторитетный блогер (на которого подписан пользователь) публикует обзор в течение 30 минут.
    3. Оценка системой: Высокая свежесть (t_DIFF < t_THR1) и высокая актуальность (TS_POST >= TS_THR1).
    4. Результат: Обзор немедленно появляется в персонализированной выдаче пользователя на видном месте.

    Сценарий 2: Путь Trending (Путь 2) – Музыкальный фестиваль

    1. Событие: Проходит популярный фестиваль, запрос становится трендовым.
    2. Действие: Друг пользователя вчера опубликовал фотографии с фестиваля в социальной сети.
    3. Оценка системой: Запрос трендовый. Умеренная свежесть (t_DIFF < t_THR2) и умеренная актуальность (TS_POST >= TS_THR2).
    4. Результат: Фотографии друга интегрируются в выдачу пользователя, несмотря на то что они не были опубликованы только что.

    Сценарий 3: Путь Quality Fallback (Путь 3) – Вечнозеленый контент

    1. Событие: Пользователь ищет «как выбрать палатку». Запрос не трендовый.
    2. Действие: Год назад эксперт по туризму (контакт пользователя или автор из подписок) опубликовал детальное руководство.
    3. Оценка системой: Свежесть низкая. Запрос не трендовый. Однако Post Score очень высокий (PS_POST >= PS_THR) из-за качества и авторитетности эксперта для пользователя.
    4. Результат: Руководство интегрируется в выдачу, несмотря на возраст контента.

    Вопросы и ответы

    В чем ключевое различие между Topicality Score (TS) и Post Score (PS)?

    Topicality Score (TS) измеряет, насколько контент соответствует теме запроса или актуальным событиям (трендам). Это оценка тематической актуальности. Post Score (PS) — это общая оценка, которая измеряет качество контента и его персональную релевантность для конкретного ищущего пользователя. PS учитывает авторитет источника и силу связи в социальном графе.

    Как этот патент влияет на традиционное SEO для публичных сайтов?

    Влияние косвенное. Он не меняет алгоритмы ранжирования публичного веба. Однако он описывает механизм, позволяющий персонализированному контенту (UGC, подписки) конкурировать за место в SERP с органическими результатами. Для SEO-стратега важно понимать эту конкуренцию и то, что видимость сайта может снижаться у пользователей с богатым социальным графом и активными подписками.

    Насколько важны подписки (Subscriptions) согласно этому патенту?

    Они критически важны. Патент выделяет Subscription Search Results как один из трех основных корпусов данных (наряду с вебом и социальным графом). Это означает, что контент из каналов, на которые подписан пользователь (YouTube, блоги), имеет прямой путь в его основную SERP, подчеркивая важность развития базы подписчиков.

    Как система использует информацию о трендовых запросах?

    Если запрос классифицирован как Trending Query, система смягчает требования к свежести и актуальности UGC (используются пороги THR2 вместо THR1). Это позволяет большему количеству умеренно свежего и умеренно актуального социального контента попадать в выдачу для освещения горячих тем.

    Что входит в понятие «Социальный граф» (Social Graph) в этом патенте?

    Определение широкое: включает прямые и косвенные связи (друзья друзей) из разных систем (социальные сети, email, чаты). Важно, что граф динамичен: вес связей может зависеть от частоты взаимодействия (frequency of interaction) пользователя с контактом (Claim 10).

    Может ли старый пост в социальной сети или блоге появиться в выдаче?

    Да, но только если он имеет исключительно высокий Post Score (Путь 3 алгоритма). Если контент не свежий и запрос не трендовый (Пути 1 и 2 не сработали), он должен обладать очень высоким качеством и персональной релевантностью, чтобы быть включенным в выдачу.

    Как рассчитывается свежесть (Recency) контента?

    Свежесть (t_DIFF) — это разница между временем запроса и временной меткой контента. Патент упоминает, что временная метка может относиться не только к созданию контента, но и к событиям, связанным с ним, таким как комментарии или репосты. Это значит, что взаимодействие с контентом может обновлять его свежесть.

    Актуален ли этот патент, учитывая его приоритет от 2012 года (эпоха Google+)?

    Хотя контекст Google+ устарел, базовые принципы оценки UGC (свежесть, актуальность, качество) и архитектура смешивания персонализированного контента остаются универсальными. Эти механизмы могут применяться сегодня к другим платформам UGC (форумы, современные соцсети) и сервисам подписок (YouTube, Discover).

    Учитывает ли система тип контента (текст или изображение) при смешивании?

    Да. Патент упоминает логику размещения. Например, если UGC содержит одно или несколько изображений без текста, он может быть отображен в результатах поиска по картинкам. Если UGC содержит текст, он может быть отображен как стандартный результат в смешанной выдаче.

    Применяется ли этот механизм, если пользователь не вошел в аккаунт?

    Нет. Механизм требует идентификации пользователя для доступа к его социальному графу и списку подписок. Следовательно, интеграция Social Search Results и Subscription Search Results в описанном виде возможна только для авторизованных пользователей.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.