Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google решает проблему «холодного старта», присваивая новым авторам начальный рейтинг на основе их атрибутов

    RANKING USER CONTENT BY CONTENT ATTRIBUTES (Ранжирование пользовательского контента по атрибутам контента)
    • US9075862B1
    • Google LLC
    • 2015-07-07
    • 2008-11-13
    2008 EEAT и качество Патенты Google Персонализация Свежесть контента

    Google использует механизм для оценки нового контента от авторов без истории рейтинга. Система идентифицирует атрибуты нового автора (например, email-домен, демографию, членство в группах) и рассчитывает начальный рейтинг на основе существующих оценок других авторов с аналогичными атрибутами. Это позволяет оценить качество контента до получения реальных отзывов пользователей.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему «холодного старта» (Cold Start Problem) при оценке качества контента. Когда новый контент публикуется новым автором, у системы нет исторических данных обратной связи (User Feedback) ни для контента, ни для автора, чтобы определить его качество или рейтинг. Изобретение позволяет сгенерировать начальную оценку (Initial Rating), необходимую для принятия решений о ранжировании и отображении этого контента до получения реальных отзывов.

    Что запатентовано

    Запатентована система для генерации начального рейтинга (Initial Rating) для нового автора или его контента, основанного на атрибутах автора (Attributes). Если у автора нет установленного рейтинга, система идентифицирует его атрибуты (например, email-домен, профессия, членство в группах). Затем она находит других авторов с аналогичными атрибутами, у которых уже есть рейтинги, основанные на отзывах пользователей (User Feedback Based Ratings). Начальный рейтинг нового автора вычисляется на основе агрегированных рейтингов этих схожих авторов.

    Как это работает

    Система работает следующим образом:

    • Обнаружение нового автора: Система получает контент и определяет, что у автора нет существующего рейтинга.
    • Идентификация атрибутов: Attribute Identification Module определяет атрибуты нового автора (например, из данных аккаунта).
    • Поиск когорты: Система находит других авторов, которые имеют общие атрибуты с новым автором и уже имеют рейтинги.
    • Расчет рейтинга атрибута: Вычисляется агрегированный рейтинг для каждого атрибута (например, средний рейтинг всех авторов с доменом @stanford.edu).
    • Генерация начального рейтинга: Rating Generation Module генерирует Initial Rating для нового автора/контента, используя взвешенную комбинацию рейтингов его атрибутов.
    • Переход к реальным рейтингам: По мере поступления реальных отзывов пользователей, начальный рейтинг постепенно вытесняется или сразу заменяется на User Feedback Based Rating.

    Актуальность для SEO

    Высокая. Проблема оценки качества новых авторов и контента (особенно UGC) остается критически важной. Механизмы, описанные в патенте, напрямую связаны с концепциями E-E-A-T, предоставляя способ инициализировать авторитетность и надежность автора через его верифицируемые аффилиации и атрибуты до того, как он заработает собственную репутацию.

    Важность для SEO

    Патент имеет значительное влияние (75/100). Он описывает конкретный механизм того, как Google может инициализировать авторитетность («Authority by Association») для новых авторов. Это подчеркивает стратегическую важность построения четкого профиля автора и его связей с авторитетными организациями или группами для ускорения индексации и получения начального преимущества в ранжировании нового контента.

    Детальный разбор

    Термины и определения

    Attribute (Атрибут)
    Качество, характеристика или свойство, используемое для описания или идентификации автора. Примеры в патенте: домен адреса электронной почты, демографическая информация (возраст, профессия, местоположение), членство в группах (Group Memberships).
    Attribute Identification Module (Модуль идентификации атрибутов)
    Компонент системы, который определяет атрибуты автора на основе предоставленных данных (например, информации об учетной записи).
    Cold Start Problem (Проблема холодного старта)
    Ситуация, когда система не может делать выводы о пользователе (авторе) или элементе (контенте) из-за отсутствия достаточного количества информации или обратной связи.
    Initial Rating (Начальный рейтинг)
    Временный рейтинг (Initial Content Rating или Initial Author Rating), присваиваемый новому контенту или автору до получения обратной связи. Выводится из рейтингов других авторов, имеющих схожие атрибуты.
    Rating Determination System (Система определения рейтинга)
    Система, которая рассчитывает рейтинги на основе обратной связи пользователей.
    User Feedback Based Rating (Рейтинг на основе обратной связи пользователей)
    Рейтинг, присваиваемый контенту или автору на основе явной обратной связи от пользователей (например, «палец вверх/вниз», шкала Лайкерта, добавление в «избранное»).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс присвоения начального рейтинга контенту нового автора.

    1. Система получает первый контент от первого автора.
    2. Определяется, что у первого автора нет присвоенного рейтинга (no assigned rating).
    3. В ответ на это:
      1. Идентифицируются атрибуты (attributes) первого автора.
      2. Идентифицируются другие авторы, которые имеют один или несколько общих атрибутов с первым автором.
      3. Для каждого общего атрибута генерируется рейтинг атрибута. Он основан на рейтингах (полученных из user feedback), присвоенных другим авторам с этим атрибутом.
      4. Генерируется начальный рейтинг контента (initial content rating) для первого контента на основе рейтингов идентифицированных атрибутов.
      5. Этот рейтинг присваивается первому контенту.

    Система решает проблему отсутствия истории у нового автора путем анализа его атрибутов. Она рассчитывает агрегированный рейтинг для каждого конкретного атрибута на основе эффективности уже известных авторов с этим атрибутом. Новый контент наследует начальный рейтинг, полученный из этих рейтингов. Это позволяет системе оценивать качество на основе ассоциации, а не прямой истории.

    Claim 2 и 3 (Зависимые от 1): Описывают два варианта перехода от начального рейтинга к реальному.

    • Claim 2: Устранение (eliminating) начального рейтинга после получения User Feedback Based Rating. Это предполагает немедленную замену.
    • Claim 3: Генерация итогового рейтинга, пропорционального комбинации начального рейтинга и полученных отзывов. Это описывает плавный переход (фазирование), где вес начального рейтинга снижается по мере поступления новых данных.

    Claims 4 и 5 (Зависимые от 1): Указывают конкретные примеры атрибутов.

    • Claim 4: Атрибут — это доменная часть адреса электронной почты (domain portion of an e-mail address).
    • Claim 5: Атрибут — это членство (membership) в той же группе, определяемое списком участников.

    Патент явно определяет институциональную принадлежность (через email) и членство в группах как конкретные атрибуты для определения начального качества.

    Где и как применяется

    Этот механизм в первую очередь работает на этапе индексирования и влияет на начальное ранжирование контента.

    INDEXING – Индексирование и извлечение признаков
    Здесь находится ядро механизма. Когда новый контент индексируется:

    1. Система проверяет историю автора.
    2. Если автор новый или не имеет рейтинга, Attribute Identification Module извлекает его атрибуты.
    3. Система запрашивает существующие данные для расчета агрегированных рейтингов для этих атрибутов.
    4. Rating Generation Module рассчитывает Initial Content Rating или Initial Author Rating.
    5. Этот начальный рейтинг сохраняется как признак документа и/или сущности автора в индексе.

    RANKING – Ранжирование
    На этапе ранжирования Initial Rating используется алгоритмами как сигнал качества/авторитетности (прокси для E-E-A-T), аналогично тому, как User Feedback Based Rating используется для устоявшегося контента.

    RERANKING – Переранжирование (и сбор обратной связи)
    По мере сбора обратной связи от пользователей (после показа в SERP), система обновляет рейтинги. Initial Rating постепенно выводится из употребления (либо немедленно, либо постепенно снижая вес) и заменяется фактическим User Feedback Based Rating.

    Входные данные:

    • Новый контент.
    • Идентификационные данные и атрибуты нового автора.
    • База данных существующих авторов, их атрибутов и связанных с ними User Feedback Based Ratings.

    Выходные данные:

    • Initial Content Rating и/или Initial Author Rating.

    На что влияет

    • Конкретные типы контента: В первую очередь ориентирован на пользовательский контент (UGC), такой как сообщения в блогах, дискуссионные форумы, видео (например, YouTube) и обзоры продуктов (например, Google Maps).
    • Конкретные ниши или тематики: Потенциально сильное влияние в академических, профессиональных и YMYL-тематиках, где атрибуты (например, принадлежность к университету или профессиональной организации) могут иметь сильную корреляцию с качеством и экспертизой.

    Когда применяется

    • Триггеры активации: Активируется, когда система получает контент от автора, у которого нет присвоенного рейтинга (no assigned rating) на основе предыдущей обратной связи пользователей.
    • Исключения: Не применяется, если у автора уже есть установленный рейтинг. В этом случае начальный рейтинг контента может быть основан на существующем рейтинге автора.

    Пошаговый алгоритм

    Процесс А: Присвоение начального рейтинга

    1. Получение контента: Система получает новый контент от первого автора.
    2. Проверка рейтинга автора: Определяется, есть ли у автора существующий User Feedback Based Rating.
    3. Триггер (Нет рейтинга): Если рейтинга нет, процесс продолжается. (Если рейтинг есть, процесс останавливается).
    4. Идентификация атрибутов: Определяются атрибуты первого автора (например, email-домен, профессия).
    5. Поиск похожих авторов: Идентифицируются другие авторы, которые имеют общие атрибуты с первым автором и уже имеют присвоенные рейтинги.
    6. Расчет рейтинга атрибута: Для каждого общего атрибута определяется его рейтинг (например, средний рейтинг всех авторов с этим атрибутом).
    7. Генерация начального рейтинга: Вычисляется Initial Rating на основе рейтингов идентифицированных атрибутов. Это включает взвешивание различных атрибутов.
    8. Присвоение рейтинга: Initial Rating присваивается новому контенту и/или автору.

    Процесс Б: Обновление рейтинга (Переходный период)

    1. Получение обратной связи: Система получает отзывы пользователей о новом контенте.
    2. Расчет рейтинга на основе отзывов: Вычисляется User Feedback Based Rating.
    3. Замена или Комбинирование:
      • Вариант 1 (Замена, Claim 2): Initial Rating удаляется и заменяется на User Feedback Based Rating (возможно, после достижения порога количества отзывов).
      • Вариант 2 (Комбинирование, Claim 3): Генерируется текущий рейтинг как взвешенная комбинация Initial Rating и User Feedback Based Rating. Вес Initial Rating постепенно уменьшается по мере поступления новых отзывов.

    Какие данные и как использует

    Данные на входе

    • Атрибуты автора (Author Attributes): Это ключевые данные для этого патента. Примеры, указанные в тексте:
      • E-mail адрес (в частности, доменная часть, например, @cs.stanford.edu).
      • Идентификационная информация (имя).
      • Демографическая информация (возраст, профессия, местоположение).
      • Членство в группах (Group memberships).
    • Поведенческие факторы (User Feedback): Данные обратной связи по контенту ДРУГИХ авторов (например, «thumbs up/down», шкала Лайкерта, «favorite»). Используются для расчета рейтингов существующих авторов, которые затем используются для расчета начального рейтинга нового автора.

    Какие метрики используются и как они считаются

    • Рейтинг Атрибута (Rating for the identified attribute): Агрегированный рейтинг (например, среднее значение) всех авторов, обладающих определенным атрибутом.
    • Initial Rating (Начальный рейтинг): Рассчитывается на основе рейтингов атрибутов. Патент предлагает использовать взвешенную сумму.
      Пример формулы (из описания): Initial Rating = W_A1 * R_A1 + W_A2 * R_A2 + …
      • R_Ai – Рейтинг атрибута i.
      • W_Ai – Вес атрибута i.
    • Веса Атрибутов (Weights): Коэффициенты, определяющие важность каждого атрибута.
    • Методы машинного обучения: Упоминается использование машинного обучения (например, линейной регрессии) для определения весов W_Ai. Веса корректируются путем сравнения прошлых начальных рейтингов с последующими рейтингами на основе отзывов, чтобы улучшить точность будущих оценок.
    • Масштабирование (Scaling Factor): Упоминается возможность применения понижающего коэффициента. Например, начальный рейтинг может составлять 70% от среднего рейтинга атрибута.

    Выводы

    1. Решение проблемы «холодного старта»: Патент предлагает конкретный алгоритмический механизм для оценки качества нового контента от неизвестных авторов, позволяя системе принимать обоснованные решения о его ранжировании до получения фактической обратной связи.
    2. Авторитет через ассоциацию (Authority by Association): Ключевой вывод — система может инициализировать доверие к автору (E-E-A-T) на основе его атрибутов и принадлежности к определенным группам или организациям. Если авторы из определенной группы в среднем имеют высокий рейтинг, новый автор из этой группы унаследует высокий начальный рейтинг.
    3. Верифицируемые атрибуты как сигналы качества: Конкретные атрибуты, такие как домен электронной почты и членство в группах, явно указаны как источники для оценки качества. Это указывает на важность верифицируемых связей автора.
    4. Динамическое взвешивание атрибутов с помощью ML: Система не просто использует атрибуты, но и определяет их относительную важность с помощью машинного обучения. Веса определяются на основе того, насколько хорошо каждый атрибут предсказывал итоговое качество контента в прошлом.
    5. Временный и переходный характер начального рейтинга: Initial Rating предназначен для использования только на начальном этапе и постепенно (или сразу) заменяется реальной обратной связью пользователей, обеспечивая переход от предполагаемого качества к фактическому.

    Практика

    Хотя патент в первую очередь ориентирован на платформы с пользовательским контентом (UGC), его принципы имеют важное значение для понимания того, как Google может оценивать авторов и инициализировать сигналы E-E-A-T.

    Best practices (это мы делаем)

    • Установление четких атрибутов автора (E-E-A-T): Убедитесь, что авторы контента имеют четкие и верифицируемые атрибуты. Профессиональные ассоциации, образование и принадлежность к признанным группам или организациям должны быть легко идентифицируемы (например, через биографии, профили в профессиональных сетях, структурированные данные Author).
    • Использование профессиональных идентификаторов: Патент предполагает, что использование профессионального или институционального email-домена (например, .edu или корпоративный домен) может служить сильным атрибутом, позволяющим унаследовать авторитет, связанный с этой организацией.
    • Участие в авторитетных сообществах: Активное членство в признанных профессиональных группах или сообществах может рассматриваться как значимый атрибут. Если среднее качество контента от членов этой группы высокое, это может повысить начальный рейтинг нового контента от участника.

    Worst practices (это делать не надо)

    • Анонимный или псевдонимный контент: Использование авторов без четких, верифицируемых атрибутов затрудняет применение этого механизма. Система не сможет найти авторитетные ассоциации и, вероятно, присвоит нейтральный или низкий начальный рейтинг, особенно в YMYL-тематиках.
    • Фальсификация атрибутов: Попытки ассоциировать автора с высокорейтинговыми группами без реальной связи. Если система использует верификацию (например, проверку списка членов группы, как указано в Claim 5), это будет неэффективно и рискованно.
    • Игнорирование репутации ассоциированных групп: Ассоциация с группами или доменами, где среднее качество контента низкое, может привести к наследованию низкого начального рейтинга. Необходимо тщательно выбирать партнеров и платформы для сотрудничества.

    Стратегическое значение

    Патент укрепляет концепцию E-E-A-T, демонстрируя, как авторитет и доверие могут быть частично унаследованы через ассоциации. Это подчеркивает важность не только создания качественного контента, но и построения репутации автора и его связей с авторитетными сущностями. Для SEO-стратегии это означает, что инвестиции в найм экспертов или сотрудничество с авторитетными лицами могут принести пользу быстрее, так как система может использовать их атрибуты для присвоения высокого начального рейтинга их контенту.

    Практические примеры

    Сценарий: Запуск нового медицинского блога с привлеченным врачом.

    • Действие: Новый врач (Автор 1) публикует свою первую статью на сайте. У него еще нет истории публикаций на этой платформе.
    • Применение механизма:
      1. Система идентифицирует атрибуты Автора 1: Профессия=»Врач», Место работы=»Клиника X» (возможно, через email @clinicX.com или данные биографии).
      2. Система ищет других авторов с атрибутом «Клиника X».
      3. Она находит, что другие врачи из Клиники X (Авторы 2-6) уже публиковались и имеют высокий средний User Feedback Based Rating (например, 4.8 из 5).
      4. Система вычисляет Рейтинг Атрибута для «Клиника X» = 4.8.
      5. Система присваивает статье Автора 1 Initial Content Rating (например, 4.8 или масштабированное значение, например 70% от 4.8).
    • Ожидаемый результат: Статья Автора 1 получает преимущество в ранжировании с самого начала благодаря высокому начальному рейтингу, унаследованному от репутации Клиники X, решая проблему «холодного старта».

    Вопросы и ответы

    Что такое проблема «холодного старта» в контексте этого патента?

    Это ситуация, когда в систему поступает новый контент от нового автора. Поскольку нет истории обратной связи ни для контента, ни для автора, системе не на чем основывать оценку качества. Патент предлагает решение, позволяющее сгенерировать начальный рейтинг (Initial Rating) на основе атрибутов автора, чтобы оценить его качество до получения отзывов.

    Какие конкретные атрибуты автора система может использовать для генерации начального рейтинга?

    Патент явно упоминает несколько примеров атрибутов: доменная часть адреса электронной почты (например, принадлежность к .edu или конкретной компании), демографическая информация (возраст, профессия, местоположение) и членство в группах (group memberships). Система использует эти атрибуты для поиска ассоциаций с уже известными авторами.

    Как это влияет на SEO-стратегию по работе с авторами (E-E-A-T)?

    Это подчеркивает важность верифицируемых связей автора. Для SEO-специалистов это означает, что необходимо активно работать над тем, чтобы атрибуты авторов были четко видны поисковым системам. Ассоциация автора с авторитетной организацией (например, через место работы или профессиональную группу) может помочь его новому контенту быстрее занять высокие позиции.

    Является ли начальный рейтинг постоянным?

    Нет, он строго временный. Патент описывает два варианта его замены: либо он немедленно удаляется (Claim 2), как только поступает первая обратная связь от пользователей (User Feedback Based Rating), либо он постепенно вытесняется путем взвешенного комбинирования с поступающими отзывами (Claim 3), при этом вес начального рейтинга снижается по мере накопления данных.

    Может ли ассоциация с определенной группой навредить рейтингу автора?

    Да, это возможно. Начальный рейтинг основан на среднем рейтинге других авторов с тем же атрибутом. Если автор ассоциируется с группой или организацией, члены которой в среднем производят низкокачественный контент и имеют низкие рейтинги, новый автор унаследует низкий Initial Rating.

    Как система определяет, какие атрибуты важнее других?

    Патент предлагает использовать взвешивание атрибутов. Веса могут определяться с помощью методов машинного обучения, например, линейной регрессии. Система анализирует исторические данные, чтобы определить, насколько хорошо тот или иной атрибут предсказывал итоговое качество контента, и соответствующим образом корректирует его вес.

    Применяется ли этот механизм, если у автора уже есть рейтинг?

    Нет. Если у автора уже есть установленный User Feedback Based Rating, этот механизм не активируется. В таком случае система, скорее всего, будет использовать существующий рейтинг автора для оценки его нового контента.

    Как SEO-специалист может использовать эту информацию на практике?

    Необходимо сосредоточиться на построении сильного профиля автора. Используйте структурированные данные (Schema.org/Author), чтобы четко указать образование (alumniOf), место работы (worksFor) и профессиональные ассоциации (memberOf). Это предоставит системе необходимые атрибуты для потенциального присвоения высокого начального рейтинга при публикации нового контента.

    Применяется ли этот механизм только к UGC-платформам?

    В патенте основной фокус сделан на пользовательском контенте (UGC) и работе Content Management System. Однако базовый принцип оценки нового автора по его атрибутам (E-E-A-T) может быть применен к любому типу контента в поиске, где автор может быть идентифицирован и его атрибуты распознаны.

    Какова связь этого патента с E-E-A-T?

    Связь прямая. Патент описывает технический механизм использования сигналов, связанных с экспертизой и авторитетностью (атрибутов автора), для оценки качества контента. Это демонстрирует, что E-E-A-T является важным фактором не только для устоявшегося контента, но и для немедленной оценки новых публикаций через механизм «Authority by Association».

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.