Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google управляет асессорами: расчет Доверия (Trust Score) и агрегация оценок контента с учетом контекста

    SYSTEM AND METHOD FOR RATING ELECTRONIC DOCUMENTS (Система и метод для рейтинга электронных документов)
    • US20100070510A1
    • Google LLC
    • 2010-03-18
    • 2004-03-30
    2004 EEAT и качество Антиспам Патенты Google Поведенческие сигналы

    Google использует инфраструктуру для масштабируемой оценки электронных документов (включая веб-страницы и рекламу) с помощью распределенной сети асессоров. Система присваивает асессорам «Trust Score» (Оценку Доверия) и агрегирует их отзывы, учитывая контекстуальную чувствительность («Sensitivity Score»). Эти механизмы критичны для сбора данных, обучения ML-моделей и оценки качества контента.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему масштабируемой и надежной оценки большого количества электронных документов на предмет их уместности (appropriateness) и качества для разнообразной аудитории. Он устраняет ограничения централизованного ручного анализа (время и затраты) путем распределения задачи между множеством оценщиков (Evaluators). Также решается задача обеспечения качества и валидации этих распределенных оценок, а также адаптации показа контента под специфические требования и чувствительность получателя.

    Что запатентовано

    Запатентована система для агрегации и использования оценок контента от распределенных асессоров. Ключевым механизмом является присвоение Trust Score (Оценки доверия) каждому асессору, что позволяет взвешивать их отзывы при расчете Aggregate Rating (Агрегированного рейтинга) документа. Система также использует Sensitivity Score (Оценку чувствительности) для определения уровня консерватизма при агрегации и Suitability Standard (Стандарт пригодности) для принятия решения о доставке или ранжировании контента.

    Как это работает

    • Распределение задач: Сервер выбирает документы (веб-страницы, рекламу) и назначает их асессорам (Evaluators) для оценки по заданным критериям.
    • Учет доверия (Trust Score): Каждому асессору присваивается Trust Score, основанный на его истории, точности оценок, репутации и т.д.
    • Контекстная агрегация (Sensitivity Score): Система рассчитывает Aggregate Rating, взвешивая отзывы на основе Trust Score. Алгоритм агрегации корректируется с помощью Sensitivity Score, который определяет уровень консерватизма (например, в YMYL-темах система будет более строгой).
    • Применение: При запросе контента система использует Aggregate Rating для принятия решений о фильтрации (Claim 1) или ранжировании (Claim 12) документа, учитывая профиль получателя (Suitability Standard).

    Актуальность для SEO

    Высокая. Описанные концепции являются фундаментальными для систем, использующих человеческую оценку (Human Evaluation). Механизмы управления надежностью асессоров (Trust Score) и агрегации их мнений критически важны для работы систем типа Google Quality Raters и для сбора высококачественных данных для обучения ML-моделей, оценивающих E-E-A-T и качество контента.

    Важность для SEO

    Патент имеет высокое стратегическое значение (8.5/10). Он описывает инфраструктуру, позволяющую Google масштабировать и валидировать человеческую оценку качества. Хотя примеры часто касаются рекламы, патент определяет «документ» широко (включая веб-страницы) и явно упоминает ранжирование на основе этих оценок (Claim 12). Это дает ключевое понимание того, как Google технически реализует работу асессоров (Quality Raters), подчеркивая важность соответствия контента критериям, по которым работают наиболее доверенные эксперты.

    Детальный разбор

    Термины и определения

    Aggregate Rating (Агрегированный рейтинг)
    Итоговая оценка документа, рассчитанная путем обработки оценок от асессоров. Учитывает Trust Scores и Sensitivity Scores. Может рассчитываться разными методами (среднее, медиана, мода и т.д.).
    Document / Electronic Document (Документ / Электронный документ)
    Любой оцениваемый контент. Патент определяет его широко: реклама, контентные страницы (веб-страницы), результаты поиска, электронные письма, приложения, аудио/видео файлы.
    Evaluator (Асессор, Оценщик)
    Лицо или группа, оценивающая документы. Могут быть третьими сторонами или партнерами. В контексте SEO это инфраструктура для Quality Raters.
    Evaluation Information (Оценочная информация)
    Общий термин, включающий Rating Information и Trust Information. Используется для ранжирования документов (Claim 12).
    Sensitivity Score (Оценка чувствительности)
    Метрика, указывающая уровень консерватизма, который следует применять при агрегации оценок. Высокая чувствительность (например, в YMYL) означает более строгий подход (например, учет даже единичных негативных оценок).
    Suitability Standard (Стандарт пригодности)
    Набор критериев или профиль, связанный с получателем контента, определяющий, какой контент является для него уместным. Основан на демографии, предпочтениях, времени суток и т.д.
    Trust Score (Оценка доверия)
    Метрика, присваиваемая асессору, которая определяет вес его оценки при расчете Aggregate Rating. Основана на надежности, истории, точности и профиле асессора.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод оценки и фильтрации контента.

    1. Система получает информацию о рейтинге (rating information) документа от одного или нескольких асессоров.
    2. Идентифицируется Trust Score для каждого асессора. Это мера того, насколько рейтинг асессора учитывается при определении агрегированного рейтинга, основанная на факторах, связанных с асессором.
    3. Идентифицируется Sensitivity Score, указывающий уровень консерватизма для определения агрегированного рейтинга.
    4. Определяется Aggregate Rating для документа на основе полученных рейтингов, Trust Scores и Sensitivity Score.
    5. Получается запрос от получателя.
    6. Идентифицируется предпочтительный агрегированный рейтинг (preferred aggregate rating), связанный с запросом.
    7. Принимается решение о доставке (фильтрация) документа, основываясь на том, удовлетворяет ли Aggregate Rating документа предпочтительному рейтингу.

    Claim 12 (Независимый пункт): Описывает метод использования оценочной информации для ранжирования.

    1. Система ассоциирует оценочную информацию (evaluation information), включающую информацию о доверии (trust information) и информацию о рейтинге (rating information), с документами.
    2. Получается запрос на документы.
    3. Документы ранжируются на основе этой оценочной информации в ответ на запрос.
    4. Предоставляются ранжированные документы.
    5. Информация о доверии (trust information) обновляется на основе ранжирования (механизм обратной связи).

    Claim 5 и 6 (Зависимые от 1): Уточняют факторы для Trust Score.

    Trust Score может основываться на предыдущих оценках контента (prior content ratings), полученных от этого асессора (Claim 5), или на отрасли (industry), связанной с асессором (Claim 6).

    Где и как применяется

    Изобретение описывает инфраструктуру оценки качества и уместности контента, затрагивающую несколько этапов поисковой архитектуры.

    INDEXING – Индексирование и извлечение признаков
    На этом этапе (или в аналогичных офлайн-процессах) происходит основная работа по оценке:

    • Система распределяет документы между асессорами (Evaluators) и собирает их оценки (Content Ratings).
    • Система рассчитывает и обновляет Trust Scores для асессоров на основе их работы, профиля и сравнения с другими асессорами.
    • Система рассчитывает Aggregate Ratings для документов. Эти рейтинги сохраняются как признаки (сигналы) документа в индексе (Aggregate Rating Database).

    RANKING / RERANKING – Ранжирование и Переранжирование
    На этапе обработки запроса система использует рассчитанные данные для принятия решений:

    • Система определяет профиль получателя (Suitability Standard, Sensitivity Score).
    • Aggregate Ratings документов-кандидатов сравниваются с требованиями получателя.
    • Система принимает решение о фильтрации (Claim 1) или использует оценочную информацию (Evaluation Information) как фактор ранжирования (Claim 12).

    Входные данные:

    • Электронные документы (веб-страницы, реклама).
    • Content Ratings от асессоров.
    • Данные об асессорах (история оценок, демография, репутация, отрасль).
    • Данные о получателях контента (предпочтения, демография).

    Выходные данные:

    • Aggregate Ratings для документов.
    • Trust Scores для асессоров.
    • Отфильтрованный или ранжированный список документов в ответ на запрос.

    На что влияет

    • Конкретные типы контента: Влияет на любой «электронный документ». Особенно сильно влияет на контент, требующий субъективной оценки качества и уместности.
    • Конкретные ниши или тематики: Критическое влияние на YMYL-тематики и контент, связанный с чувствительными темами: насилие, сексуальный контент, алкоголь/наркотики, контент для детей, а также контент, который может быть оскорбительным для определенных групп (раса, религия, национальность).
    • Языковые и географические ограничения: Система явно учитывает географию и культуру. Trust Scores могут зависеть от местоположения асессора, а Suitability Standards зависят от профиля пользователя (включая страну).

    Когда применяется

    • Триггеры активации: 1) Необходимость оценить новый или обновить оценку существующего контента (офлайн). 2) Поступление запроса на доставку контента, требующего проверки его уместности или оценки качества для ранжирования (в реальном времени).
    • Условия работы алгоритма: Применяется для интеграции человеческих суждений в алгоритмические процессы, когда необходимо учитывать надежность оценщиков и адаптировать результат под контекст (чувствительность темы или аудитории).

    Пошаговый алгоритм

    Процесс А: Оценка документа и Агрегация рейтинга (Офлайн)

    1. Выбор документа и асессоров: Система выбирает документ для оценки и назначает его одному или нескольким Evaluators (выбор может основываться на их экспертизе или Trust Score).
    2. Запрос и получение оценок: Документ и анкета передаются асессорам. Система получает Content Ratings.
    3. Идентификация Trust Scores: Система определяет Trust Score для каждого асессора.
    4. Идентификация Sensitivity Score: Определяется Sensitivity Score (уровень консерватизма), который будет применен (например, высокий для YMYL).
    5. Расчет Aggregate Rating: Система агрегирует оценки. Оценки взвешиваются с использованием Trust Scores. Алгоритм агрегации (среднее, медиана, мода, процентиль) выбирается или корректируется на основе Sensitivity Score. При высокой чувствительности применяется консервативная агрегация (например, учет самой критической оценки от доверенного асессора).
    6. Нормализация (Опционально): Система может нормализовать оценки или Trust Scores, если обнаруживает систематические отклонения (предвзятость) в поведении асессора.
    7. Сохранение рейтинга: Aggregate Rating сохраняется и ассоциируется с документом.

    Процесс Б: Обработка запроса и Ранжирование/Доставка (Реальное время)

    1. Получение запроса: Сервер получает запрос на документ.
    2. Определение профиля получателя: Идентифицируются Suitability Standard и Sensitivity Score получателя.
    3. Выбор кандидатов: Система отбирает релевантные документы.
    4. Применение оценок: Система использует Aggregate Rating кандидатов. Документы могут быть отфильтрованы, если не соответствуют профилю получателя (Claim 1). Оставшиеся документы ранжируются с учетом оценочной информации (Claim 12).
    5. Доставка: Ранжированный список предоставляется получателю.
    6. Обновление Доверия (Обратная связь): Trust information может быть обновлена на основе результатов ранжирования (Claim 12).

    Какие данные и как использует

    Данные на входе

    • Контентные факторы: Содержание документа (текст, аудио, видео) анализируется асессорами. Упоминаемые критерии: насилие, сексуальный контент, связь с алкоголем/наркотиками, возрастные ограничения (дети/подростки), оскорбительный контент (расовый, религиозный, национальный), иностранный язык, неприемлемые слова.
    • Технические факторы: Язык документа, длина, тип файла.
    • Временные факторы: Время суток, когда документ уместен для показа.
    • Поведенческие факторы (Косвенно): Упоминается использование данных о производительности документа, таких как CTR (click-through-rate), для приоритизации оценки или в процессе агрегации.
    • Данные об асессорах (Evaluator Data): Имя, адрес, страна, организация, размер компании, отрасль (industry), репутация, история и количество предыдущих оценок, сравнение его оценок с консенсусом.
    • Пользовательские и Географические факторы (Получатели): Возраст, пол, страна происхождения, личные настройки (используются для определения Suitability Standard и Sensitivity Score).

    Какие метрики используются и как они считаются

    • Trust Score: Рассчитывается на основе факторов, связанных с асессором. Ключевой фактор — точность и последовательность прошлых оценок. Может быть разным для разных тем. Может нормализоваться для учета предвзятости асессора. Автоматически снижается, если асессор оценивает собственный контент.
    • Sensitivity Score: Определяет алгоритм агрегации. Высокий балл означает консервативный подход (например, верить самой строгой оценке).
    • Aggregate Rating: Вычисляется путем агрегации индивидуальных оценок. Методы расчета включают:
      • Взвешивание: Оценки умножаются на Trust Score асессора.
      • Статистические методы: Среднее (mean), медиана (median), мода (mode), пошаговая функция (step function), процентиль (e.g., 75th percentile).
    • Нормализация оценок: Индивидуальные оценки могут быть скорректированы (нормализованы), если система обнаруживает, что асессор систематически завышает или занижает рейтинги по сравнению с другими.

    Выводы

    1. Инфраструктура для масштабируемой человеческой оценки: Патент описывает технологическую основу для систем типа Google Quality Raters. Он показывает, как Google решает задачу интеграции человеческих суждений о качестве и уместности контента в свои алгоритмы в масштабах веба.
    2. Доверие к асессорам (Trust Score) критично: Система не просто усредняет мнения. Trust Score является центральным элементом, позволяющим взвешивать оценки на основе надежности, экспертизы и истории асессора. Мнение экспертного асессора имеет приоритет над мнением случайного пользователя.
    3. Гибкая и контекстная агрегация (Sensitivity Score): Агрегация оценок динамична. Sensitivity Score позволяет адаптировать строгость оценки в зависимости от контекста. В YMYL-тематиках система применяет консервативный подход, предпочитая безопасность (Safety).
    4. Уместность зависит от получателя (Suitability Standard): Система учитывает профиль пользователя (демография, предпочтения, время суток) для определения того, подходит ли ему контент.
    5. Ранжирование на основе оценок: Claim 12 прямо указывает, что эти оценочные данные (Evaluation Information) используются не только для фильтрации (да/нет), но и для ранжирования документов.
    6. Генерация данных для обучения ML-моделей: Эта система генерирует высококачественные размеченные данные (документ + Aggregate Rating от доверенных асессоров). Эти данные идеально подходят для обучения алгоритмов машинного обучения, оценивающих качество контента и E-E-A-T в масштабе всего интернета.

    Практика

    Best practices (это мы делаем)

    • Ориентация на стандарты экспертных асессоров (QRG): Необходимо создавать контент, который будет высоко оценен доверенными асессорами (с высоким Trust Score). Это требует глубокого понимания и внедрения Google Quality Rater Guidelines (QRG), так как они являются практическим применением инфраструктуры, описанной в патенте. Фокус на E-E-A-T и Page Quality должен соответствовать ожиданиям экспертов.
    • Жесткий контроль качества в YMYL-нишах: В YMYL-тематиках следует предполагать применение высокого Sensitivity Score. Это означает, что система будет максимально консервативна. Любые спорные утверждения, недостаток авторитетности или потенциальный вред приведут к негативному Aggregate Rating, даже если часть аудитории не видит проблем.
    • Мониторинг авторитетности и репутации: Поскольку Trust Score асессора зависит от его репутации и отрасли, это подтверждает общую философию Google о важности доверия и экспертизы. Работа над сигналами авторитетности и репутации сайта критически важна для получения положительных оценок от экспертных рейтеров.
    • Учет культурных и географических нюансов: Патент явно предусматривает оценку контента с учетом национальных, расовых и религиозных особенностей. При работе с мультирегиональными проектами необходимо учитывать локальную специфику и чувствительность к определенным темам.

    Worst practices (это делать не надо)

    • Использование пограничного или кликбейтного контента: Попытки балансировать на грани допустимого рискованны. Из-за Sensitivity Score система может применить консервативную агрегацию и классифицировать контент как низкокачественный или неприемлемый.
    • Игнорирование субъективных факторов качества: Опора только на техническое SEO и ключевые слова недостаточна. Система полагается на человеческую интерпретацию качества, уместности, надежности и вреда (Harm).
    • Манипуляция поведенческими факторами без качества: Патент упоминает, что документы с высоким CTR могут иметь приоритет при оценке. Однако, если доверенные асессоры сочтут контент низкокачественным, высокий CTR не спасет его от пессимизации, так как Aggregate Rating будет низким.

    Стратегическое значение

    Этот патент подчеркивает стратегическую важность человеческого суждения в экосистеме Google. Он демонстрирует сложную систему обеспечения качества и надежности этих суждений через Trust Score и Sensitivity Score. Для SEO это означает, что соответствие стандартам, которые устанавливаются и проверяются наиболее доверенными человеческими экспертами (Quality Raters), является фундаментальным требованием. Долгосрочная стратегия должна фокусироваться на создании контента, который однозначно интерпретируется как экспертный, качественный и безопасный.

    Практические примеры

    Сценарий: Оценка медицинской статьи (YMYL) разными асессорами

    1. Контент: Статья о новом методе лечения без ссылок на авторитетные исследования.
    2. Оценка Асессора 1 (Низкий Trust Score, не специалист): Оценивает положительно, так как текст написан понятно.
    3. Оценка Асессора 2 (Высокий Trust Score, врач-эксперт): Оценивает отрицательно, указывая на недоказанные утверждения и потенциальный вред (Harm), низкий E-E-A-T.
    4. Контекст (Sensitivity): Для YMYL-тематики система применяет высокий Sensitivity Score (консервативный подход).
    5. Агрегация: Система рассчитывает Aggregate Rating. Мнение Асессора 2 имеет значительно больший вес из-за высокого Trust Score. Кроме того, из-за высокого Sensitivity Score система ориентируется на наиболее критическую оценку для обеспечения безопасности.
    6. Результат: Aggregate Rating статьи – низкий. Согласно Claim 12, эта оценка используется при ранжировании, что приведет к ограничению видимости статьи в органическом поиске.
    7. Действие SEO: Необходимо переписать статью с привлечением экспертов, добавить ссылки на исследования и убрать недоказанные утверждения, чтобы соответствовать критериям качества экспертных асессоров.

    Вопросы и ответы

    Что такое Trust Score асессора и как он влияет на оценку моего сайта?

    Trust Score — это оценка надежности и компетентности асессора (Evaluator). Он определяет вес мнения этого асессора при расчете итогового рейтинга вашего контента. Если ваш сайт оценивает асессор с высоким Trust Score (например, эксперт с историей точных оценок), его мнение будет определяющим. Это подчеркивает необходимость соответствия контента высоким стандартам качества, ожидаемым экспертами (QRG).

    Как Google определяет, кому из асессоров доверять?

    Патент перечисляет несколько факторов для расчета Trust Score. Ключевые из них — это история предыдущих оценок асессора и их сравнение с консенсусом других доверенных асессоров (точность и последовательность). Также учитываются внешние факторы: репутация асессора, его сфера деятельности (отрасль) и географическое положение.

    Что такое Sensitivity Score и почему он критичен для YMYL-сайтов?

    Sensitivity Score определяет уровень консерватизма при агрегации мнений. В YMYL-тематиках (здоровье, финансы, безопасность) этот показатель обычно высок. Это означает, что система предпочтет безопасность (Safety): даже если только один доверенный асессор пометит контент как проблемный (например, вредный или вводящий в заблуждение), итоговый рейтинг будет негативным, несмотря на положительные отзывы других.

    Патент в основном говорит о рекламе. Применим ли он к органическому SEO?

    Да, стратегически применим. Патент описывает общую инфраструктуру для рейтинга «электронных документов» (включая веб-страницы). Эта инфраструктура является основой для работы Google Quality Raters, которые оценивают E-E-A-T. Кроме того, Claim 12 прямо указывает на использование этих оценочных данных для ранжирования документов.

    Может ли Google автоматически корректировать оценки предвзятых асессоров?

    Да. Патент описывает возможность нормализации оценок (normalization). Если система обнаруживает, что асессор систематически завышает или занижает оценки по определенным критериям по сравнению с консенсусом, его будущие оценки или его Trust Score могут быть скорректированы для устранения этой предвзятости.

    Как эта система связана с обучением алгоритмов машинного обучения Google?

    Эта система играет ключевую роль в создании высококачественных обучающих данных. Она генерирует Aggregate Ratings, которые валидированы через Trust Score асессоров. Эти данные (документ + надежная человеческая оценка) затем используются для обучения автоматических алгоритмов ранжирования (например, классификаторов качества), чтобы они могли предсказывать человеческие суждения в масштабах всего интернета.

    Что такое Suitability Standard?

    Suitability Standard — это профиль получателя контента (пользователя). Он определяет, какой контент уместен для конкретной аудитории, учитывая демографию, время суток, географию и предпочтения. Ваш контент может иметь высокий рейтинг качества, но не будет показан, если он не соответствует стандарту пригодности пользователя (например, фильтрация контента для взрослых).

    Что происходит, если оценки асессоров сильно расходятся?

    Система в первую очередь полагается на асессоров с более высоким Trust Score. Если мнения доверенных асессоров расходятся, или если есть значительные аномалии (например, менее доверенный асессор пометил контент как неприемлемый), патент упоминает, что документ может быть отмечен для дальнейшего рассмотрения (например, ручного пересмотра).

    Влияет ли CTR на оценку качества в этой системе?

    Патент упоминает CTR (click-through-rate) в основном как критерий для приоритизации того, какие документы следует оценивать в первую очередь. Хотя данные о производительности документа могут учитываться при агрегации, сам по себе высокий CTR не гарантирует высокого рейтинга качества, если доверенные асессоры сочтут контент низкокачественным.

    Как SEO-специалисту использовать знания из этого патента на практике?

    Ключевое действие — глубокое внедрение Google Quality Rater Guidelines. Необходимо создавать контент, который получит высокие оценки по критериям E-E-A-T и Page Quality от экспертных, доверенных асессоров. Это требует фокуса на авторитетности, точности и безопасности контента, особенно в YMYL-нишах, где применяется высокий Sensitivity Score.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.