Как Google использует тематические списки предпочтительных и нежелательных сайтов (Editorial Opinion) для корректировки ранжирования

Google может заранее определять «Темы запросов» (Query Themes) и назначать для них списки «Предпочтительных» (Favored) и «Нежелательных» (Non-Favored) источников. Если запрос пользователя соответствует теме, система корректирует ранжирование: повышает предпочтительные источники и понижает нежелательные, используя «Параметр редакторского мнения» (Editorial Opinion Parameter).

Описание

Какую задачу решает

Патент решает проблему масштабирования редакторского мнения (Editorial Opinion) в поисковых системах. Вместо оценки отдельных страниц вручную (как в каталогах типа Yahoo! или DMOZ), изобретение позволяет применять редакторские суждения к целым источникам (сайтам или разделам) в контексте определенных тематик. Это направлено на улучшение качества выдачи путем продвижения авторитетного контента и борьбы с дезинформацией, спамом (“spam techniques”) или чрезмерной рекламой в масштабах всего индекса.

Что запатентовано

Запатентована система интеграции редакторского мнения в ранжирование результатов поиска. Система позволяет определять Query Themes (Темы запросов), идентифицировать для этих тем Favored Sources (Предпочтительные источники) и Non-Favored Sources (Нежелательные источники), и назначать Editorial Opinion Parameters (Параметры редакторского мнения). Эти параметры используются для автоматической корректировки (повышения или понижения) рейтинга результатов, если запрос пользователя соответствует определенной теме.

Как это работает

Система работает в двух режимах:

Офлайн (Подготовка): Редакторы или автоматизированные системы определяют общие темы (Query Themes) и критерии их срабатывания. Для каждой темы составляются списки предпочтительных и нежелательных источников, и определяются параметры корректировки рейтинга для них.
Онлайн (Обработка запроса): Когда поступает запрос, система проверяет, соответствует ли он какой-либо Query Theme. Если да, система идентифицирует результаты поиска, исходящие от Favored или Non-Favored Sources, и применяет к их Ranking Scores соответствующий Editorial Opinion Parameter, переранжировывая финальную выдачу.

Актуальность для SEO

Средняя/Высокая. Патент подан в 2000 году, и конкретные методы реализации (например, опора на Open Directory/Yahoo! и простые правила) устарели. Однако базовая концепция — идентификация авторитетных и неавторитетных источников для конкретных тем — является фундаментальной для современных концепций Google, таких как E-E-A-T и YMYL. Принцип тематически обусловленной корректировки авторитетности остается высоко актуальным, хотя теперь реализуется с помощью ML-моделей.

Важность для SEO

Влияние на SEO высокое. Патент описывает конкретный механизм, позволяющий Google систематически повышать или понижать целые сайты на основе оценки их качества/авторитетности, привязанной к конкретным тематикам. Это подчеркивает критическую важность построения признанного авторитета и репутации (E-E-A-T) в своей нише для того, чтобы быть классифицированным как Favored Source.

Детальный разбор

Термины и определения

Editorial Opinion Parameter (Параметр редакторского мнения): Числовое значение или правило, которое количественно определяет редакторское мнение о конкретном источнике в контексте Query Theme. Используется для модификации Ranking Score результата (повышение, понижение, удаление из выдачи или перемещение наверх).
Favored Sources (Предпочтительные источники): Набор веб-страниц, сайтов, хостов или префиксов URL, идентифицированных как источники полезного или авторитетного контента (useful or authoritative content) по определенной Query Theme.
Non-Favored Sources (Нежелательные источники): Набор веб-страниц, сайтов, хостов или префиксов URL, идентифицированных как источники дезинформации (misinformation), чрезмерной рекламы (over-promotion) или спама по определенной Query Theme.
Query Theme (Тема запроса): Тема или категория информации, часто встречающаяся в поисковых запросах пользователей (например, «сайты с бесплатной загрузкой ПО» или «поиск жилья»).
Query Theme Criteria (Критерии темы запроса): Правила или данные, используемые для определения того, относится ли входящий поисковый запрос к определенной теме. Могут быть выражены как булевы правила (например, наличие слов «free» AND «download») или как набор категорий из иерархического каталога.
Topic Hierarchy / Directory (Иерархический каталог): Структурированный каталог веб-ресурсов (например, Yahoo!, Open Directory/DMOZ), используемый для классификации тем запросов и автоматической идентификации предпочтительных источников.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления результатов поиска.

Система получает поисковый запрос.
Извлекаются объекты (результаты) в ответ на запрос.
Система автоматически определяет, соответствует ли запрос хотя бы одной Query Theme.
Определяется, относится ли какой-либо из извлеченных объектов к списку Favored или Non-Favored Sources.
Объекты ранжируются на основе результата обоих определений: (а) соответствия запроса теме И (б) отношения объекта к списку источников.
Ранжированные объекты предоставляются клиенту.

Claim 3 и 4 (Зависимые от 1): Детализируют механизм ранжирования и эффект параметра.

Для объектов, НЕ относящихся к списку источников, оценка определяется стандартно (первая группа параметров).
Для объектов, относящихся к списку источников, оценка определяется стандартно ПЛЮС Editorial Opinion Parameter (Claim 3).
Editorial Opinion Parameter приводит к повышению ранга Favored Sources и понижению ранга Non-Favored Sources (Claim 4).

Claim 5 и 6 (Зависимые от 1): Описывают методы определения соответствия запроса теме.

Claim 5: Определение основано на соответствии запроса правилу (query rule), связанному с темой.
Claim 6: Определение основано на классификации запроса в набор тем (topics) и сравнении этого набора с темами, в которые была классифицирована Query Theme.

Claim 17 (Независимый пункт): Описывает процесс настройки системы (офлайн).

Разработка Query Themes.
Идентификация для каждой темы наборов объектов как Favored и Non-Favored.
Определение Editorial Opinion Parameter для каждого объекта в наборах.
Автоматическое использование этого параметра для изменения ранжирования списка объектов, полученных в ответ на запрос.

Claim 24 (Зависимый от 21): Описывает автоматический метод идентификации Favored Sources. Он включает классификацию Query Theme в набор тем из иерархического каталога и идентификацию имен хостов, перечисленных в этих темах, как предпочтительных источников.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные, подготовленные заранее, и влияя на финальное ранжирование.

INDEXING / Офлайн-подготовка
Происходит разработка Query Themes, определение критериев и составление списков Favored/Non-Favored Sources. Если используется автоматическая идентификация источников (Claim 24), данные из иерархических каталогов (DMOZ, Yahoo!) должны быть проиндексированы и ассоциированы с соответствующими хостами.

QUNDERSTANDING – Понимание Запросов
На этом этапе система анализирует входящий запрос, чтобы определить, соответствует ли он какой-либо заранее определенной Query Theme, используя Query Theme Criteria (правила или классификацию).

RANKING – Ранжирование
Генерируется первоначальный набор результатов и рассчитываются их базовые Ranking Scores с использованием стандартных факторов (патент упоминает текстовое соответствие, связность, популярность).

RERANKING – Переранжирование
Основное применение патента. Если была активирована Query Theme, система проверяет источники полученных результатов. Если результат исходит от Favored или Non-Favored Source, его базовый Ranking Score корректируется с помощью Editorial Opinion Parameter. Происходит финальная сортировка.

Входные данные:

Поисковый запрос пользователя.
Первоначальный набор результатов с их Ranking Scores.
База данных редакторского мнения (Query Themes, Criteria, списки Sources и Parameters).

Выходные данные:

Переранжированный список результатов поиска с модифицированными оценками.

На что влияет

Конкретные ниши или тематики: Влияет только на те ниши, для которых были определены Query Themes. Учитывая упоминание редакторского труда, это, вероятно, были важные, чувствительные (потенциально YMYL) или подверженные спаму тематики (примеры в патенте: «бесплатная загрузка ПО», «поиск жилья»).
Конкретные типы сайтов: Влияет на сайты, которые были явно идентифицированы как Favored или Non-Favored Sources для этих тем.

Когда применяется

Алгоритм применяется только при выполнении строгого набора условий:

Триггер активации (Тема): Входящий поисковый запрос должен удовлетворять Query Theme Criteria (соответствовать правилу или классифицироваться в определенную категорию).
Условие применения (Источник): Модификация ранжирования применяется только к тем результатам в выдаче, которые происходят из источников (сайтов, хостов, URL префиксов), перечисленных в списках Favored или Non-Favored Sources для этой конкретной темы.

Пошаговый алгоритм

Процесс А: Подготовка данных (Офлайн)

Разработка тем запросов: Редакторы анализируют логи запросов и определяют часто встречающиеся Query Themes.
Определение критериев тем: Для каждой темы устанавливаются Query Theme Criteria (булевы правила ИЛИ набор категорий из иерархического каталога).
Идентификация источников: Для каждой темы определяются наборы Favored Sources и Non-Favored Sources. Это может быть сделано:
1. Вручную редакторами (на основе авторитетности или выявления дезинформации/спама).
2. Автоматически (например, путем выбора хостов, перечисленных в соответствующих категориях авторитетного каталога).
Определение параметров мнения: Для каждого источника в списках определяется Editorial Opinion Parameter (величина повышения или понижения рейтинга).
Сохранение данных: Темы, критерии, списки источников и параметры сохраняются в базе данных.

Процесс Б: Обработка запроса (Онлайн)

Получение запроса: Система получает поисковый запрос от пользователя.
Извлечение и оценка: Извлекаются релевантные веб-страницы и определяются их первоначальные Ranking Scores.
Проверка редакторского мнения: Система определяет, существует ли Editorial Opinion для данного запроса, проверяя, соответствует ли запрос критериям какой-либо Query Theme.
- Если НЕТ: Перейти к шагу 6.
- Если ДА: Перейти к шагу 4.
Определение затронутых сайтов: Система идентифицирует, происходят ли какие-либо из полученных результатов поиска из Favored или Non-Favored Sources, связанных с активированной темой.
Обновление оценок: Для каждого результата, исходящего от затронутого источника, система вычисляет обновленный Ranking Score, применяя соответствующий Editorial Opinion Parameter.
Предоставление результатов: Система предоставляет пользователю ранжированный список на основе финальных (обновленных или первоначальных) оценок.

Какие данные и как использует

Данные на входе

Патент использует следующие типы данных:

Контентные факторы: Текст запроса используется для сопоставления с Query Theme Criteria. Текстовое содержание страниц используется для первоначального ранжирования и для классификации запросов в темы (textual content match).
Технические факторы (Идентификаторы источников): Имена хостов (Host names) и префиксы URL (URL prefixes) используются для идентификации Favored и Non-Favored Sources.
Структурные/Внешние факторы (Каталоги): Данные из иерархических каталогов (Topic Hierarchies, например, Yahoo!, Open Directory) используются для определения Query Themes и для автоматической идентификации Favored Sources.
Поведенческие факторы: Логи поисковых запросов (Search query logs) используются редакторами офлайн для выявления и разработки Query Themes. Упоминается popular opinion как возможный фактор базового ранжирования.
Ссылочные факторы: Упоминается connectivity analysis scoring как возможная часть базового ранжирования. Также упоминается «близость в вебе» (proximity on the World Wide Web) как метод классификации страниц в темы.

Какие метрики используются и как они считаются

Базовые Ranking Scores: Первоначальные оценки, рассчитанные с использованием стандартных техник (текстовое соответствие, связность, популярность).
Editorial Opinion Parameter: Ключевая метрика патента, определяющая способ модификации базовой оценки. Варианты реализации:
- Повышение/понижение на процент от предыдущей оценки.
- Повышение/понижение на абсолютное значение.
- Перемещение результата в топ списка.
- Удаление результата из списка.
- Выборочное влияние на один из компонентов финального рейтинга.
Оценка соответствия теме: Метрики для классификации запросов в темы. Система сравнивает страницы в результатах поиска со страницами, ассоциированными с категорией каталога, используя совпадение текстового контента или близость в вебе. Выбираются темы с наибольшим количеством совпадающих страниц.

Выводы

Механизм редакторского вмешательства и масштабирования: Патент описывает систему для интеграции человеческих суждений (Editorial Opinion) в алгоритмическое ранжирование. Ключевое нововведение — применение мнений к источникам (сайтам, разделам), а не к отдельным страницам, что позволяет масштабировать влияние редакторов.
Тематическая авторитетность (Contextual Authority): Авторитетность источника не является глобальной. Сайт может быть Favored Source для одной Query Theme и нейтральным или Non-Favored для другой. Оценка применяется только в контексте конкретной темы.
Борьба со спамом и дезинформацией: Система явно предусматривает идентификацию Non-Favored Sources (источников дезинформации, спама, чрезмерной рекламы) и активное понижение или удаление их контента из выдачи по соответствующим темам.
Гибридное ранжирование и гибкость корректировки: Editorial Opinion Parameter интегрируется со стандартным ранжированием, а не заменяет его. При этом система позволяет применять как мягкие корректировки, так и агрессивные меры (перемещение в топ или удаление).
Использование внешних курируемых данных: Патент описывает использование внешних иерархических каталогов (типа DMOZ/Yahoo!) как для классификации запросов, так и для автоматического определения авторитетных источников (Claim 24).

Практика

Best practices (это мы делаем)

Построение тематического авторитета (Topical Authority): Сосредоточьтесь на том, чтобы стать признанным авторитетом в конкретной нише. Это увеличивает вероятность того, что сайт будет классифицирован как Favored Source (редакторами или, что более вероятно сегодня, алгоритмами, обученными на редакторских данных) для соответствующих Query Themes.
Фокус на сигналах E-E-A-T и репутации: Активно работайте над сигналами E-E-A-T. Достоверность информации и хорошая репутация являются ключевыми факторами для избежания статуса Non-Favored Source, особенно в YMYL-тематиках, которые с высокой вероятностью являются объектами Query Themes.
Четкое тематическое позиционирование: Убедитесь, что тематика сайта и его разделов легко идентифицируется. Это помогает системам классифицировать ваш контент и применять к нему соответствующие оценки качества источника.
(Современный эквивалент каталогов) Работа с Knowledge Graph и авторитетными базами данных: Хотя влияние старых каталогов (DMOZ) ушло, патент показывает логику использования структурированных, курируемых данных для идентификации авторитетных источников. Попадание в Knowledge Graph и упоминания в авторитетных отраслевых базах данных могут служить современным аналогом.

Worst practices (это делать не надо)

Манипуляции и спам-техники: Использование популярных ключевых слов для привлечения трафика без предоставления соответствующего контента (например, обещание «бесплатной загрузки», которой нет) является прямой причиной для классификации сайта как Non-Favored Source по данной теме.
Распространение дезинформации или Over-Promotion: Публикация недостоверной информации или чрезмерно агрессивный маркетинг могут привести к тому, что сайт будет помечен как нежелательный источник, что приведет к понижению или удалению из выдачи по релевантным темам.
Игнорирование качества источника в пользу релевантности страницы: Недостаточно иметь релевантную страницу, если весь источник считается некачественным для данной темы. Система корректирует ранжирование на уровне источника.

Стратегическое значение

Этот патент является ранним подтверждением стратегического направления Google на приоритизацию авторитетности и качества источников в контексте конкретных тем. Он предоставляет техническую основу для того, как сигналы E-E-A-T могут быть реализованы: как модификаторы ранжирования (Editorial Opinion Parameters), применяемые, когда запрос соответствует чувствительной или важной теме (Query Theme). Долгосрочная стратегия должна фокусироваться на построении реальной экспертизы и надежной репутации в своей области.

Практические примеры

Сценарий 1: Повышение авторитетного источника в YMYL-тематике (Медицина)

Офлайн Настройка: Редакторы определяют Query Theme: «Лечение заболеваний». Favored Source: Сайт ВОЗ (who.int). Non-Favored Source: Сайт с альтернативной медициной без доказательной базы (bad-medicine.com).
Запрос пользователя: «Симптомы кори».
Обработка: Система определяет, что запрос соответствует теме «Лечение заболеваний».
Ранжирование: В результатах есть страницы с who.int и bad-medicine.com.
Корректировка: Система применяет Editorial Opinion Parameter. Страница who.int получает значительное повышение в рейтинге. Страница bad-medicine.com понижается или удаляется.
Результат: Пользователь видит авторитетный источник выше в выдаче.

Сценарий 2: Борьба со спамом в тематике загрузок

Офлайн Настройка: Query Theme: «Бесплатное ПО». Критерий: наличие слов «free» и «download». Non-Favored Source: Сайт spam-downloads.com, известный обманными практиками.
Запрос пользователя: «Free antivirus download».
Обработка: Запрос соответствует теме «Бесплатное ПО».
Корректировка: Если spam-downloads.com появляется в выдаче, его рейтинг агрессивно понижается согласно Editorial Opinion Parameter.

Вопросы и ответы

Является ли этот патент доказательством того, что Google вручную корректирует выдачу?

Да, патент описывает систему, разработанную для того, чтобы позволить редакторам (людям) влиять на ранжирование путем определения предпочтительных и нежелательных источников для конкретных тем. Хотя система применяет эти правила автоматически в реальном времени, исходные данные (темы, списки, параметры) задаются редакторами. Однако важно помнить, что патент подан в 2000 году, и современные системы, вероятно, используют машинное обучение для имитации этого процесса в большем масштабе.

Как Google определяет «Темы запросов» (Query Themes)?

Согласно патенту, Query Themes разрабатываются редакторами на основе анализа логов поисковых запросов, чтобы выявить часто встречающиеся категории информации. Примерами служат «сайты, предоставляющие бесплатную загрузку ПО» или «сайты, помогающие найти жилье».

Как система определяет, что мой сайт является «Предпочтительным источником» (Favored Source)?

Патент предлагает два метода. Первый — ручной: редакторы идентифицируют сайт как источник полезного и авторитетного контента. Второй — автоматический (Claim 24): система классифицирует тему запроса в иерархический каталог (например, DMOZ) и считает сайты, перечисленные в соответствующей категории каталога, предпочтительными источниками.

Может ли сайт быть авторитетным для одной темы и неавторитетным для другой?

Да, абсолютно. Механизм привязывает статус Favored или Non-Favored Source к конкретной Query Theme. Сайт может быть предпочтительным источником для темы А, но нейтральным или даже нежелательным для темы Б. Это подчеркивает важность контекстуальной тематической авторитетности.

Насколько сильно может измениться рейтинг из-за «Редакторского мнения»?

Патент описывает гибкие возможности корректировки. Editorial Opinion Parameter может вызвать повышение или понижение оценки на определенный процент или абсолютное значение. В крайних случаях он может переместить результат в самый верх ранжированного списка или полностью удалить его из списка.

Как этот патент связан с E-E-A-T?

Этот патент можно рассматривать как раннюю техническую реализацию принципов E-E-A-T. Идентификация Query Themes соответствует определению чувствительных или YMYL-тем. Favored Sources соответствует поиску источников с высоким уровнем экспертизы и надежности. Editorial Opinion Parameter — это механизм применения этих оценок в ранжировании.

Что делать, если мой сайт был классифицирован как «Нежелательный источник» (Non-Favored Source)?

Необходимо провести тщательный аудит контента и репутации сайта в контексте затронутой темы. Устраните причины, которые могли привести к такой классификации: удалите дезинформацию, снизьте агрессивность рекламы (over-promotion), прекратите использование спам-техник и сосредоточьтесь на предоставлении достоверного и полезного контента.

Влияет ли этот механизм на все результаты в выдаче?

Нет. Он активируется только если запрос соответствует заранее определенной Query Theme. И даже в этом случае он корректирует только те результаты, которые исходят из явно указанных Favored или Non-Favored Sources для этой темы. Остальные результаты ранжируются стандартно.

Использует ли Google до сих пор старые каталоги типа DMOZ или Yahoo! для определения авторитетности?

Хотя патент упоминает эти каталоги как примеры Topic Hierarchies для автоматического определения Favored Sources, маловероятно, что Google полагается на них сегодня, так как они устарели. Современные системы используют более сложные структуры данных, такие как Knowledge Graph, и алгоритмы машинного обучения для оценки авторитетности.

Может ли часть сайта быть «Favored», а другая часть — «Non-Favored»?

Да. Патент указывает, что идентификация источников может происходить не только на уровне хоста, но и на уровне набора URL-префиксов (set of URL prefixes). Это позволяет более гранулярно применять корректировки к разным разделам одного и того же сайта.