Анализ патента Google, описывающего систему сбора явных оценок пользователей (рейтинги, метки, комментарии) для веб-страниц. Эти аннотации используются для глубокой персонализации поиска: они отображаются в выдаче, позволяют фильтровать результаты и напрямую влияют на ранжирование. Патент также детально описывает, как оценки отдельных страниц агрегируются в общий рейтинг сайта (Site Rating), влияющий на ранжирование всего домена.
Описание
Какую задачу решает
Патент решает проблему неэффективности поиска, связанную с потерей информации о предыдущем анализе результатов пользователем. Стандартные алгоритмы ранжирования не учитывают персональный опыт и оценки пользователя, вынуждая его заново анализировать выдачу при повторных запросах. Существовавшие на тот момент решения (например, закладки) были плохо интегрированы с веб-поиском и часто полагались на косвенные сигналы (время просмотра), а не на явную оценку качества пользователем.
Что запатентовано
Запатентована система для сбора, хранения и интеграции явных пользовательских аннотаций (Annotations) – рейтингов, меток и комментариев – в процесс поиска. Суть изобретения заключается в модификации поисковой выдачи путем (1) отображения аннотаций рядом с результатами, (2) предоставления интерфейсов для фильтрации (например, по Active Labels) и (3) использования персональных оценок для активного переранжирования выдачи. Также описан механизм генерации Site Rating на основе оценок отдельных страниц.
Как это работает
Система функционирует в нескольких направлениях:
- Сбор данных: Пользователи явно аннотируют веб-страницы (ставят оценки, метки, отмечают как спам) через специальный интерфейс (например, тулбар).
- Хранение: Аннотации сохраняются в User Information Database, как в персональных записях (User Record), так и в агрегированных записях сообщества (Community Record).
- Интеграция в SERP: При поиске система идентифицирует ранее аннотированные документы и отображает аннотации рядом с ними. Также предоставляется Filter Selector.
- Переранжирование: Система использует персональные оценки (r) для корректировки стандартных оценок ранжирования (S). Например, по формуле S’ = S[1+k(r-3)], повышая высоко оцененные и понижая низко оцененные результаты.
- Обобщение (Site Rating): Система вычисляет рейтинг сайта на основе оценок некоторых его страниц. Этот Site Rating применяется для корректировки ранжирования других, не оцененных пользователем страниц этого сайта.
Актуальность для SEO
Средняя. Конкретные реализации, описанные в патенте (явное аннотирование через тулбары, функционал типа SearchWiki), устарели и не используются в публичном поиске Google. Однако базовые принципы, заложенные в патенте, остаются крайне актуальными: персонализация выдачи, использование сигналов удовлетворенности и, особенно, механизм обобщения оценки качества с уровня страницы на уровень сайта (Site Rating). Современные системы достигают схожих целей, используя имплицитные (поведенческие) сигналы вместо явных оценок.
Важность для SEO
Патент имеет высокое стратегическое значение (8/10) для понимания принципов работы поиска, несмотря на низкое тактическое влияние устаревших реализаций. Он раскрывает критически важный механизм генерализации сигналов качества (Site Rating), подтверждая, что Google стремится оценивать качество сайта в целом на основе выборки страниц. Это подчеркивает важность поддержания стабильно высокого качества контента и E-E-A-T на всех страницах сайта, так как это влияет на ранжирование всего домена.
Детальный разбор
Термины и определения
- Active Labels (Активные метки)
- Метки, присвоенные документам пользователями, которые идентифицируются на основе взвешенной комбинации частоты (frequency) и свежести (recency) их использования. Используются для фильтрации результатов.
- Annotation (Аннотация)
- Информация, явно указанная пользователем для документа. Включает рейтинги (Ratings), метки (Labels) и комментарии (Comments).
- Community Record (Запись сообщества)
- Структура данных в User Information Database, индексированная по URL или docID. Содержит агрегированную информацию об аннотациях документа от множества пользователей (например, средний рейтинг, гистограмма оценок).
- Filter Selector (Селектор фильтров)
- Элемент интерфейса, позволяющий пользователю сократить набор отображаемых результатов на основе критериев аннотаций (например, по рейтингу или меткам).
- S (Original Score) и S’ (Revised Score)
- Исходная оценка ранжирования документа (S) и пересмотренная оценка (S’) после применения корректировки на основе рейтинга пользователя (r).
- Site Rating (Рейтинг сайта)
- Производная метрика качества для группы веб-страниц (например, всего сайта или раздела), рассчитанная на основе пользовательских оценок некоторых страниц этой группы. Используется для влияния на ранжирование неоцененных страниц группы.
- Top Raters (Топ-рейтеры)
- Пользователи, чьи аннотации признаны наиболее полезными другими пользователями или которые ввели наибольшее количество аннотаций.
- User Information Database (База данных информации о пользователях)
- Хранилище, содержащее записи о пользователях и сообществах.
- User Record (Запись пользователя)
- Структура данных, содержащая информацию о конкретном пользователе, включая данные о его действиях (Event-Based Data) и его явные аннотации (User-Specified Data).
Ключевые утверждения (Анализ Claims)
Патент US9529861B2 является продолжением (continuation) более ранних патентов и фокусируется на отображении и фильтрации аннотаций.
Claim 1 (Независимый пункт): Описывает метод ответа на поисковый запрос с интеграцией аннотаций и специфическим механизмом фильтрации.
- Система получает поисковый запрос.
- Идентифицируется набор документов, удовлетворяющих запросу. Некоторые из них ранее были аннотированы одним или несколькими пользователями.
- Отправляется ответ, включающий ранжированный набор ссылок.
- Ответ содержит инструкции для отображения соответствующих аннотаций для аннотированных документов.
- Ответ также содержит инструкции для отображения Filter Selector с опциями для сокращения набора результатов.
- Ключевое требование: опции включают фильтрацию по Active Labels, которые определяются на основе взвешенной комбинации частоты и свежести (recency) использования метки.
Анализ раздела Description и родительских патентов позволяет понять механизмы переранжирования и Site Rating, критически важные для SEO.
Механизм переранжирования (Из описания): Описывается изменение порядка результатов на основе персональных оценок.
Система модифицирует исходную оценку (S) в пересмотренную (S’). Приводится пример формулы: S’ = S[1+k(r-3)], где k — константа (например, 0-0.5), r — оценка пользователя (1-5). Это гарантирует, что оценки 4-5 повышают позицию, а 1-2 — понижают.
Механизм Site Rating (Из описания, FIG 14, 15): Описывается процесс генерации и использования рейтинга сайта.
- Получение оценок некоторых страниц группы (сайта или раздела).
- Генерация Site Rating для группы на основе этих оценок (например, среднее, медиана или взвешенное среднее).
- Использование Site Rating для корректировки ранжирования других, не оцененных пользователем страниц из этой группы. Описан иерархический подход: если нет оценки страницы, используется рейтинг наименьшей группы (раздела), затем более крупной (сайта).
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные, собранные во время взаимодействия пользователя с контентом.
INDEXING – Индексирование (Хранение данных)
Система собирает и хранит пользовательские аннотации в User Information Database. Метки (Labels) могут индексироваться для обеспечения поиска по ним.
RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов с исходными оценками (S).
RERANKING – Переранжирование (Персонализация)
Основное применение механизмов корректировки оценок.
- Идентификация оценок: Система проверяет User Record на наличие персональных рейтингов (r) для документов в выдаче.
- Корректировка оценок: Применяются формулы переранжирования (например, S’ = S[1+k(r-3)]).
- Применение Site Rating: Для документов без персональной оценки система может использовать рассчитанный Site Rating домена/раздела для корректировки их оценки.
- Финальная сортировка: Документы сортируются по скорректированным оценкам (S’).
METASEARCH – Метапоиск и Смешивание (Формирование UI)
Основное применение Claims патента B2. Система формирует финальный вид SERP, добавляя инструкции для отображения аннотаций (оценок, меток) рядом со сниппетами и для отображения Filter Selector (включая Active Labels).
Входные данные:
- Поисковый запрос и идентификатор пользователя.
- Стандартный набор результатов с оценками (S).
- User Information Database (персональные и агрегированные аннотации).
Выходные данные:
- Переранжированный набор результатов (S’).
- Инструкции для отображения аннотаций и Filter Selector в SERP.
На что влияет
- Персонализация выдачи: Основное влияние – глубокая персонализация порядка и отображения результатов на основе явного обратного отклика пользователя.
- Типы запросов: Наибольшее влияние на повторные, информационные и исследовательские запросы, где пользователь ранее проводил анализ контента.
Когда применяется
- Условия применения: Алгоритм применяется, когда пользователь идентифицирован (залогинен) и в результатах поиска присутствуют документы, которые ранее были им аннотированы, или для которых может быть рассчитан Site Rating на основе его предыдущих оценок.
Пошаговый алгоритм
Процесс А: Сбор, хранение и агрегация аннотаций (Асинхронный)
- Ввод данных: Пользователь вводит аннотации (рейтинг, метки, комментарии) для документа.
- Хранение: Сервер сохраняет данные в User Record пользователя.
- Агрегация: Сервер обновляет Community Record для документа (если аннотация не приватная).
- Расчет производных метрик (Офлайн или Онлайн):
- Система рассчитывает Site Rating для сайта/разделов путем агрегации оценок отдельных страниц.
- Система анализирует частоту и свежесть использования меток для определения Active Labels.
Процесс Б: Обработка запроса и персонализация (Real-time)
- Получение запроса: Система получает запрос и идентификатор пользователя.
- Стандартное ранжирование: Идентификация документов и расчет стандартных оценок (S).
- Извлечение аннотаций: Запрос к User Information Database для получения аннотаций и производных метрик.
- Расчет пересмотренных оценок (S’):
- Если есть персональный рейтинг (r), рассчитывается S’ (например, S’ = S[1+k(r-3)]).
- Если нет персонального рейтинга, может использоваться Site Rating в качестве r для расчета S’.
- Переранжирование: Набор результатов сортируется по итоговым оценкам (S’ или S).
- Формирование SERP: Генерация ответа, включающего ранжированный список, аннотации и Filter Selector (с Active Labels).
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании явных пользовательских данных.
- Пользовательские факторы (Явные / User-Specified Data):
- Ratings (r): Оценки документов (1-5 звезд, спам).
- Labels: Метки/теги.
- Comments: Комментарии.
- Поведенческие факторы (Имплицитные / Event-Based Data): Упоминаются как часть User Record (история поисков, кликов, браузинга), которые могут использоваться совместно с аннотациями.
- Структурные факторы: Иерархия URL используется для определения групп страниц (сайт, раздел) при расчете и применении Site Rating.
- Временные факторы: Давность (Recency) использования меток используется для расчета Active Labels.
- Системные данные: Стандартные Ranking Scores (S).
Какие метрики используются и как они считаются
- Пересмотренная оценка ранжирования (S’): Скорректированная оценка документа. Основная формула: S’ = S[1+k(r-3)]. Также упоминаются альтернативы: S’ = S(r/3); S’ = k*r; S’ = k^r.
- Site Rating (Рейтинг сайта): Оценка качества группы страниц. Рассчитывается на основе оценок отдельных страниц этой группы. Методы расчета:
- Среднее арифметическое или Медиана оценок.
- Взвешенное среднее (например, страницы внутри раздела могут иметь больший вес, чем страницы сайта вне этого раздела).
- Иерархическое наследование оценок: При отсутствии оценки страницы используется рейтинг наименьшей включающей группы (раздела), затем более крупной (сайта).
- Active Labels Метрика: Метрика для определения популярных меток сообщества, основанная на взвешенной комбинации частоты (frequency) и свежести (recency).
Выводы
- Приоритет пользовательского опыта и персонализация: Патент демонстрирует готовность Google агрессивно изменять стандартное ранжирование на основе явных сигналов удовлетворенности пользователя. Персонализация является ключевым элементом системы.
- Конкретный механизм переранжирования: Описана четкая математическая модель (S’ = S[1+k(r-3)]) того, как положительная или отрицательная обратная связь влияет на итоговый Ranking Score документа для пользователя.
- Генерализация качества (Page Quality -> Site Quality): Критически важный вывод для SEO – это механизм Site Rating. Google стремится обобщать сигналы качества с уровня отдельных страниц на уровень разделов и всего сайта. Оценка качества выборки страниц используется для прогнозирования качества других страниц этого же ресурса.
- Иерархическая оценка качества: Система применяет оценку иерархически (страница > раздел > сайт), что подчеркивает важность качественной структуры сайта и консистентности качества внутри разделов.
- Социальные сигналы и фильтрация: Система интегрирует данные сообщества (Active Labels, Top Raters) и предоставляет мощные инструменты фильтрации (Filter Selector) для навигации по результатам на основе коллективного опыта.
Практика
Best practices (это мы делаем)
Хотя описанная система явных оценок не используется в том виде, как описано, стратегические выводы из механизмов Site Rating и генерализации качества крайне важны, предполагая, что современные системы используют имплицитные сигналы аналогичным образом.
- Обеспечение консистентно высокого качества контента: Так как система может рассчитывать Site Rating на основе выборки страниц, необходимо поддерживать высокое качество всего контента. Регулярные аудиты, удаление или улучшение низкокачественных страниц (Thin Content) критически важны для поддержания высокого общего рейтинга сайта.
- Фокус на удовлетворении пользователя (User Satisfaction): Создавайте контент, который пользователи оценили бы высоко (r=5). Это приводит к положительным поведенческим сигналам, которые служат неявным аналогом высокого рейтинга и способствуют повышению в персонализированной выдаче (увеличению S’).
- Укрепление качества тематических кластеров: Механизм Site Rating может применяться иерархически к подразделам. Убедитесь, что каждый тематический кластер полностью проработан и не содержит слабых страниц, так как они могут наследовать (и влиять на) общую оценку кластера.
- Оптимизация структуры сайта: Четкая иерархия помогает поисковой системе корректно определять группы страниц для расчета Site Rating на разных уровнях (раздел, подраздел, сайт).
Worst practices (это делать не надо)
- Игнорирование низкокачественных страниц на сайте: Оставлять на сайте большое количество страниц низкого качества. Механизм Site Rating предполагает, что они негативно влияют на общую оценку сайта и могут тянуть вниз ранжирование качественных страниц.
- Использование Clickbait и разочаровывающего контента: Контент, который привлекает клик, но не удовлетворяет интент, получил бы низкий рейтинг (r=1) или пометку «спам». Согласно формуле переранжирования, это приводит к агрессивному понижению в выдаче.
- Смешивание контента разного качества в одном разделе: Размещение экспертного контента вперемешку с поверхностными статьями в одной категории может снизить общий Site Rating этого раздела из-за иерархического наследования.
Стратегическое значение
Этот патент является ключевым документом, подтверждающим переход Google от оценки исключительно качества страницы к оценке качества сайта (Site Quality). Он описывает конкретную методологию агрегации оценок в Site Rating и механизм его применения. Это подтверждает стратегическую важность работы над E-E-A-T и общим качеством ресурса как основополагающих факторов успеха в SEO, даже если современные системы используют имплицитные сигналы вместо явных оценок для расчета этих метрик.
Практические примеры
Сценарий 1: Персонализированное переранжирование (Иллюстрация формулы)
- Контекст: Пользователь ищет «лучшие кроссовки для бега». Исходное ранжирование: Сайт А (S=100), Сайт Б (S=80).
- Действие пользователя: Ранее пользователь оценил Сайт А на 1 звезду (r=1), а Сайт Б на 5 звезд (r=5). Константа k=0.2.
- Расчет S’:
- Сайт А: S’ = 100 * [1 + 0.2*(1-3)] = 100 * 0.6 = 60.
- Сайт Б: S’ = 80 * [1 + 0.2*(5-3)] = 80 * 1.4 = 112.
- Результат: В персонализированной выдаче Сайт Б (112) будет ранжироваться значительно выше Сайта А (60), изменив исходный порядок.
Сценарий 2: Применение Site Rating для нового контента
- Контекст: Пользователь часто читает и высоко оценивает статьи в разделе «Аналитика» на сайте SEOJournal.com.
- Расчет Site Rating: Система рассчитывает высокий Site Rating для раздела SEOJournal.com/analytics/ (например, 4.7 из 5).
- Новый поиск: Пользователь ищет тему, по которой SEOJournal только что опубликовал новую статью в этом разделе. Пользователь эту страницу еще не видел.
- Результат: Система применяет высокий Site Rating (4.7) к этой новой странице, повышая ее Ranking Score в персонализированной выдаче пользователя.
Вопросы и ответы
Насколько актуален этот патент, если описанные функции (звезды, комментарии в SERP) больше не используются в Google?
Хотя конкретные элементы интерфейса (GUI) устарели, базовые принципы патента остаются высоко актуальными. Патент демонстрирует механизмы использования обратной связи для персонализации и переранжирования. Сегодня Google использует неявные поведенческие сигналы (клики, время взаимодействия) как аналог явных рейтингов, описанных в патенте, но логика обработки может быть схожей.
Что такое Site Rating и почему он критически важен для SEO?
Site Rating — это оценка качества сайта или раздела, выведенная из оценок отдельных страниц. Это критически важно, так как подтверждает механизм генерализации качества: Google использует оценку части страниц для прогнозирования качества всего сайта. Это означает, что качество всего контента на домене влияет на ранжирование каждой отдельной страницы.
Объясните формулу переранжирования S’ = S[1+k(r-3)]. Что она означает на практике?
Эта формула корректирует исходную оценку ранжирования (S) на основе рейтинга пользователя (r, от 1 до 5). Если рейтинг нейтральный (r=3), оценка не меняется. Если рейтинг высокий (r=5), оценка увеличивается. Если низкий (r=1), оценка уменьшается. На практике это означает, что документы, которые пользователь считает полезными, получают значительное повышение в его личной выдаче, а бесполезные — понижение.
Как Site Rating влияет на страницы, которые пользователь не оценивал?
В этом и заключается основная цель механизма. Если пользователь не оценивал конкретную страницу, но система рассчитала Site Rating для ее сайта или раздела на основе других оценок этого пользователя, этот Site Rating наследуется неоцененной страницей. Это приводит к ее повышению или понижению в персонализированной выдаче.
Описывает ли патент иерархическую оценку качества?
Да, в патенте описан иерархический подход. Приоритет отдается рейтингу конкретной страницы. Если его нет, используется Site Rating наименьшей группы, включающей страницу (например, подраздела). Если и его нет, используется рейтинг более крупной группы (например, всего сайта).
Могут ли несколько низкокачественных страниц испортить репутацию всему сайту?
Да, исходя из логики Site Rating. Если система (или пользователи, чьи сигналы она учитывает) идентифицирует несколько страниц как низкокачественные, это снизит средний Site Rating. Это снижение может негативно повлиять на ранжирование других страниц сайта, подтверждая важность регулярного аудита и улучшения слабого контента.
Что такое Active Labels и как они определяются?
Active Labels – это популярные метки (теги), присвоенные документам сообществом. Согласно патенту (Claim 1), они определяются на основе взвешенной комбинации частоты (как часто метка используется) и свежести (как недавно она использовалась). Они используются как опции в Filter Selector для сужения результатов поиска до актуальных тем.
Учитывает ли система оценки других пользователей (сообщества)?
Да, патент описывает Community Records, которые агрегируют аннотации. Система может отображать агрегированные рейтинги, популярные метки (Active Labels) и выделять Top Raters (авторитетных пользователей). Это позволяет использовать коллективный опыт для оценки контента и фильтрации выдачи.
Что произойдет, если пользователь пометит мой сайт как спам?
Если пользователь использует функцию «trash or spam», это интерпретируется как крайне низкий рейтинг (r=1 или ниже). Согласно механизму переранжирования (например, формуле S’), система агрессивно понизит этот документ в выдаче пользователя или полностью удалит его из будущих результатов поиска для этого пользователя.
Каков главный вывод для SEO-стратегии из этого патента?
Главный вывод — критическая важность удовлетворения пользователя и обеспечения консистентного качества на уровне всего сайта. Патент доказывает, что Google стремится оценивать сайт комплексно (Site Rating), и что положительный пользовательский опыт является фундаментальным фактором для успешного ранжирования, независимо от того, измеряется он явными или имплицитными сигналами.