Патент Google, описывающий систему персонализации поиска на основе явных оценок пользователей (рейтинги, метки, комментарии). Система использует эти данные для изменения порядка результатов в будущих поисках этого конкретного пользователя. Также описан механизм вычисления «персонального рейтинга сайта» на основе оценок отдельных страниц и применения этого рейтинга к страницам того же сайта, которые пользователь еще не оценивал.
Описание
Какую задачу решает
Патент решает проблему неэффективности повторных поисков, когда пользователь вынужден заново оценивать результаты, так как его предыдущий анализ не сохраняется и не интегрируется в поиск. Цель изобретения — повысить эффективность поиска путем бесшовной интеграции явных оценок пользователя (user-specified annotations), таких как рейтинги, метки и комментарии, в его последующие поисковые сессии.
Что запатентовано
Запатентована система, которая собирает, хранит и использует явные пользовательские оценки документов для глубокой персонализации поисковой выдачи. Ключевыми механизмами являются: (1) изменение порядка ранжирования (переранжирование) результатов на основе персональных оценок пользователя; и (2) генерация user-specific site rating (персонального рейтинга сайта) путем обобщения оценок отдельных страниц. Этот обобщенный рейтинг затем применяется к другим страницам того же сайта, которые пользователь еще не оценил.
Как это работает
Система работает в несколько этапов:
- Сбор данных: Пользователь через специальный интерфейс (например, тулбар или GUI) явно оценивает документ (ставит рейтинг, добавляет метки/комментарии).
- Хранение: Аннотации сохраняются в User Information Database и привязываются к профилю пользователя и URL/DocID документа.
- Генерация Site Rating: Система анализирует оценки пользователя для страниц одного сайта и вычисляет обобщенный user-specific site rating (например, среднее значение).
- Персонализация при поиске: Когда пользователь выполняет поиск, система идентифицирует результаты, которые он ранее оценивал, или результаты с сайтов, для которых существует site rating.
- Переранжирование: Стандартные оценки ранжирования (Ranking Scores) модифицируются на основе персональных рейтингов (явных или обобщенных). Высокооцененные документы продвигаются (revised score S’), низкооцененные — понижаются.
- Отображение: Пользователю предоставляется интегрированная выдача, порядок которой зависит от его предыдущих оценок, с отображением соответствующих аннотаций.
Актуальность для SEO
Средняя. Патент описывает фундаментальные механизмы персонализации и генерации оценок на уровне сайта (site rating). Однако реализация, основанная на явной обратной связи (explicit feedback) через тулбары и ручное проставление рейтингов, не получила широкого распространения. Современные системы Google в большей степени полагаются на неявные (implicit) поведенческие сигналы для достижения аналогичных целей персонализации.
Важность для SEO
Влияние на общие SEO-стратегии ограничено (4/10), так как патент сфокусирован исключительно на персонализации, а не на глобальном ранжировании. Однако он подчеркивает стратегическую важность пользовательского опыта (UX) и консистентности качества всего сайта. Негативный опыт может привести к тому, что сайт будет понижен в персональной выдаче пользователя (явно или неявно), а позитивный опыт может закрепить видимость сайта для данного пользователя через механизм site rating.
Детальный разбор
Термины и определения
- Annotations (Аннотации)
- Явная обратная связь от пользователя относительно документа. Включает Ratings, Labels и Comments.
- Comments (Комментарии)
- Текстовые заметки, которые пользователь оставляет о документе.
- Community Record (Запись сообщества)
- Структура данных, агрегирующая аннотации нескольких пользователей для конкретного документа (URL или docID). Может включать гистограмму рейтингов и агрегированный рейтинг.
- Labels (Метки/Ярлыки)
- Ключевые слова или теги, которые пользователь присваивает документу для его категоризации.
- Ratings (Рейтинги)
- Явная оценка качества или полезности документа пользователем (например, шкала от 1 до 5 звезд, или пометка как спам/мусор через trash or spam icon).
- Revised Score (S’)
- Скорректированная оценка ранжирования документа. Исходная оценка (S) модифицируется на основе пользовательского рейтинга (r) для персонализации порядка выдачи.
- Site Rating / User-Specific Site Rating (Персональный рейтинг сайта)
- Рейтинг, сгенерированный для группы веб-страниц (например, сайта или его раздела) на основе персональных оценок пользователя отдельных страниц этой группы. Используется для ранжирования неоцененных страниц этой группы.
- User Information Database (База данных информации о пользователях)
- Хранилище, содержащее записи о действиях пользователя, включая его явные аннотации (User-Specified Data).
- User Record (Запись пользователя)
- Профиль пользователя, привязанный к User Identifier, содержащий его аннотации для различных документов.
Ключевые утверждения (Анализ Claims)
Патент US8849818B1 (продолжение более ранних заявок) фокусируется на механизме обобщения и применения рейтингов (Inference/Site Rating).
Claim 1 (Независимый пункт): Описывает метод применения рейтинга одного документа к другому документу в той же группе.
- Система предоставляет интерфейс (иконку) для оценки первого документа (Doc A) в группе документов (Group X, например, сайт).
- Система получает от пользователя оценку для Doc A.
- Генерируется первый user-specific rating на основе этой оценки.
- Система получает поисковый запрос от пользователя.
- Идентифицируются результаты, включая второй документ (Doc B), который (i) не был ранее оценен пользователем, но (ii) находится в той же группе (Group X).
- Система отправляет ответ, где ссылка на Doc B отображается с этим user-specific rating (выведенным из оценки Doc A или Group X).
Ядро изобретения — это перенос оценки качества с одного документа на другой в рамках одной группы (сайта) в контексте персональной выдачи.
Claim 2 (Зависимый от 1): Уточняет, что порядок отображения ссылок (ранжирование), включая Doc B, зависит от этого user-specific rating. Это подтверждает использование выведенных рейтингов для переранжирования.
Claim 5 (Зависимый от 1): Детализирует механизм генерации рейтинга сайта.
- Генерируется user-specific site rating для группы документов (Group X) на основе оценки Doc A.
- Ссылка на Doc B отображается именно с этим user-specific site rating.
Это определяет механизм Site Rating: оценка страницы используется для вычисления рейтинга всей группы (сайта), и этот агрегированный рейтинг применяется к другим страницам группы.
Где и как применяется
Изобретение затрагивает этапы, связанные с хранением пользовательских данных и финальным ранжированием.
INDEXING – Индексирование и извлечение признаков
Пользовательские аннотации (метки, комментарии) могут быть включены в инвертированный индекс (inverse document index), чтобы обеспечить возможность поиска по ним. Также документы должны быть сгруппированы (по сайтам/разделам) для работы механизма Site Rating.
RANKING – Ранжирование
На этом этапе генерируется базовый набор результатов поиска со стандартными оценками ранжирования (Score S).
RERANKING – Переранжирование (Personalization)
Основное применение патента.
- Получение пользовательских данных: Система обращается к User Information Database для получения аннотаций пользователя.
- Применение Site Ratings: Для документов без прямых оценок система может использовать предварительно вычисленный user-specific site rating.
- Модификация оценок: Система вычисляет новые оценки ранжирования (Revised Score S’), используя явные персональные рейтинги или выведенные site ratings.
- Финальная сортировка: Результаты переупорядочиваются на основе скорректированных оценок (S’).
Входные данные:
- Поисковый запрос и идентификатор пользователя (User Identifier).
- Базовый набор результатов поиска с их стандартными оценками (Score S).
- Персональные аннотации пользователя (User Record) и вычисленные Site Ratings.
Выходные данные:
- Персонализированный набор результатов поиска с модифицированными оценками (Score S’).
- Инструкции по отображению аннотаций (рейтингов, меток) рядом с результатами.
На что влияет
- Все типы контента и запросов: Механизм не ограничен тематиками. Он влияет на любой документ, который пользователь решил оценить или который принадлежит к сайту, оцененному пользователем.
- Персональная выдача: Влияние ограничено исключительно персональной выдачей пользователя, который активно использует функцию аннотирования. На глобальную выдачу влияния нет.
Когда применяется
- Триггеры активации: Алгоритм активируется при выполнении двух условий: (1) Пользователь вошел в систему (залогинен), и (2) Пользователь ранее предоставлял явные аннотации (Ratings, Labels).
- Условия применения к результату: Переранжирование конкретного результата происходит, если он был ранее оценен пользователем ИЛИ если он принадлежит к сайту (group of documents), для которого система вычислила User-Specific Site Rating.
Пошаговый алгоритм
Процесс А: Сбор аннотаций и генерация Site Rating
- Получение аннотации: Пользователь оценивает документ (Рейтинг, Метки) через интерфейс (Client Assistant).
- Хранение: Аннотация сохраняется в User Record в User Information Database.
- Идентификация группы: Система определяет группу (сайт или раздел), к которой принадлежит документ.
- Вычисление Site Rating: Система обновляет user-specific site rating для этой группы, агрегируя все рейтинги пользователя внутри нее (например, вычисляя среднее или медиану).
Процесс Б: Персонализированный поиск и переранжирование
- Получение запроса: Система получает запрос от залогиненного пользователя.
- Идентификация документов: Генерируется первичный набор результатов со стандартными оценками (S).
- Определение применимого рейтинга (r): Для каждого результата система ищет рейтинг в User Record.
- Если есть явный рейтинг для документа: r = явный рейтинг.
- Если нет явного рейтинга, но есть Site Rating для группы: r = Site Rating.
- Корректировка оценок (Переранжирование): Вычисляется Revised Score (S’). Например, по формуле S’ = S[1+k(r-3)]. Документы с высоким r повышаются, с низким — понижаются.
- Сортировка и отображение: Результаты сортируются по S’ и предоставляются пользователю вместе с соответствующими аннотациями или Site Rating.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании явных данных, предоставленных пользователем, и структурных данных сайта.
- Пользовательские факторы (Explicit Feedback / User-Provided Data):
- Ratings: Явные оценки (например, 1-5 звезд, пометка как спам/мусор trash or spam icon).
- Labels: Пользовательские теги/метки.
- Comments: Текстовые заметки.
- Privacy Flag: Настройки приватности аннотаций.
- Структурные факторы:
- Иерархия URL или структура сайта: Используется для определения «группы веб-страниц» (сайта или подраздела) при вычислении Site Rating.
- Системные данные:
- User Identifier: Идентификатор пользователя.
- Базовые оценки ранжирования (S).
Какие метрики используются и как они считаются
- User Rating (r): Прямая оценка пользователя (например, от 1 до 5).
- User-Specific Site Rating: Метрика, агрегирующая оценки пользователя для сайта или раздела. Методы расчета:
- Среднее (Average) или Медиана (Median) оценок страниц в группе.
- Взвешенное среднее (Weighted Average), учитывающее оценки внутри группы и за ее пределами (для учета общей репутации сайта у пользователя).
- Revised Score (S’): Скорректированная оценка ранжирования. Патент предлагает несколько вариантов формул для расчета S’ на основе исходной оценки S и рейтинга r:
- S’ = S[1+k(r-3)] (где k — константа, например, от 0 до 0.5). При r>3 оценка повышается, при r<3 — понижается.
- S’ = S(r/3).
- S’ = k * r или S’ = k^r.
- Иерархическое применение рейтингов: Система использует иерархию: Персональный рейтинг страницы > Рейтинг раздела сайта (наименьшая группа) > Рейтинг сайта (большая группа).
Выводы
- Персонализация через явную обратную связь: Патент детально описывает инфраструктуру для использования явных оценок пользователей (рейтинги, метки) для глубокой персонализации результатов поиска. Система позволяет пользователю напрямую влиять на свое будущее ранжирование.
- Переранжирование на основе личных предпочтений: Система математически изменяет стандартные оценки ранжирования (Score S) на основе личных рейтингов. Высоко оцененные ресурсы получают бустинг, низко оцененные — пессимизируются в персональной выдаче.
- Концепция «Персонального рейтинга сайта» (User-Specific Site Rating): Ключевой механизм — генерализация оценок. Оценки отдельных страниц агрегируются для формирования мнения пользователя о сайте в целом. Этот рейтинг затем применяется к другим, еще не просмотренным страницам этого сайта.
- Иерархическая оценка качества: Система предпочитает более специфичные оценки. Если есть рейтинг страницы, используется он. Если нет — используется рейтинг раздела или всего сайта.
- Отсутствие влияния на глобальное ранжирование: Описанные механизмы влияют только на выдачу конкретного пользователя. Патент не описывает, как эти персональные оценки влияют на глобальное ранжирование.
Практика
Best practices (это мы делаем)
Хотя описанная реализация (явные рейтинги) не актуальна, стратегические выводы о важности пользовательского опыта и консистентности качества остаются важными, так как Google использует аналогичные принципы при анализе неявных сигналов.
- Максимизация удовлетворенности пользователя (User Satisfaction): Ключевая стратегия. Необходимо обеспечивать высокое качество контента и отличный UX. Положительный опыт пользователя (явный или неявный) приведет к повышению сайта в его персональной выдаче, а негативный — к понижению.
- Обеспечение консистентного качества на всем сайте (Site-Wide Quality): Механизм Site Rating показывает, что качество отдельных страниц может экстраполироваться на весь сайт. Нельзя допускать наличия низкокачественных разделов, так как они могут снизить user-specific site rating и повлиять на видимость качественных разделов для конкретного пользователя.
- Оптимизация структуры сайта и URL: Четкая и логичная иерархия сайта помогает поисковой системе корректно определять «группы веб-страниц» (сайты и их подразделы) для расчета и применения Site Rating.
Worst practices (это делать не надо)
- Использование «Кликбейта» и обман ожиданий: Тактики, ведущие к разочарованию пользователя, крайне опасны. В системе с обратной связью это прямой путь к получению низкой оценки или пометки «спам» (Trash/Spam Icon), что приведет к резкому падению сайта в будущих результатах поиска этого пользователя.
- Неравномерное качество контента: Наличие разделов с низкокачественным контентом на в целом хорошем сайте рискованно. Негативный опыт в одном разделе может привести к формированию низкого Site Rating и пессимизации других страниц сайта в персональной выдаче.
Стратегическое значение
Патент подтверждает долгосрочный интерес Google к персонализации и использованию обратной связи от пользователей для оценки качества. Он демонстрирует подход к оценке качества на уровне сайта (Site Rating), основанный на агрегации сигналов с отдельных страниц. Хотя сегодня Google в большей степени полагается на неявные сигналы, базовый принцип остается тем же: пользовательский опыт и удовлетворенность являются ключевыми факторами для долгосрочного успеха, особенно в персонализированной выдаче.
Практические примеры
Сценарий 1: Персонализированное подавление сайта с плохим UX
- Действие пользователя: Пользователь ищет рецепт, попадает на сайт с агрессивной рекламой и неудобным интерфейсом.
- Обратная связь (Явная): Используя механизм из патента, пользователь ставит сайту 1 звезду (r=1).
- Следующий поиск: Пользователь ищет другой рецепт. Тот же сайт попадает в базовую выдачу с оценкой S.
- Переранжирование: Система применяет формулу корректировки. Например, S’ = S[1 + 0.3*(1-3)] = S[1 — 0.6] = 0.4*S. Оценка сайта снижается на 60%.
- Результат: Сайт опускается значительно ниже в персональной выдаче пользователя.
Сценарий 2: Применение Site Rating для нового контента
- Действие пользователя: Пользователь регулярно читает новостной сайт (News.com) и поставил высокие оценки (в среднем 4.5 звезды) нескольким статьям.
- Обработка системой: Google вычисляет user-specific site rating для News.com равный 4.5.
- Следующий поиск: Пользователь ищет актуальную новость. В выдачу попадает новая статья с News.com, которую пользователь еще не видел.
- Переранжирование (Inference): Система использует выведенный рейтинг сайта (r=4.5) для корректировки оценки этой новой статьи. S’ = S[1 + 0.3*(4.5-3)] = S[1 + 0.45] = 1.45*S.
- Результат: Новая статья с этого сайта повышается в персональной выдаче пользователя на 45%, опережая конкурентов.
Вопросы и ответы
Влияют ли описанные в патенте пользовательские рейтинги на глобальное ранжирование?
Согласно тексту патента — нет. Патент сфокусирован исключительно на персонализации поисковой выдачи для конкретного пользователя на основе его собственных явных аннотаций. Механизмы переранжирования и генерации User-Specific Site Rating применяются только к его будущим поискам. Влияние на глобальное ранжирование не описано.
Что такое User-Specific Site Rating и как он рассчитывается?
Это персональный рейтинг качества сайта (или его раздела) для конкретного пользователя. Он рассчитывается путем обобщения (например, усреднения или вычисления медианы) всех явных рейтингов, которые этот пользователь поставил отдельным страницам данного сайта. Этот рейтинг позволяет системе предсказывать удовлетворенность пользователя другими страницами этого же сайта.
Насколько сильно персональный рейтинг может изменить позицию документа?
Влияние может быть значительным. Патент приводит пример формулы S’=S[1+k(r-3)]. Если константа k=0.3, а пользователь поставил 5 звезд (r=5), оценка увеличивается на 60% (S’=1.6*S). Если поставлена 1 звезда (r=1), оценка уменьшается на 60% (S’=0.4*S). Этого достаточно для радикального изменения порядка в ТОП-10.
Использует ли Google сейчас явные звездные рейтинги в поиске, как описано в патенте?
Нет, в настоящее время Google не использует в основном интерфейсе веб-поиска систему явных пользовательских оценок (звезды, тулбары), как это описано в патенте. Однако принципы персонализированного переранжирования остаются актуальными и могут реализовываться с помощью неявных (implicit) поведенческих сигналов.
Какова главная ценность этого патента для SEO-стратегии, если система явных оценок не используется?
Ценность заключается в понимании принципов персонализации и важности удовлетворенности пользователя. Патент демонстрирует концепцию переноса оценки качества с уровня страницы на уровень сайта (Site Rating). Это подчеркивает, что для удержания аудитории необходимо обеспечивать консистентно высокое качество всего сайта, так как негативный опыт может привести к пессимизации сайта в персональной выдаче.
Что произойдет, если пользователь оценит только одну страницу на сайте?
Согласно патенту (Claim 5), даже одной оценки достаточно для начала генерации user-specific site rating для группы документов (сайта), к которой принадлежит эта страница. Эта оценка затем может быть применена к другим страницам этой группы при последующих поисках пользователя.
Как структура сайта влияет на работу этого алгоритма?
Структура сайта (например, иерархия URL) используется для определения «групп веб-страниц» (сайтов и их подразделов). Site Rating может рассчитываться отдельно для разных разделов. Четкая структура помогает системе корректно агрегировать и применять эти обобщенные рейтинги иерархически.
Что такое иерархическое применение рейтингов, описанное в патенте?
Это порядок применения оценок: сначала проверяется явный рейтинг конкретной страницы. Если его нет, проверяется рейтинг группы/раздела, к которому принадлежит страница (Site Rating подраздела). Если и его нет, проверяется рейтинг всего сайта. Это позволяет максимально использовать имеющиеся данные для персонализации.
Могут ли пользователи искать только среди своих аннотированных документов?
Да, патент предусматривает такую возможность. Указывается, что пользовательские аннотации (метки, комментарии) могут быть включены в inverse document index, что делает их доступными для поиска. Также описаны интерфейсы (FIG. 10), позволяющие искать и фильтровать контент по своим аннотациям (Search Ratings).
Могут ли другие пользователи видеть мои персональные оценки?
Патент предусматривает механизм контроля приватности. Пользователь может использовать Privacy Flag, чтобы указать, что его аннотации не должны быть доступны другим. Если приватность не включена, аннотации могут агрегироваться в Community Record и отображаться как Community Ratings.