
Патент описывает систему для анализа общественного мнения по заданной теме. Google собирает релевантные интернет-ресурсы (статьи, блоги, отзывы), группирует их по подтемам, определяет важность каждой подтемы (используя просмотры страниц и ранг релевантности) и вычисляет оценку тональности (Sentiment Score). На основе этих данных создается аналитический отчет о восприятии продукта, услуги или события.
Патент решает задачу агрегации, структурирования и анализа большого объема неструктурированных мнений, разбросанных по интернету (в блогах, отзывах, статьях). Цель — предоставить инструмент для оценки общественного восприятия (public perception) определенной темы (продукта, услуги, политического кандидата и т.д.) путем автоматического выявления ключевых аспектов обсуждения и связанной с ними тональности.
Запатентована система анализа данных (Data Analysis System), которая кластеризует интернет-ресурсы, релевантные заданным ключевым словам. Система идентифицирует подтемы (Topics) внутри этого набора ресурсов, определяет относительную важность (relative importance) каждой подтемы и вычисляет данные о мнениях (opinion data) или оценку тональности (Sentiment Score). Результатом работы является сводный аналитический отчет.
Система работает следующим образом:
TF-IDF для выявления признаков темы (Topic Features), а затем алгоритмы кластеризации (например, упоминается distributed exchange algorithm).Label).Frequency), среднего количества просмотров страниц (Average Page Views) и ранга релевантности (Relevance Rank).Sentiment Score путем анализа языка (позитивные/негативные слова) или извлечения явных оценок (рейтинги, звезды).Средняя. Базовая концепция автоматизированного анализа мнений остается крайне актуальной для задач мониторинга репутации и аналитики. Однако методы, описанные в патенте (подача 2010 г.), такие как TF-IDF и словарный анализ тональности, значительно устарели. Современные системы Google, вероятно, используют продвинутые нейросетевые модели (Трансформеры, BERT, MUM) для более точного тематического моделирования и понимания нюансов тональности.
Влияние на SEO-стратегии ранжирования низкое (3/10). Этот патент не описывает алгоритм ранжирования веб-поиска. Он описывает аналитическую систему для создания отчетов об общественном мнении (ORM/SERM инструмент). Однако он дает ценное понимание того, как Google технически подходит к кластеризации контента, определению тем и, что особенно важно, извлечению и количественной оценке тональности (Sentiment Analysis) из текста и рейтингов.
search queries).relative importance) темы или ресурса. Может основываться на Page Views, частоте ключевых слов, контексте (например, в заголовке), а также глобальной важности (ссылки, голоса пользователей).satisfaction metric).Topic Features перед кластеризацией и для определения меток кластеров.Патент содержит три независимых пункта (1, 10, 13). Они описывают одну и ту же систему, но отличаются тем, как именно определяется оценка тональности (Sentiment Score).
Claim 1 (Независимый пункт): Описывает основной метод работы системы анализа мнений.
content items).topic).Frequency).Relevance Rank).Page Views).Sentiment Score) — метод расчета в этом пункте не уточняется.Claim 10 (Независимый пункт): Описывает систему, аналогичную Claim 1, но явно указывает метод расчета Sentiment Score на основе рейтингов.
Sentiment Score определяется путем анализа рейтинга (rating), связанного с каждым элементом контента, где рейтинг является метрикой удовлетворенности (satisfaction metric).
Система способна извлекать и интерпретировать явные оценки (например, звезды, баллы) для расчета общей тональности по теме.
Claim 13 (Независимый пункт): Описывает систему (на носителе), аналогичную Claim 1, но указывает альтернативный метод расчета Sentiment Score на основе анализа текста.
Sentiment Score определяется путем вычисления разницы между количеством слов с позитивной тональностью (positive-sentiment words) и слов с негативной тональностью (negative-sentiment words).
Система использует лингвистический анализ текста, опираясь на словари тональности, для вычисления настроения автора.
Зависимые пункты (Claims 7-9): Детализируют интерпретацию лингвистического анализа.
Система определяет общее впечатление (overall impression) как позитивное, негативное или нейтральное. Нейтральное впечатление фиксируется, если разница между позитивными и негативными словами находится в пределах предопределенного порога (predetermined threshold).
Этот патент описывает отдельную аналитическую систему (Data Analysis System), а не компонент основного конвейера ранжирования поиска. Это инструмент для аналитики и мониторинга репутации, работающий поверх собранных данных.
CRAWLING и INDEXING
Система полагается на предварительно собранные данные. Упоминается использование веб-краулера (web crawler) для доступа к ресурсам. Система может использовать базу данных сохраненных ресурсов (Stored Resources), которая может включать веб-страницы и логи поисковых запросов.
Аналитический слой (Вне основного конвейера поиска)
Основное применение патента — это обработка запроса на анализ мнений.
Clustering Engine извлекает релевантные ресурсы и группирует их. Это включает извлечение признаков, например, с помощью TF-IDF.Cluster Analysis Engine определяет темы, рассчитывает метрики (важность, тональность) и агрегирует данные. Рассчитываемый Relevance Rank используется для определения важности темы в отчете, а не для ранжирования в SERP.Входные данные:
Page Views) для ресурсов.Relevance Rank (ссылочные данные, статистика использования ключевых слов, голоса пользователей).Выходные данные:
user-review, online reviews), блоги (blogs), редакционные статьи (editorials), новостные материалы (news item).Процесс анализа мнений и генерации отчета
Фаза 1: Сбор и подготовка данных
TF-IDF) для идентификации признаков темы (Topic Features) в каждом ресурсе (слова, фразы, URL, метаданные).Фаза 2: Кластеризация и идентификация тем
Clustering Engine группирует ресурсы на основе выявленных признаков (например, используя distributed exchange algorithm). Количество кластеров может быть задано пользователем.Cluster Analysis Engine анализирует каждый кластер для определения связанной с ним темы и присваивает метку. Например, с помощью TF-IDF для выявления наиболее значимых терминов в кластере.Фаза 3: Расчет метрик
Frequency) — количество ресурсов в соответствующих кластерах.Average Page Views) для каждой темы.Average Relevance Rank) для каждой темы на основе Relevance Score отдельных ресурсов.Average Sentiment Score) для каждой темы. Это делается двумя способами: satisfaction metric).Фаза 4: Отчетность
Патент упоминает использование следующих типов данных:
TF-IDF) и для анализа тональности (поиск позитивных/негативных слов). Контекст использования ключевых слов (например, в заголовке) может влиять на Relevance Score.Sentiment Score. Метаданные (теги) используются как Topic Features.Page Views) используется для расчета средней метрики по теме и как фактор для Relevance Score. Голоса пользователей (user/reader votes, например, like/share) также упоминаются как фактор для Relevance Score.Relevance Score может быть мерой глобальной важности (measure of global importance), основанной на количестве ссылающихся ресурсов (referenced by or linked to).Topic Features для кластеризации.Sentiment Score (рассчитанного как разница слов) с предопределенным порогом. Если абсолютное значение меньше порога — тональность нейтральная.TF-IDF явно указан как метод для извлечения признаков и определения тем кластеров.TF-IDF) для автоматического определения ключевых подтем обсуждения вокруг заданного объекта. Это дает представление о методах тематического моделирования Google того времени.relative importance) тем и ресурсов, используя метрики Relevance Rank (который может включать ссылочную авторитетность и голоса пользователей) и Page Views. Мнения с более авторитетных или популярных страниц имеют больший вес в анализе.TF-IDF, словарный анализ тональности), являются базовыми по меркам 2025 года, что важно учитывать при интерпретации текущих возможностей Google, которые значительно превосходят описанные.Хотя патент не дает прямых рекомендаций по ранжированию, он подчеркивает важность управления репутацией (SERM) и структурирования данных об отзывах.
satisfaction metrics) для расчета Sentiment Score (Claim 10), критически важно предоставлять эти данные в структурированном виде (например, aggregateRating в Schema.org). Это гарантирует, что Google корректно интерпретирует оценки вашего продукта или услуги.Relevance Rank и Page Views ресурса влияют на вес мнения в анализе. Мнение на авторитетном, хорошо ранжируемом и посещаемом ресурсе важнее, чем мнение на неизвестном сайте. Работайте над получением обзоров и упоминаний на качественных площадках.Relevance Rank окажет значительное влияние на общий Sentiment Score в аналитической системе Google.Relevance Score) источника.Стратегическое значение патента заключается в подтверждении того, что Google систематически анализирует и количественно оценивает мнения и тональность в масштабах всего интернета. Это подчеркивает важность репутации и восприятия бренда (как части E-E-A-T) не только для пользователей, но и для алгоритмов Google. Управление онлайн-репутацией (SERM) является неотъемлемой частью комплексной SEO-стратегии.
Сценарий: Анализ восприятия нового смартфона (Пример использования системы)
Frequency и позитивный Sentiment Score (+120), основанный на анализе слов «четкий», «яркий» и средних оценках 4.8/5 (извлеченных из рейтингов).Frequency, но негативный Sentiment Score (-50).Relevance Rank и Page Views, поэтому его негативная оценка батареи имеет большой вес в общем анализе.Описывает ли этот патент, как Google ранжирует сайты в поиске?
Нет, этот патент не описывает алгоритмы ранжирования органической выдачи. Он описывает отдельную аналитическую систему (Data Analysis System), предназначенную для сбора интернет-ресурсов, их кластеризации по темам и анализа общественного мнения (тональности) для создания сводных отчетов. Это инструмент для исследования рынка или мониторинга репутации.
Что такое Sentiment Score и как Google его рассчитывает согласно патенту?
Sentiment Score — это числовая оценка тональности контента. Патент описывает два метода расчета. Первый (Claim 13) — лингвистический анализ: подсчет разницы между количеством позитивных и негативных слов в тексте с учетом грамматических правил (например, отрицаний). Второй (Claim 10) — извлечение явных индикаторов: анализ и нормализация рейтингов, оценок или звезд (satisfaction metric), оставленных авторами контента.
Все ли мнения в интернете имеют одинаковый вес для этой системы?
Нет, система взвешивает мнения. Она рассчитывает относительную важность (relative importance) для каждой темы, используя метрики Relevance Rank и количество просмотров страниц (Page Views) источников. Мнения на более авторитетных (высокий Relevance Rank) и популярных (много Page Views) сайтах имеют больший вес в итоговом отчете.
Что такое Relevance Rank, упомянутый в патенте?
Патент не дает точной формулы, но указывает, что это мера важности ресурса. Она может основываться на комбинации факторов, включая количество просмотров страниц, контекст использования ключевых слов (например, в заголовке), а также глобальную важность (global importance), такую как количество входящих ссылок (referenced by or linked to) или количество голосов пользователей (лайков/шеров).
Как система автоматически определяет темы обсуждения?
Система использует процесс кластеризации. Сначала она может применять алгоритмы вроде TF-IDF для выявления ключевых признаков (Topic Features) в каждом документе. Затем документы с похожими признаками группируются в кластеры. Анализируя содержание кластера (опять же, например, с помощью TF-IDF), система определяет наиболее значимые термины и присваивает кластеру метку (тему).
Какое значение этот патент имеет для SEO-специалиста?
Ключевое значение — это улучшение стратегий управления репутацией (ORM/SERM). Необходимо активно использовать микроразметку Schema.org для рейтингов, так как система умеет их извлекать. Также важно стимулировать появление отзывов на авторитетных и посещаемых площадках, так как вес таких мнений выше в анализе.
Что означает, если система определяет тональность как «нейтральную»?
Согласно патенту (Claims 7-9), система рассчитывает разницу между позитивными и негативными словами. Если абсолютное значение этой разницы меньше определенного порога (predetermined threshold), тональность классифицируется как нейтральная. Это означает, что в тексте нет явно выраженного мнения или количество позитивных и негативных утверждений примерно одинаково.
Использует ли Google современные NLP-модели (например, BERT) для этого анализа?
Патент был подан в 2010 году и упоминает более старые методы, такие как TF-IDF и словарный анализ тональности. Хотя этот конкретный патент не описывает использование современных трансформерных моделей (как BERT или MUM), весьма вероятно, что текущие системы Google используют гораздо более продвинутые NLP-технологии для кластеризации и анализа тональности.
Используются ли просмотры страниц (Page Views) для ранжирования?
В контексте этого патента Page Views используются для определения относительной важности темы в аналитическом отчете и как фактор для Relevance Score ресурса. Патент не подтверждает и не опровергает использование просмотров страниц в основном алгоритме ранжирования веб-поиска.
Может ли эта система анализировать мнения не только о продуктах?
Да. В патенте упоминается, что система может анализировать мнения по широкому кругу тем, включая продукты, услуги, рестораны, политические взгляды, политических кандидатов, события, моду, телешоу, фильмы и любые другие темы, по которым может быть сформировано мнение.

SERP
Семантика и интент

EEAT и качество
Свежесть контента
Семантика и интент

Свежесть контента
EEAT и качество

Краулинг

Knowledge Graph
Семантика и интент
EEAT и качество

Поведенческие сигналы
Ссылки
SERP

Поведенческие сигналы
Семантика и интент
Мультимедиа

Ссылки
EEAT и качество
Свежесть контента

Персонализация
Семантика и интент
Поведенческие сигналы

Структура сайта
SERP
Ссылки

Индексация
Семантика и интент
Ссылки

Семантика и интент
EEAT и качество
SERP

Поведенческие сигналы

Ссылки
SERP
Техническое SEO

Поведенческие сигналы
Персонализация
Семантика и интент
