
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
Патент решает проблему оценки популярности контентных сущностей (content entities) — таких как телепрограммы, фильмы, книги, игры — особенно в ситуациях, когда у системы мало или совсем нет данных о поведении пользователей (проблема «холодного старта» в рекомендательных системах). Прямой сбор данных о популярности такого контента дорог и сложен. Изобретение предлагает метод использования существующих веб-сигналов (поисковых логов, логов веб-серверов) в качестве надежного суррогата или прокси для оценки популярности этих сущностей.
Запатентована система для ранжирования контентных сущностей путем вывода их рейтинга популярности (popularity ranking) на основе популярности связанных с ними эталонных веб-страниц (reference web pages) и поисковых запросов. Система идентифицирует авторитетные веб-страницы, точно описывающие сущность, и измеряет взаимодействие пользователей с этими страницами (посещения) и связанными запросами (объем поиска). Эти веб-сигналы агрегируются для создания оценки популярности самой сущности.
Ключевой механизм работает следующим образом:
текстовый анализ (textual analysis) на заранее определенных авторитетных веб-сайтах для поиска эталонных веб-страниц, которые содержат точное описание сущностей (например, страница фильма на IMDb).click-through rate).контентными сущностями путем сравнения метаданных сущности с контентом страницы.User Visit Ranking) и объема связанных поисковых запросов (Search Query Ranking) за определенный период времени.рейтинга популярности сущности.Высокая. Понимание сущностей (Entity Understanding) и оценка их популярности и авторитетности являются фундаментом для современных поисковых и рекомендательных систем (например, Панели Знаний, Google Discover). Использование прокси-сигналов на основе реального поведения пользователей (поисковый интерес и трафик) для ранжирования сущностей остается крайне актуальным методом.
Патент имеет высокое значение для стратегий, связанных с SEO для сущностей (Entity SEO) и управлением репутацией. Он демонстрирует конкретный механизм, как Google может ранжировать сущности (бренды, продукты, людей) не на основе их собственного контента, а на основе того, насколько они популярны в поиске и как часто посещаются авторитетные сторонние страницы о них (например, Википедия). Это подчеркивает критическую важность управления присутствием сущности на авторитетных ресурсах и стимулирования поискового интереса.
Claim 1 (Независимый пункт): Описывает основной метод ранжирования контентных сущностей.
текстового анализа на предопределенных веб-сайтах для идентификации эталонных веб-страниц (RWP). RWP определяется как страница, точно описывающая сущность. Также определяются связанные поисковые запросы (SQ).контентной сущности (CE): рейтинга популярности для CE на основе логов сервера и/или поиска, фиксирующих взаимодействие пользователей с этим подмножеством RWP и SQ.рейтингами популярности.Claim 6 (Зависимый от 1): Детализирует процесс сопоставления (Matching) сущности с эталонными страницами.
оценки схожести (similarity score) для каждой RWP на основе этого сравнения.оценки схожести превышают предопределенный порог.Claim 7 (Зависимый от 1): Детализирует процесс вывода рейтинга популярности.
User Visit Ranking на основе количества посещений RWP за предопределенный интервал времени.Search Query Ranking на основе количества соответствующих SQ, отправленных в поисковую систему за тот же интервал времени.User Visit Rankings и Search Query Rankings всех RWP в взвешенный рейтинг популярности для соответствующей CE.Изобретение затрагивает несколько этапов поиска, в основном фокусируясь на расчете статических (не зависящих от запроса) сигналов популярности для сущностей.
CRAWLING & INDEXING – Сканирование, Индексирование и извлечение признаков
На этих этапах происходит сбор и анализ данных, необходимых для работы системы:
текстового анализа для идентификации потенциальных эталонных веб-страниц и извлечения из них структурированной информации (например, название, год выпуска).Search Log Database) и логов веб-серверов для определения количества посещений (User Visit Histories) для RWP и определения click-through rate для поисковых запросов, ведущих на RWP.QUNDERSTANDING – Понимание Запросов (Глобальное)
Система анализирует общий объем поисковых запросов (Search Query Ranking), связанных с сущностями, для оценки их популярности.
RANKING – Ранжирование (Сущностей)
Основное применение патента происходит на этапе ранжирования контентных сущностей (например, при ответе на запрос «популярные фильмы» или при формировании рекомендаций).
Similarity Score).User Visit Ranking и Search Query Ranking для вывода итогового Popularity Ranking для сущности.Popularity Ranking используется как ключевой фактор для сортировки результатов при поиске или просмотре сущностей.Входные данные:
Search Log Database (запросы и клики).Выходные данные:
Popularity Ranking (Рейтинг популярности) для каждой контентной сущности.Процесс можно разделить на три основные фазы: Идентификация, Сопоставление и Ранжирование.
Фаза 1: Идентификация эталонных страниц и запросов (Офлайн/Периодически)
Search Log Database для определения поисковых запросов, которые приводят к кликам на идентифицированные эталонные страницы.click-through rate на эталонную страницу превышает предопределенный порог (например, 3 клика на 10 000 показов).Фаза 2: Сопоставление сущностей (Офлайн/Периодически)
контентной сущности (из базы данных) с информацией, извлеченной из эталонной веб-страницы, и терминами связанных поисковых запросов.Similarity Score для каждой пары (Сущность, Эталонная страница).Similarity Score превышает предопределенный порог.Фаза 3: Расчет рейтинга популярности (Офлайн/Периодически)
User Visit Rankings и Search Query Rankings всех связанных страниц и запросов в единый взвешенный Popularity Ranking для сущности. Более свежим данным может придаваться больший вес.эталонных веб-страниц. Система ищет специфические текстовые шаблоны и извлекает данные (название, год, режиссер, актеры, сюжет, кассовые сборы и т.д.).Search Log Database) и логи веб-серверов. Учитываются: click count) из результатов поиска на эталонные страницы.Click-through rate (CTR) для определения релевантности запросов.User Visit Histories) эталонных страниц (включая прямые посещения, фиксируемые, например, через Javascript-сниппеты аналитики).User Visit Ranking и Search Query Ranking. Может включать нормализацию (например, нормализация рейтингов внутри каждого сайта перед агрегацией) и взвешивание (например, придание большего веса недавним данным).Search Query Ranking) и трафик на связанные страницы (User Visit Ranking) являются прямыми компонентами расчета Popularity Ranking сущности. Это подтверждает, что реальный интерес пользователей и «шум» вокруг сущности влияют на её ранжирование.click-through rate для определения того, какие запросы действительно связаны с конкретной страницей (и, следовательно, с сущностью).автоматический текстовый анализ для поиска «предопределенных текстовых шаблонов». Это подчеркивает важность четкого и последовательного представления информации о сущностях на веб-страницах, что облегчает извлечение данных.Хотя патент описывает ранжирование контентных сущностей (например, в рекомендательной системе), он дает критически важные инсайты для SEO-стратегий, направленных на продвижение брендов, продуктов или людей как сущностей.
User Visit Ranking сущности.Similarity Score.Search Query Ranking, компонент итогового рейтинга популярности.эталонной веб-страницы. Информация должна быть представлена в четком, структурированном виде (используя «текстовые шаблоны», которые легко распознаются), чтобы облегчить текстовый анализ и извлечение данных.Popularity Ranking.Similarity Score и может помешать корректному сопоставлению эталонных страниц с сущностью.Popularity Ranking.Патент подтверждает стратегическую важность управления сущностями (Entity Management) в современном SEO. Популярность сущности является измеримым и используемым в ранжировании фактором. Для SEO-специалистов это означает, что работа не ограничивается оптимизацией сайта; она включает в себя управление всем цифровым присутствием бренда или продукта, а также влияние на реальный интерес пользователей (поисковый спрос и трафик на сторонние ресурсы).
Сценарий: Повышение видимости нового продукта (Сущности)
Цель: Увеличить Popularity Ranking нового продукта «Смарт-часы X1» для улучшения его позиций в рекомендациях и поиске по продуктам.
Search Query Ranking) и высокий трафик на авторитетные страницы о продукте (высокий User Visit Ranking). В результате Popularity Ranking сущности «Смарт-часы X1» увеличивается.Означает ли этот патент, что трафик на сайт является фактором ранжирования?
Патент описывает использование трафика (User Visit Ranking) как фактора ранжирования для контентных сущностей (например, фильмов, книг, брендов), а не для ранжирования веб-страниц в основном веб-поиске. Трафик измеряется на эталонных веб-страницах (например, в Википедии) и используется как прокси-сигнал популярности самой сущности. Хотя это не подтверждает использование трафика в основном веб-индексе, это показывает, что Google измеряет и использует трафик как сигнал популярности в своих системах ранжирования.
Что такое «эталонная веб-страница» (Reference Web Page) и как она определяется?
Это веб-страница на заранее определенном авторитетном сайте, которая точно и объективно описывает контентную сущность. Она идентифицируется с помощью автоматического текстового анализа, который ищет предопределенные текстовые шаблоны. Например, страница на IMDb, содержащая поля «Название», «Год», «Режиссер» и «Актеры» в непосредственной близости друг от друга, вероятно, будет идентифицирована как эталонная страница для фильма.
Какие сайты могут считаться «предопределенными веб-сайтами»?
Патент не приводит конкретного списка, но упоминает сайты, которые считаются объективными поставщиками информации: официальные сайты вещателей или сетей, агрегаторы контента (например, YouTube), сайты ТВ-гидов, социальные сети, а также сайты, которые хорошо зарекомендовали себя (подразумеваются Википедия, IMDb и подобные базы данных). Выбор зависит от типа контентной сущности.
Как система связывает поисковый запрос с эталонной страницей?
Система анализирует логи поиска и определяет, какие запросы приводят к кликам на данную эталонную страницу. Запрос считается связанным, если его click-through rate (CTR) на эту страницу превышает предопределенный порог. Это гарантирует, что учитываются только те запросы, которые действительно релевантны контенту страницы.
Как Google убеждается, что эталонная страница действительно соответствует сущности?
Используется модуль сопоставления (Matching Module). Он сравнивает метаданные сущности (из базы данных Google) с информацией, извлеченной из эталонной страницы с помощью текстового анализа. Рассчитывается оценка схожести (Similarity Score). Если эта оценка превышает порог, сопоставление считается действительным. Патент также упоминает возможность ручного контроля качества этого процесса.
Влияет ли популярность в социальных сетях на этот рейтинг?
Да, если активность в социальных сетях приводит к увеличению объема поисковых запросов (влияние на Search Query Ranking) или к увеличению трафика на эталонные веб-страницы (влияние на User Visit Ranking). Патент также упоминает, что эталонные веб-страницы могут включать официальные или неофициальные страницы в социальных сетях, посвященные сущности.
Как учитывается свежесть популярности?
Патент специально оговаривает, что измерения популярности (клики, посещения, запросы) проводятся в различных временных интервалах: последний час, день, неделю, месяц, год. Это позволяет системе учитывать как краткосрочные всплески интереса (тренды), так и долгосрочную популярность. При агрегации итогового рейтинга более свежим данным может придаваться больший вес.
Что важнее для рейтинга: трафик на страницы или объем поисковых запросов?
Патент не указывает конкретные веса, но описывает, что итоговый Weighted Popularity Ranking является агрегацией обоих показателей: User Visit Ranking (трафик) и Search Query Ranking (объем запросов). Оптимальная стратегия должна быть направлена на увеличение обоих показателей.
Как этот патент влияет на SEO для обычных сайтов?
Прямого влияния на ранжирование в веб-индексе этот патент не оказывает. Однако он дает важное понимание того, как Google работает с сущностями. Если ваш сайт продвигает бренд, продукт или личность (сущность), то повышение Popularity Ranking этой сущности (через PR, маркетинг, управление репутацией) может привести к её более высокому ранжированию в Панелях Знаний, каруселях и рекомендательных блоках, что косвенно увеличит видимость и трафик.
Как нормализуются данные о популярности с разных сайтов?
Патент предлагает нормализовать рейтинги внутри каждого веб-сайта перед их агрегацией. Например, если Сущность А связана со страницей P1 (Рейтинг R1), а Сущность Б — со страницей P3 (Рейтинг R3), и обе страницы находятся на сайте W1, то нормализованный вклад сайта W1 в рейтинг Сущности А будет

Ссылки
Семантика и интент
SERP

Поведенческие сигналы
Антиспам
SERP

Семантика и интент
Структура сайта
Ссылки

Ссылки
Антиспам
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

Персонализация
Семантика и интент
SERP

SERP
Поведенческие сигналы

Поведенческие сигналы
Мультимедиа
SERP

Поведенческие сигналы
Персонализация
SERP

Поведенческие сигналы
Семантика и интент
Структура сайта
