SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует специфические сигналы (частоту постинга, рекламу и популярность) для оценки качества блогов и борьбы с автоматизированным контентом

RANKING BLOG DOCUMENTS (Ранжирование блог-документов)
  • US8244720B2
  • Google LLC
  • 2005-09-13
  • 2012-08-14
  • EEAT и качество
  • Антиспам
  • Индексация
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google разработал систему для ранжирования блогов, которая вычисляет независимую от запроса Оценку Качества (Quality Score). Эта оценка учитывает сигналы популярности (подписки, CTR), авторитетности (Pagerank, ссылки), а также выявляет спам-паттерны: автоматизированную частоту и размер постов, расположение рекламы и ссылочные схемы. Финальный рейтинг определяется комбинацией этой оценки качества и стандартной релевантности.

Описание

Какую проблему решает

Патент решает проблему крайне неоднородного качества контента в блогосфере и борется со специфическими видами спама, такими как автоматическая генерация контента (спам-блоги или «сплоги»). Цель — улучшить результаты специализированного поиска по блогам (Blog Search Engine) путем выявления и понижения низкокачественных или спамных блог-документов и продвижения авторитетных ресурсов.

Что запатентовано

Запатентована система ранжирования для поиска по блогам, которая использует две ключевые оценки: Relevance Score (зависит от запроса) и Quality Score (не зависит от запроса). Суть изобретения заключается в методологии расчета Quality Score на основе сигналов, специфичных для блогов. Эти сигналы включают позитивные индикаторы (популярность, авторитетность) и негативные индикаторы (паттерны спама и автоматизации). Финальный Overall Score определяется комбинацией этих двух оценок.

Как это работает

Система работает в два этапа:

  1. Расчет Quality Score (Офлайн/Индексация): Система анализирует блог-документ (блог или пост) для выявления позитивных и негативных индикаторов качества. Индикаторы взвешиваются и комбинируются для расчета Quality Score, который сохраняется в базе данных.
  2. Ранжирование (Онлайн): При получении запроса система определяет стандартный Relevance Score (или IR score). Затем этот показатель корректируется с помощью предварительно рассчитанного Quality Score для получения Overall Score. Блоги с высоким качеством повышаются, а с низким — понижаются.

Актуальность для SEO

Средняя. Патент подан в 2005 году, и многие специфические сигналы (Blogrolls, Feed readers/RSS-агрегаторы) устарели. Специализированный поиск по блогам Google был закрыт. Однако, заложенные принципы имеют фундаментальное значение. Методы выявления автоматизированного контента (по частоте и размеру постов), анализ ссылочных схем и влияния рекламы крайне актуальны в 2025 году, особенно в контексте борьбы с масштабируемым ИИ-контентом. Эти принципы эволюционировали в современные системы оценки качества.

Важность для SEO

Влияние на современные SEO-стратегии значительное (7/10). Хотя прямые тактики (например, оптимизация под RSS) неактуальны, патент раскрывает фундаментальные методы Google для выявления автоматизированного контента по поведенческим и структурным паттернам. Он подтверждает, что Google анализирует не только текст, но и мета-паттерны создания, распространения и монетизации контента для выявления спама.

Детальный разбор

Термины и определения

Blog Document (Блог-документ)
Термин, используемый в патенте для обозначения блога в целом, отдельного поста (записи) блога или их комбинации.
Blogroll (Блогролл)
Коллекция ссылок на внешние сайты (обычно другие блоги). Упоминание в блогролле рассматривается как индикатор популярности.
Blog Search Engine (Поисковая система по блогам)
Специализированная поисковая система, индексирующая и ранжирующая только документы блогов.
Feed/News Aggregator (Фид/Агрегатор новостей)
Сайты или приложения (Feed readers), позволяющие пользователям подписываться на фиды (например, RSS) блогов. Количество подписчиков используется как сигнал популярности.
High Quality Blogroll (Высококачественный блогролл)
Блогролл, который ссылается на известных или доверенных блогеров. Присутствие в таком блогролле является сильным позитивным сигналом.
Overall Score (Итоговая оценка)
Финальная оценка ранжирования, являющаяся комбинацией Quality Score и Relevance Score.
Quality Score (Оценка качества)
Независимая от запроса оценка качества блог-документа, основанная на позитивных и негативных индикаторах, специфичных для блогов.
Relevance Score / IR Score (Оценка релевантности)
Стандартная оценка информационного поиска (Information Retrieval), показывающая, насколько документ соответствует поисковому запросу.
Subscriptions Spam (Спам подписками)
Манипулятивная техника, при которой спамеры искусственно завышают популярность своих блогов, подписываясь на них через агрегаторы.
Tagging (Тегирование)
Процесс добавления пользователями "тегов" (категорий) к блог-документу. Рассматривается как позитивный индикатор, подразумевающий человеческую оценку контента.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов (Claims 1, 5, 6, 7, 10, 18, 21), которые защищают общий механизм ранжирования, но отличаются конкретными индикаторами качества, используемыми для расчета Quality Score.

Общий механизм (Claims 1, 5, 6, 7, 10, 18, 21): Описывается метод ранжирования в Blog Search Engine.

  1. Система получает поисковый запрос.
  2. Идентифицируется блог-документ, релевантный запросу.
  3. Генерируется Relevance Score (зависит от запроса).
  4. Генерируется Quality Score (не зависит от запроса). Эта оценка основана на комбинации позитивных и/или негативных индикаторов качества, специфичных для блогов.
  5. Генерируется финальный Ranking Score (или Overall Score) путем объединения Relevance Score и Quality Score.
  6. Информация о документе предоставляется на основе финального Ranking Score.

Ядром изобретения является использование независимой от запроса оценки качества для корректировки стандартной релевантности.

Специфические индикаторы, упомянутые в Claims: Различные пункты формулы защищают использование конкретных индикаторов для расчета Quality Score. Примеры:

  • Claim 1: Количество рекламы (quantity of ads) И наличие пользовательских тегов (tags that have been added by users).
  • Claim 5: Индикация совпадения контента в фиде (blog feed) блога и контента в самом посте блога (проверка на клоакинг/подмену контента).
  • Claim 6: Расположение рекламы (location of ads) И индикация дублирования контента в нескольких фидах блога.
  • Claim 7: Индикация того, что множество постов блога имеют одинаковую или очень похожую длину (similar or identical length) – признак автоматизации.
  • Claim 21: Детальный анализ расположения рекламы: сравнение наличия рекламы в blogroll или метаданных с наличием рекламы непосредственно в контенте постов.

Где и как применяется

Изобретение применяется в рамках специализированной поисковой системы по блогам и затрагивает этапы индексирования и ранжирования.

CRAWLING – Сканирование и Сбор данных
Система собирает контент блогов, их фиды (RSS/Atom), а также внешние данные: информацию от RSS-агрегаторов (количество подписчиков), данные о тегировании и данные о ссылках (для Pagerank и анализа блогголлов).

INDEXING – Индексирование и извлечение признаков
Основной этап расчета Quality Score (офлайн). Система анализирует собранные данные для вычисления индикаторов качества:

  • Анализ контента и структуры: сравнение фида и поста, поиск дублей, анализ размера постов, количества и расположения рекламы.
  • Анализ темпоральных данных: расчет частоты и паттернов публикации постов.
  • Анализ ссылок: расчет Pagerank, анализ распределения исходящих ссылок, учет входящих ссылок из блогголлов.

Рассчитанный Quality Score сохраняется в индексе вместе с блог-документом.

RANKING – Ранжирование
На этом этапе для входящего запроса рассчитывается стандартный Relevance Score (IR Score).

RERANKING – Переранжирование
Система извлекает Quality Score из индекса и комбинирует его с Relevance Score для получения Overall Score. Происходит финальная сортировка результатов.

На что влияет

  • Конкретные типы контента: Влияет исключительно на Blog Documents (блоги и посты) в рамках специализированного поиска по блогам.
  • Конкретные ниши или тематики: Наибольшее влияние оказывается в нишах, подверженных автоматической генерации контента и спаму.

Когда применяется

Расчет Quality Score применяется периодически на этапе индексирования или переиндексирования блога. Комбинирование Quality Score и Relevance Score применяется в реальном времени при обработке каждого поискового запроса в Blog Search Engine.

Пошаговый алгоритм

Процесс А: Расчет Quality Score (Индексирование/Офлайн)

  1. Сбор данных: Получение блог-документа, его фида, метаданных и внешних сигналов.
  2. Идентификация позитивных индикаторов:
    • Популярность (количество подписчиков через агрегаторы, валидация против subscriptions spam по IP).
    • Подразумеваемая популярность (анализ CTR в кликстриме).
    • Авторитетность (упоминания в Blogrolls, качество этих блогроллов, Pagerank).
    • Вовлеченность (пользовательское тегирование, упоминания в email/чатах).
  3. Идентификация негативных индикаторов (Анти-спам):
    • Частота постинга (выявление всплесков или предсказуемых интервалов).
    • Анализ контента (несовпадение фида и поста, дубликаты, спамные фразы).
    • Размер постов (выявление множества постов одинаковой длины).
    • Распределение ссылок (аномальная концентрация исходящих ссылок на один сайт).
    • Анализ рекламы (большое количество или расположение внутри основного контента поста).
  4. Вычисление Quality Score: Присвоение весов (положительных или отрицательных) каждому индикатору и их комбинирование (например, взвешенное суммирование).
  5. Сохранение: Сохранение Quality Score в базе данных в привязке к блог-документу.

Процесс Б: Ранжирование (Обработка запроса/Онлайн)

  1. Получение запроса: Прием поискового запроса от пользователя.
  2. Расчет Relevance Score: Определение набора релевантных блог-документов и расчет их Relevance Score (IR Score).
  3. Получение Quality Score: Извлечение предварительно рассчитанных Quality Score для найденных документов.
  4. Расчет Overall Score: Комбинирование Relevance Score и Quality Score. В примере патента используется сложение: Overall Score=Relevance Score+Quality Score\text{Overall Score} = \text{Relevance Score} + \text{Quality Score}Overall Score=Relevance Score+Quality Score.
  5. Ранжирование и предоставление: Сортировка документов по Overall Score и предоставление результатов пользователю.

Какие данные и как использует

Данные на входе

Система использует широкий спектр факторов, специфичных для блогосферы:

  • Контентные факторы: Текст постов, контент фидов. Сравнение контента поста и фида (для выявления клоакинга), анализ на дублирование, анализ на спамные слова/фразы (биграммы, триграммы).
  • Технические факторы: Наличие и содержание фидов (Feeds). IP-адреса подписчиков (для валидации популярности).
  • Ссылочные факторы:
    • Pagerank блога или поста (новый пост может наследовать Pagerank блога).
    • Входящие ссылки из Blogrolls (количество и качество источников, high quality blogroll).
    • Распределение исходящих ссылок (Link distribution) — анализ концентрации ссылок на один внешний сайт.
  • Поведенческие факторы:
    • Количество подписчиков через News/Feed aggregators.
    • Анализ кликстрима (Implied popularity, CTR в результатах поиска).
    • Тегирование (Tagging) пользователями.
    • Упоминания URL блога в email или чатах.
  • Временные факторы: Частота публикации новых постов (Frequency of new posts) — анализ паттернов (всплески или регулярные интервалы) для выявления автоматизации.
  • Структурные факторы: Размер постов (Size of the posts) — анализ распределения длин постов для выявления автоматизации (много постов одинаковой длины). Структура страницы (для определения расположения рекламы).
  • Коммерческие (Рекламные) факторы: Количество и расположение рекламы (Presence of ads). Реклама в теле поста считается более негативным фактором, чем в метаданных или рядом с блогроллом.

Какие метрики используются и как они считаются

  • Quality Score: Рассчитывается путем присвоения весов (положительных или отрицательных значений) различным индикаторам и их комбинирования. Патент указывает на возможность использования взвешенного суммирования.
  • Relevance Score (IR Score): Рассчитывается стандартными методами Information Retrieval.
  • Overall Score: Комбинация Quality Score и Relevance Score (в примере патента — простое сложение).
  • Анализ паттернов: Система использует статистический анализ для выявления неестественных распределений в частоте постинга, длине постов и распределении исходящих ссылок.

Выводы

  1. Разделение Оценки Качества и Релевантности: Патент четко демонстрирует фундаментальный принцип разделения Quality Score (независимый от запроса) и Relevance Score (зависимый от запроса). Качество источника может повысить или понизить финальный рейтинг.
  2. Выявление автоматизированного контента по мета-паттернам: Ключевой вывод для современного SEO — Google давно использует методы выявления автоматической генерации, не основанные на анализе текста:
    • Временные паттерны: Публикации всплесками или через строго предсказуемые интервалы.
    • Структурные паттерны: Множество постов одинаковой или очень похожей длины.
    Эти принципы критически важны для работы с ИИ-контентом.
  3. Анализ монетизации и UX: Система детально анализирует количество и расположение рекламы. Агрессивная монетизация, особенно внутри основного контента поста, является сильным негативным фактором.
  4. Анализ ссылочных схем: Неестественное распределение исходящих ссылок (например, большинство ссылок ведет на один внешний сайт) идентифицируется как манипуляция и негативный сигнал.
  5. Важность внешнего подтверждения популярности: Патент подчеркивает важность реальной популярности и авторитетности, измеряемой через подписки, Pagerank, ссылки из авторитетных источников и поведенческие факторы (CTR).
  6. Борьба с техническим спамом: Выявление клоакинга путем сравнения контента на сайте и в фиде (Feed) является важной частью оценки качества.

Практика

Best practices (это мы делаем)

Хотя специфические технологии (RSS, Blogrolls) устарели, патент подтверждает важность следующих фундаментальных стратегий, особенно в контексте ИИ-контента:

  • Избегание паттернов автоматизации: При публикации большого объема контента необходимо избегать предсказуемых паттернов. Варьируйте частоту публикаций (избегайте постинга строго по расписанию) и длину контента. Контент не должен выглядеть так, будто он создан по единому шаблону.
  • Умеренная и качественная монетизация: Реклама не должна мешать потреблению основного контента. Патент явно указывает, что размещение рекламы внутри основного контента поста является более негативным сигналом, чем в сайдбарах или мета-областях.
  • Поддержание чистого ссылочного профиля: Диверсифицируйте исходящие ссылки на авторитетные источники. Избегайте концентрации исходящих ссылок на одном внешнем домене (например, аффилиатном сайте).
  • Фокус на реальной популярности и вовлеченности: Работайте над улучшением поведенческих факторов. Высокий CTR в поиске (implied popularity) является позитивным индикатором качества.
  • Принцип «Хорошего соседства»: Стремитесь получать ссылки с сайтов, которые сами ссылаются на доверенные и авторитетные ресурсы (аналог принципа High Quality Blogrolls).

Worst practices (это делать не надо)

  • Массовая автоматическая генерация контента (ИИ-спам): Создание сайтов с помощью автоматизированных средств, публикующих контент по расписанию или с одинаковой структурой/длиной. Патент описывает конкретные механизмы для их выявления по этим паттернам.
  • Клоакинг и подмена контента: Показ разного контента поисковым системам и пользователям (ранее через Feeds, сейчас через User-Agent или IP).
  • Участие в ссылочных схемах (PBN): Использование сайта преимущественно для размещения исходящих ссылок на один целевой ресурс (неестественное распределение ссылок).
  • Имитация популярности: Попытки накрутки поведенческих факторов. Патент упоминает механизмы валидации таких сигналов (например, по уникальным IP для подписок).
  • Агрессивная реклама внутри контента: Перенасыщение основного контента статьи рекламными блоками.

Стратегическое значение

Патент демонстрирует ранний подход Google к борьбе со спамом путем анализа не только содержания контента, но и мета-паттернов его создания и распространения. В контексте современного SEO и роста ИИ-контента, этот патент напоминает, что системы Google способны выявлять автоматизацию по косвенным признакам (частота, размер, структура), даже если сам текст выглядит качественно. Это подчеркивает важность естественного поведения сайта для долгосрочного успеха.

Практические примеры

Сценарий: Выявление и пессимизация автоматизированного ИИ-контента

  1. Действия (Неправильные): SEO-специалист использует ИИ для генерации 100 статей. Статьи создаются с помощью одного промпта, что приводит к одинаковой длине (например, 1500 слов). Статьи публикуются через планировщик ровно каждые 2 часа.
  2. Анализ Google (на основе принципов патента):
    • Система фиксирует Size of posts: распределение длин постов слишком однородное (негативный индикатор).
    • Система фиксирует Frequency of new posts: интервалы публикаций предсказуемы (predictable intervals) (негативный индикатор).
  3. Результат: Несмотря на потенциальную релевантность контента, система классифицирует сайт как автоматизированный/спамный и присваивает низкий Quality Score, что приводит к деприоритизации в выдаче.
  4. Действия (Правильные): Варьировать промпты и целевую длину статей (от 500 до 3000 слов). Публиковать статьи через случайные, естественные интервалы времени, имитируя человеческое поведение.

Вопросы и ответы

Актуален ли этот патент в 2025 году, учитывая, что он фокусируется на блогах и RSS?

Прямая актуальность низкая, так как технологии RSS и Blogrolls устарели. Однако заложенные в нем принципы борьбы с автоматизированным контентом и оценки качества по мета-паттернам остаются фундаментальными. Методы, описанные для выявления спам-блогов, сегодня могут применяться для борьбы с ИИ-сгенерированным спамом.

Как патент предлагает выявлять автоматическую генерацию контента?

Патент описывает два ключевых метода, не связанных с анализом текста. Первый — анализ частоты публикаций: всплески активности или публикации через строго предсказуемые интервалы (например, каждые 10 минут). Второй — анализ размера постов: если большинство постов на сайте имеют одинаковую или очень похожую длину. Оба паттерна считаются признаком работы генератора.

Как эти методы выявления автоматизации применимы к ИИ-контенту сегодня?

Принципы крайне актуальны. Если ИИ используется для массовой генерации статей по одному шаблону (одинаковая длина и структура) и публикации по расписанию, поисковая система может выявить эти паттерны и классифицировать контент как низкокачественный. Важно вносить максимальное разнообразие в длину, структуру и частоту публикаций.

Как патент предлагает оценивать влияние рекламы на качество?

Патент рассматривает два аспекта: количество и расположение рекламы. Слишком много рекламы является негативным индикатором. Особенно негативно оценивается реклама, размещенная внутри основного контента поста, в отличие от рекламы в боковых колонках (метаданных или рядом с блогроллом). Это соответствует современным принципам Page Experience.

Что такое "implied popularity" (подразумеваемая популярность) и учитывается ли CTR?

Да, это метрика популярности, основанная на анализе кликстрима в результатах поиска. Если пользователи кликают на определенный блог чаще, чем на другие результаты по тем же запросам (высокий CTR), это считается позитивным индикатором качества и популярности данного блога. Это прямое указание на использование поведенческих факторов.

В чем разница между Quality Score и Relevance Score в этом патенте?

Relevance Score (IR Score) зависит от запроса и определяет текстовое соответствие документа ключевым словам. Quality Score не зависит от запроса и определяет общее качество, популярность и надежность блога на основе множества сигналов (ссылки, подписки, паттерны спама). Финальный рейтинг является их комбинацией (например, суммой).

Как система боролась со ссылочными схемами?

Система анализировала распределение исходящих ссылок (Link distribution). Если слишком высокий процент всех ссылок с блога указывал на один и тот же внешний сайт, это считалось негативным индикатором качества и признаком ссылочной схемы, созданной для манипуляции ранжированием.

Что такое "Content Mismatch" (Несоответствие контента)?

Это ситуация, когда контент в фиде (Feed) блога отличается от контента на самой странице блога. Это прием клоакинга: спамеры могли помещать оптимизированный контент в фид для ранжирования, а на странице показывать пользователю рекламу. Выявление такого несовпадения является сильным негативным сигналом.

Может ли новый пост наследовать авторитетность всего блога?

Да. Патент упоминает, что если для нового поста еще не рассчитан собственный Pagerank, он может наследовать Pagerank всего блога. Это позволяет новым постам с авторитетных ресурсов сразу получать преимущество в ранжировании, что соответствует современным принципам E-E-A-T.

Как Google боролся с накруткой популярности (Subscriptions Spam)?

Патент упоминает необходимость валидации подписок для борьбы со спамом, когда авторы искусственно завышают популярность своих блогов. Это достигается путем проверки уникальности пользователей или путем фильтрации по уникальным IP-адресам подписчиков. Google всегда ищет способы валидации сигналов против манипуляций.

Похожие патенты

Как Google находит, фильтрует и подмешивает посты из блогов, релевантные конкретным результатам поиска
Патент описывает систему Google для дополнения стандартных результатов веб-поиска ссылками на релевантные посты в блогах. Система использует многоступенчатую фильтрацию для отсеивания низкокачественных блогов и спама (splogs). Фильтры анализируют количество исходящих ссылок (out-degree), качество входящих ссылок (Link-based score), возраст поста, его длину и расположение ссылок, чтобы гарантировать качество подмешиваемого контента.
  • US8117195B1
  • 2012-02-14
  • EEAT и качество

  • Антиспам

  • Ссылки

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах
Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.
  • US9501549B1
  • 2016-11-22
  • Поведенческие сигналы

Как Google использует CTR и E-E-A-T сигналы для определения контекста ссылок и оценки качества внешних упоминаний
Google использует двухэтапный механизм для анализа внешних комментариев (например, блог-постов). Сначала система определяет истинный объект обсуждения, если в комментарии несколько ссылок, анализируя CTR, длину URL и тематику. Затем она оценивает качество комментария, используя рейтинг автора, авторитетность источника, свежесть и обратную связь пользователей, чтобы отобрать наиболее релевантный контент.
  • US8656266B2
  • 2014-02-18
  • Ссылки

  • EEAT и качество

  • Свежесть контента

Популярные патенты

Как Google использует нормализованные сигналы удовлетворенности пользователей для переранжирования выдачи и управления краулингом/индексацией
Google анализирует вовлеченность пользователей (полезность), сравнивая фактическую удовлетворенность (Good Utilization Events) с ожидаемой вовлеченностью для данной позиции ранжирования. На основе этого рассчитывается Correction Factor для повышения документов, превосходящих ожидания, и понижения тех, которые им не соответствуют. Эта система также влияет на приоритеты сканирования и решения об индексации.
  • US9223897B1
  • 2015-12-29
  • Поведенческие сигналы

  • Индексация

  • Техническое SEO

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов
Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.
  • US7925657B1
  • 2011-04-12
  • Поведенческие сигналы

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

Как Google динамически формирует Панели Знаний, выбирая блоки информации на основе истории поисковых запросов пользователей
Google использует гибридный подход для создания структурированных страниц о сущностях (например, Панелей Знаний). Система анализирует исторические данные о том, что пользователи чаще всего ищут об этой сущности или её классе. На основе этого анализа динамически выбираются блоки информации (например, «Награды», «Саундтрек»), которые дополняют стандартный набор данных, позволяя автоматически адаптировать выдачу под актуальные интересы аудитории.
  • US10110701B2
  • 2018-10-23
  • Knowledge Graph

  • Поведенческие сигналы

  • Персонализация

Как Google использует анализ со-цитирования (Co-citation) для группировки результатов поиска по темам
Google использует механизм кластеризации для организации поисковой выдачи, особенно при неоднозначных запросах. Система анализирует, какие внешние страницы одновременно ссылаются на несколько результатов поиска (со-цитирование). На основе этого вычисляется показатель сходства, который учитывает и нормализует популярность страниц, чтобы точно сгруппировать результаты по конкретным темам (например, отделить «Saturn» как планету от «Saturn» как автомобиль).
  • US7213198B1
  • 2007-05-01
  • Ссылки

  • SERP

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL
Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.
  • US20140280133A1
  • 2014-09-18
  • Семантика и интент

  • Поведенческие сигналы

  • Knowledge Graph

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google запоминает вопросы без авторитетного ответа и автономно сообщает его позже через Ассистента
Патент Google описывает механизм для обработки запросов, на которые в момент поиска нет качественного или авторитетного ответа. Система запоминает информационную потребность и продолжает мониторинг. Когда появляется информация, удовлетворяющая критериям качества (например, в Knowledge Graph), Google автономно доставляет ответ пользователю, часто встраивая его в следующий диалог с Google Assistant, даже если этот диалог не связан с исходным вопросом.
  • US11238116B2
  • 2022-02-01
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

seohardcore