SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google идентифицирует, оценивает и ранжирует «Глубокие статьи» (In-Depth Articles) и «Вечнозеленый контент»

SURFACING IN-DEPTH ARTICLES IN SEARCH RESULTS (Отображение "Глубоких статей" в результатах поиска)
  • US9996624B2
  • Google LLC
  • 2015-06-26
  • 2018-06-12
  • EEAT и качество
  • Индексация
  • Семантика и интент
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для идентификации и ранжирования высококачественного лонгрид-контента (In-Depth Articles). Система определяет авторитетные сайты на основе внешних наград и ссылочных паттернов. Контент оценивается по критериям «вечнозелености» (Evergreen Score), структуры (Article Score), отсутствия коммерческого интента и авторитетности автора (Author Score). Ранжирование основано на комбинации качества (IDA Score) и релевантности запросу (Topicality Score).

Описание

Какую проблему решает

Патент решает задачу идентификации и выделения в поисковой выдаче контента, который предоставляет глубокий анализ темы, хорошо проработан и побуждает к размышлению (так называемые «read-to-learn» статьи). Система направлена на то, чтобы отличить такие «Глубокие статьи» (In-Depth Articles или IDA) от стандартных новостных репортажей, энциклопедических справок или просто подробных обзоров, которые не предлагают уникальной перспективы.

Что запатентовано

Запатентована система для идентификации, индексирования, оценки и выборочного отображения In-Depth Articles. Изобретение включает методы определения пула авторитетных сайтов (Target Websites), вычисления оценки качества статьи (IDA Score) на основе её структуры, «вечнозелености» (Evergreen Score) и авторства. Также запатентован механизм триггера для показа блока IDA, основанный на присутствии «Звездных источников» (Stellar Sources) в основной выдаче.

Как это работает

Система работает в двух режимах: офлайн-индексация и онлайн-ранжирование.

  • Офлайн: Система начинает с набора Seed Websites (например, лауреаты Пулитцеровской премии) и расширяет его с помощью коллаборативной фильтрации на основе схожести анкорных текстов, формируя Target Websites. Контент с этих сайтов оценивается для получения IDA Score, основанного на Evergreen Score, Article Score, Author Score и других метриках. Статьи выше порога попадают в IDA Index.
  • Онлайн: При получении запроса система проверяет, присутствует ли в основных результатах поиска Stellar Source. Если да, это активирует блок IDA. Для статей в IDA Index рассчитывается Topicality Score (релевантность запросу) и финальный Document Score (комбинация IDA Score и Topicality Score). Лучшие статьи отображаются в блоке.

Актуальность для SEO

Высокая. Хотя выделенный блок «In-Depth Articles» в том виде, как он описан в патенте, сейчас может быть интегрирован в основную выдачу или другие форматы (например, Perspectives), описанные механизмы оценки качества лонгрид-контента (особенно Evergreen Score, Author Score и идентификация авторитетных источников через внешние сигналы) остаются крайне актуальными для понимания принципов E-E-A-T и работы Helpful Content System.

Важность для SEO

Патент имеет высокое значение (8.5/10) для контент-стратегии, особенно для информационных сайтов и медиа. Он детально раскрывает, какие именно характеристики Google ищет в высококачественном лонгрид-контенте: «вечнозеленость», специфическая структура повествования, авторитетность автора и некоммерческий характер. Понимание этих метрик критично для создания контента, который Google классифицирует как глубокий и авторитетный.

Детальный разбор

Термины и определения

In-Depth Article (IDA, Глубокая статья)
Контент, предоставляющий глубокую перспективу, хорошо проработанный и побуждающий к размышлению («read-to-learn»). Отличается от новостей или энциклопедических справок.
IDA Score (Оценка IDA)
Метрика, указывающая на степень, в которой контент квалифицируется как In-Depth Article. Рассчитывается на основе суб-метрик.
Seed Websites (Исходные/Эталонные сайты)
Начальный набор сайтов, известных публикацией качественного контента (например, лауреаты Пулитцеровской премии или National Magazine Award за определенный период).
Target Websites (Целевые сайты)
Итоговый пул сайтов, контент которых обрабатывается для поиска IDA. Формируется путем расширения Seed Websites и последующей фильтрации.
Collaborative Filtering (CF) Models (Модели коллаборативной фильтрации)
Модели, используемые для определения схожести сайтов. Основаны на anchor n-grams (анкорные тексты ссылок с других сайтов). Сайты считаются похожими, если на них ссылаются с использованием схожей лексики.
Article Score (Оценка статьи)
Суб-метрика IDA Score. Оценивает, является ли контент лонгридом, основываясь на длине (word count) и структуре (предпочтение длинным абзацам повествовательного стиля).
Commercial Score (Коммерческая оценка)
Суб-метрика IDA Score. Оценивает степень коммерческого характера контента. Слишком коммерческий контент исключается из IDA.
Evergreen Score (Оценка вечнозелености)
Суб-метрика IDA Score. Указывает на устойчивый интерес к контенту с течением времени. Для старого контента основывается на распределении ссылок (anchor distribution) во времени; для нового – на предиктивной модели.
Author Score (Оценка автора)
Суб-метрика IDA Score. Отражает репутацию автора в создании evergreen content.
Site Pattern Score (Оценка шаблона сайта)
Суб-метрика IDA Score. Вероятность того, что определенный шаблон URL содержит evergreen content.
Stellar Source (Звездный источник)
Издатель, идентифицированный как часто публикующий In-Depth Articles. Присутствие Stellar Source в основной выдаче является триггером для показа блока IDA.
Topicality Score (Оценка тематичности)
Оценка релевантности конкретной IDA к запросу пользователя. Основана на пересечении тем (topics) запроса и статьи.
Document Score (Оценка документа)
Финальная оценка для ранжирования IDA в блоке. Является функцией от IDA Score и Topicality Score.
Suggested Query / Tag (Предлагаемый запрос / Тег)
Кликабельный элемент, отображаемый вместе с IDA, представляющий связанный запрос для дальнейшего изучения темы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной онлайн-процесс отображения In-Depth Articles в ответ на запрос, фокусируясь на механизме триггера.

  1. Система получает основные (general) результаты поиска, релевантные запросу.
  2. Система проводит перекрестную проверку URL основных результатов с site pattern (шаблоном сайта) издателя, который идентифицирован как публикующий IDA (т.е. Stellar Source).
  3. Система определяет, что результаты IDA должны быть показаны, основываясь на том, что URL основного результата соответствует site pattern авторитетного издателя. (Это и есть триггер).
  4. Если показ активирован:
    1. Получается Topicality Score (релевантность IDA запросу).
    2. Получается Document Score (основан на Topicality Score и IDA Score).
    3. Отбираются одна или несколько IDA на основе Document Scores.
    4. Результаты IDA предоставляются для отображения.

Claim 3 (Зависимый от 2): Детализирует офлайн-процесс создания индекса IDA (IDA Index).

  1. Предоставляется набор Target Websites на основе Seed Websites.
  2. Для веб-страниц Target Websites определяется IDA Score.
  3. Контент идентифицируется как IDA на основе этого IDA Score (если он превышает порог, как указано в Claim 4).

Claim 5 (Зависимый от 3): Уточняет, как формируются Target Websites. Набор Seed Websites расширяется за счет включения сайтов на основе схожести (similarity) между исходным сайтом и добавляемыми сайтами. (В описании патента эта схожесть определяется через Collaborative Filtering).

Claim 7 (Зависимый от 1): Уточняет состав IDA Score. Он основан на одной или нескольких суб-метриках, включая как минимум одну из: Article Score, Commercial Score, Evergreen Score и Author Score.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, с четким разделением на офлайн-подготовку и онлайн-обработку.

INDEXING – Индексирование и извлечение признаков
Основная часть работы происходит на этом этапе офлайн:

  • Идентификация источников: Система определяет Seed Websites (на основе внешних наград) и использует Collaborative Filtering (анализ анкорных текстов) для расширения пула до Target Websites.
  • Извлечение признаков и расчет метрик: Для контента на Target Websites вычисляются суб-метрики (Article Score, Evergreen Score, Author Score, Commercial Score) и агрегированный IDA Score. Это включает анализ текста, структуры, ссылок во времени и данных об авторах.
  • Индексирование: Статьи, превысившие порог IDA Score, помещаются в специализированный IDA Index.
  • Идентификация Stellar Sources: Анализ паттернов ссылок и позитивных анкоров для определения списка Stellar Sources и их Site Patterns.

QUNDERSTANDING – Понимание Запросов
Система анализирует запрос и статьи для определения их тем (topics), что необходимо для расчета Topicality Score. Также включает офлайн-процесс генерации Suggested Queries (тегов).

RANKING – Ранжирование
Генерируются основные (general) результаты поиска.

METASEARCH – Метапоиск и Смешивание
Это этап, на котором принимается решение о показе блока IDA и его наполнении:

  • Триггер: Система проверяет, содержат ли основные результаты поиска ссылки, соответствующие Site Patterns из списка Stellar Sources.
  • Ранжирование IDA: Если триггер сработал, система обращается к IDA Index, рассчитывает Topicality Score и Document Score для кандидатов.
  • Смешивание (Blending): Отобранные IDA смешиваются с основными результатами, формируя специальный блок в SERP.

На что влияет

  • Конкретные типы контента: Влияет исключительно на лонгриды, аналитические статьи, эссе, журналистские расследования. Исключает новости, коммерческие страницы, энциклопедические справки.
  • Специфические запросы: Наибольшее влияние оказывается на широкие информационные запросы («read-to-learn»), по которым пользователи ищут глубокое погружение в тему (например, [university admissions]).
  • Конкретные ниши: Медиа, наука, история, технологии – тематики, где возможен глубокий анализ и присутствуют авторитетные издания (Stellar Sources).

Когда применяется

  • Триггер активации: Ключевое условие, описанное в патенте (Claim 1) – хотя бы один из основных результатов поиска должен соответствовать Site Pattern издателя, идентифицированного как Stellar Source.
  • Условие применения: Алгоритм применяется только к контенту, который предварительно прошел порог качества и был включен в IDA Index.

Пошаговый алгоритм

Процесс А: Создание Индекса IDA (Офлайн)

  1. Определение Seed Websites: Отбор сайтов на основе внешних признаков авторитетности (например, Пулитцеровская премия).
  2. Расширение (Expansion) и Сжатие (Contraction):
    1. Построение моделей Collaborative Filtering (CF) на основе входящих анкорных n-грамм.
    2. Расширение списка путем добавления сайтов, чьи CF-модели похожи на Seed Websites.
    3. Фильтрация (Сжатие) путем удаления сайтов, чьи CF-модели похожи на Bad Seed Websites (например, соцсети, спам). Результат – Target Websites.
  3. Расчет IDA Score: Для контента на Target Websites вычисляются суб-метрики:
    1. Article Score (анализ длины и структуры абзацев).
    2. Commercial Score (проверка на коммерческий интент; если выше порога, контент исключается).
    3. Evergreen Score (анализ устойчивости ссылок во времени или предиктивная модель для свежего контента).
    4. Site Pattern Score и Author Score.
  4. Индексирование: Комбинирование суб-метрик в IDA Score. Если оценка превышает порог, контент добавляется в IDA Index.
  5. Идентификация Stellar Sources: Определение авторитетных издателей на основе анализа ссылок и позитивных анкоров. Составление списка их Site Patterns.

Процесс Б: Обработка запроса и ранжирование IDA (Онлайн)

  1. Получение запроса и основных результатов: Система генерирует стандартные результаты поиска.
  2. Проверка триггера (Stellar Source Check): Система проверяет, соответствуют ли URL основных результатов Site Patterns из списка Stellar Sources.
    1. Если НЕТ: Показать стандартную выдачу.
    2. Если ДА: Активировать поиск IDA.
  3. Расчет Topicality Score: Для статей в IDA Index определяется степень пересечения тем (topics) статьи и запроса.
  4. Расчет Document Score: Вычисление финальной оценки как комбинации IDA Score (качество) и Topicality Score (релевантность).
  5. Отбор и отображение: Выбор Топ-X статей с наивысшим Document Score и отображение их в SERP.

Какие данные и как использует

Данные на входе

Патент описывает использование разнообразных данных для оценки качества контента и источников.

  • Ссылочные факторы (Ключевые):
    • Анкорные тексты (Anchor n-grams): Критически важны. Используются для построения CF Models (определения схожести сайтов) и для идентификации Stellar Sources (анализ позитивных анкоров типа «great article»).
    • Распределение ссылок во времени (Anchor distribution): Используется для расчета Evergreen Score (устойчивый интерес).
    • Источники ссылок: Ссылки от авторитетных источников («reputable entities») используются для идентификации Stellar Sources.
  • Контентные и Структурные факторы:
    • Длина контента (Word count) и Структура абзацев: Количество и длина абзацев (для Article Score).
    • Коммерческие индикаторы: Термины типа «offer», «sale» и элементы взаимодействия типа форм оплаты (для Commercial Score).
    • Текст статьи: Используется для определения тем (topics).
    • Шаблоны URL (Site Patterns): Используются для группировки контента и расчета Site Pattern Score.
  • Временные факторы:
    • Дата публикации: Определяет метод расчета Evergreen Score (анализ истории или предиктивная модель).
  • Внешние факторы авторитетности:
    • Награды: Пулитцеровская премия и т.п. (для определения Seed Websites).
    • Авторство: Данные об авторе и его предыдущих публикациях (для Author Score).

Какие метрики используются и как они считаются

  • Similarity Score (Оценка схожести сайтов): Рассчитывается как косинусное сходство (cosine similarity) между CF Models сайтов.
  • IDA Score: Агрегированная оценка качества статьи. Рассчитывается как комбинация (взвешенная сумма, произведение или среднее) суб-метрик.

Выводы

  1. Специфическое определение качества для лонгридов: Google использует отдельный набор метрик (IDA Score) для оценки лонгрид-контента. Ключевые компоненты – структура повествования (Article Score), отсутствие коммерческого интента (Commercial Score) и устойчивый интерес во времени (Evergreen Score).
  2. Критичность «Вечнозеленого» контента: Evergreen Score является центральным элементом оценки. Система ценит контент, который сохраняет актуальность и продолжает привлекать ссылки спустя длительное время после публикации. Для нового контента используются домен-специфичные предиктивные модели.
  3. Использование внешних сигналов авторитетности: Патент явно указывает на использование престижных внешних наград (Пулитцеровская премия) для определения исходного набора авторитетных сайтов (Seed Websites). Это подтверждает важность реальных достижений для E-E-A-T.
  4. Роль анкорных текстов в определении авторитетности: Схожесть сайтов определяется через Collaborative Filtering на основе анкорных текстов. То, как другие сайты описывают ресурс, определяет его качественное окружение и помогает идентифицировать Stellar Sources.
  5. Измеримая значимость авторства: Author Score, основанный на репутации автора в создании evergreen content, является прямым компонентом IDA Score, что подчеркивает важность развития экспертности авторов.
  6. Уникальный механизм триггера: Отображение блока IDA зависит от присутствия уже идентифицированного Stellar Source в основной выдаче (Claim 1). Это гарантирует, что функция активируется в контексте, где высококачественный контент уже присутствует.
  7. Двухуровневое ранжирование: Ранжирование требует как высокого качества самой статьи (IDA Score для попадания в индекс), так и её релевантности конкретному запросу (Topicality Score для ранжирования в блоке).

Практика

Best practices (это мы делаем)

  • Фокус на Evergreen Content и его продвижении: Разрабатывайте контент-стратегию с упором на создание «вечнозеленых» статей. Критически важно не только создать такой контент, но и обеспечить устойчивое привлечение ссылок на него с течением времени (не только в момент публикации), так как это является основой Evergreen Score.
  • Оптимизация структуры лонгридов (Article Score): При создании глубокого контента используйте повествовательный стиль с хорошо проработанными, длинными абзацами. Избегайте коротких, рубленых фраз, характерных для новостного стиля.
  • Развитие авторитетности авторов (Author Score): Инвестируйте в авторов, специализирующихся на глубоком анализе. Повышение количества качественных лонгридов у конкретного автора улучшает его Author Score и, как следствие, IDA Score его будущих статей. Четко указывайте авторство.
  • Контроль коммерциализации (Commercial Score): Четко разделяйте аналитический и коммерческий контент. Убедитесь, что на страницах, претендующих на статус IDA, нет агрессивных коммерческих элементов, призывов к покупке или форм ввода данных.
  • Мониторинг анкорных текстов (CF Models и Stellar Sources): Анализируйте, как другие сайты ссылаются на ваш ресурс. Культивируйте ссылочный профиль с анкорами, отражающими глубокую экспертизу (например, «подробный анализ», «исследование»), чтобы повысить шансы быть классифицированным как Stellar Source или попасть в Target Websites.
  • Структурирование сайта (Site Pattern Score): Используйте логичные URL-шаблоны для разных типов контента. Это помогает системе определить разделы с наибольшей концентрацией потенциальных IDA.

Worst practices (это делать не надо)

  • Создание лонгридов в новостном стиле: Написание длинных текстов, состоящих из коротких абзацев, негативно скажется на Article Score.
  • Агрессивная монетизация аналитических статей: Размещение большого количества рекламы или призывов к покупке в аналитических статьях повысит Commercial Score и может привести к исключению контента из индекса IDA.
  • Фокус только на объеме текста: Создание длинного, но поверхностного контента («воды») не поможет, так как система оценивает глубину и устойчивый интерес (ссылки), а не только количество слов.
  • Игнорирование авторства: Публикация глубоких аналитических материалов под общим аккаунтом («Admin») не позволяет использовать преимущества Author Score.
  • Фокус на краткосрочном трафике: Создание контента, который быстро теряет актуальность, не позволит набрать высокий Evergreen Score.

Стратегическое значение

Патент подтверждает стратегическую важность создания контента, который не просто отвечает на вопрос, но и предоставляет глубокий анализ и сохраняет ценность с течением времени. Он детально описывает, как Google измеряет качество за пределами стандартной релевантности, используя структуру контента, временные ссылочные сигналы и авторитетность автора. Эти механизмы являются фундаментальными для понимания того, как Google оценивает E-E-A-T на практике. Инвестиции в настоящий экспертный, «вечнозеленый» контент и развитие авторов являются ключевыми для долгосрочной SEO-стратегии.

Практические примеры

Сценарий: Оптимизация статьи для Evergreen Score

Задача: Опубликовать новую аналитическую статью и максимизировать ее шансы быть классифицированной как Evergreen.

  1. Подготовка (Учет предиктивной модели): Поскольку статья новая, Evergreen Score будет рассчитываться по предиктивной модели, специфичной для домена. Необходимо проанализировать характеристики уже успешных Evergreen статей на сайте (длина, темпы получения ссылок в первые дни).
  2. Создание контента:
    1. Поручить написание автору с высоким Author Score.
    2. Создать лонгрид (например, 3000+ слов) с повествовательной структурой (высокий Article Score).
    3. Минимизировать коммерческие блоки (низкий Commercial Score).
  3. Запуск и продвижение: Обеспечить активный линкбилдинг сразу после публикации, чтобы темпы роста ссылок соответствовали паттернам успешных статей, известным предиктивной модели.
  4. Ожидаемый результат: Система предсказывает высокую вероятность «вечнозелености», присваивает высокий Evergreen Score, что значительно повышает общий IDA Score и шансы на высокое ранжирование по широким информационным запросам.

Вопросы и ответы

Что такое «In-Depth Article» (IDA) согласно патенту и чем он отличается от обычного лонгрида?

Согласно патенту, IDA — это не просто длинный текст. Это аналитический, хорошо проработанный материал, который предлагает ценную перспективу и провоцирует размышления («read-to-learn»). Ключевые отличия: он не должен быть новостью или энциклопедической справкой. Система оценивает это через комбинацию факторов: длину и нарративную структуру абзацев (Article Score), устойчивый интерес с течением времени (Evergreen Score) и авторитетность источника и автора.

Как рассчитывается «Evergreen Score» для свежего контента?

Для контента, опубликованного недавно, распределение ссылок еще неинформативно. В этом случае Google использует предиктивную модель (predictive model), специфичную для данного сайта. Модель обучается на характеристиках (длина, количество ссылок в первые дни) уже известных вечнозеленых статей этого же сайта. Если свежий контент похож по характеристикам на будущие вечнозеленые статьи, ему присваивается высокий Evergreen Score.

Что является триггером для показа блока In-Depth Articles в выдаче?

Триггером, описанным в Claim 1, является наличие в общих результатах поиска (general search results) хотя бы одного URL, который соответствует шаблону сайта (Site Pattern) идентифицированного «Звездного источника» (Stellar Source). Если такого источника в выдаче нет, блок IDA не будет показан, даже если в индексе есть релевантные статьи.

Как Google определяет авторитетные сайты для анализа (Target Websites)?

Google начинает с небольшого списка заведомо качественных сайтов (Seed Websites, например, лауреаты премий). Затем он использует Collaborative Filtering на основе анкорных текстов входящих ссылок. Если на ваш сайт ссылаются, используя те же слова и фразы (anchor n-grams), что и на Seed Websites, ваш сайт может быть включен в список Target Websites для анализа.

Может ли коммерческий контент считаться In-Depth Article?

Это маловероятно. Патент описывает Commercial Score. Если контент содержит слишком много признаков коммерческого намерения (термины, элементы взаимодействия, такие как формы заказа), он может быть исключен из рассмотрения как IDA. Информационный контент должен быть четко отделен от транзакционного.

Как структура URL влияет на оценку контента?

Структура URL используется в двух ключевых моментах. Во-первых, Site Pattern Score оценивает вероятность того, что определенный шаблон URL (например, /blog/ vs /products/) содержит вечнозеленый контент, основываясь на истории этого раздела. Во-вторых, шаблоны URL используются для идентификации Stellar Sources, что служит триггером для показа блока IDA в выдаче.

Какую роль играет авторство в этом патенте?

Авторство используется для расчета Author Score. Эта оценка основана на истории автора: сколько статей он написал, какова их длина и, самое главное, сколько из них были классифицированы как вечнозеленый контент. Авторы с подтвержденной репутацией создания качественного контента повышают IDA Score статьи.

В чем разница между IDA Score и Document Score?

IDA Score – это оценка внутреннего качества и глубины статьи, не зависящая от запроса (рассчитывается офлайн). Она базируется на структуре, «вечнозелености», авторстве. Document Score – это финальная оценка, используемая для ранжирования в реальном времени. Она является комбинацией IDA Score (качество) и Topicality Score (релевантность конкретному запросу).

Что такое «вечнозеленый контент» (Evergreen Content) согласно патенту?

Это не просто старый контент. Это контент, который демонстрирует «устойчивый интерес с течением времени». Google измеряет это, анализируя распределение входящих ссылок (anchor distribution). Если на статью продолжают ссылаться спустя месяцы и годы после публикации, это сильный сигнал вечнозелености. Необходимо обеспечить постоянное привлечение ссылок.

Актуален ли этот патент, если блока «In-Depth Articles» больше нет в выдаче?

Да, патент остается высоко актуальным. Хотя формат отображения в SERP мог измениться или быть интегрирован в основную выдачу, описанные механизмы оценки качества лонгридов (Evergreen Score, Author Score, Article Score) дают ценное понимание того, как Google оценивает глубокий, экспертный контент в рамках E-E-A-T и Helpful Content систем.

Похожие патенты

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google использует авторитетные сайты в органической выдаче для активации и позиционирования блоков с ответами (Answer Boxes)
Google определяет, когда показывать блок с ответом (Answer Box) или вертикальную интеграцию (погода, акции и т.д.), анализируя не только текст запроса, но и состав органической выдачи. Если в результатах присутствуют специфические авторитетные URL или ключевые слова (называемые «индикаторами блока ответов»), система с большей вероятностью покажет соответствующий блок. Эти индикаторы определяются заранее путем анализа того, какие сайты часто появляются по ключевым «исходным запросам» для данной темы.
  • US9607087B1
  • 2017-03-28
  • SERP

  • Семантика и интент

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google определяет оригинальность контента для расчета Авторского Ранга (Author Rank) и влияния на ранжирование
Google использует систему для идентификации оригинального контента и повышения авторитета его создателей. Система разбивает документы на фрагменты (content pieces) и отслеживает их первое появление. Авторы (включая домены) ранжируются на основе количества созданного ими оригинального контента и частоты его копирования другими. Ранг автора затем используется для повышения в выдаче документов этого автора, особенно свежих публикаций.
  • US8983970B1
  • 2015-03-17
  • EEAT и качество

  • Свежесть контента

  • SERP

Как Google использует данные веб-поиска для распознавания сущностей в специализированных вертикалях (на примере поиска медиаконтента)
Google использует двухэтапный процесс для ответа на описательные запросы в специализированных поисках (например, поиск фильмов по сюжету). Сначала система ищет информацию в основном веб-индексе, анализирует топовые результаты для выявления релевантных сущностей (названий фильмов), а затем использует эти сущности для поиска в специализированной базе данных.
  • US9063984B1
  • 2015-06-23
  • Семантика и интент

  • Мультимедиа

  • Индексация

Популярные патенты

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует социальные связи для выявления предвзятых ссылок и борьбы со ссылочными схемами и кликфродом
Google анализирует взаимоотношения между администраторами веб-сайтов (используя данные социальных сетей), чтобы определить независимость ссылок или кликов по рекламе. Если обнаружена тесная связь, это интерпретируется как предвзятость (Bias). В результате вес ссылки для ранжирования может быть снижен (борьба с Search Spamming), или клик по рекламе может быть дисконтирован (борьба с Ad Spamming).
  • US10402457B1
  • 2019-09-03
  • Ссылки

  • Антиспам

  • Краулинг

Как Google использует последовательность кликов пользователей (Co-selection) для классификации изображений и фильтрации контента (SafeSearch)
Google анализирует, какие изображения пользователи выбирают последовательно в рамках одной сессии (co-selection). Если Изображение Б часто выбирается сразу после Изображения А (с известной темой), система присваивает Изображению Б ту же тему. Этот механизм использует графовый анализ поведения для уточнения тематики изображений, что критично для повышения релевантности и работы фильтров, таких как SafeSearch.
  • US8856124B2
  • 2014-10-07
  • Безопасный поиск

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google комбинирует поведенческие сигналы из разных поисковых систем для улучшения ранжирования
Google использует механизм для улучшения ранжирования путем объединения данных о поведении пользователей (клики и время взаимодействия) из разных поисковых систем (например, Веб-поиск и Поиск по Видео). Если в основной системе данных недостаточно, система заимствует данные из другой, применяя весовой коэффициент и фактор сглаживания для контроля смещения и обеспечения релевантности.
  • US8832083B1
  • 2014-09-09
  • Поведенческие сигналы

  • SERP

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов
Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.
  • US6941293B1
  • 2005-09-06
  • Семантика и интент

  • Ссылки

Как Google использует личные данные пользователя (User Model) для понимания его намерений и персонализации выдачи
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования запроса контекстом из личных данных, чтобы предоставить точные персонализированные результаты.
  • US20150012558A1
  • 2015-01-08
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google вычисляет важность сущностей внутри документа, используя контекст, ссылки и поведение пользователей, для улучшения ранжирования
Google использует систему для определения относительной важности сущностей (люди, места, даты) внутри документа (книги или веб-страницы) независимо от поискового запроса. Важность рассчитывается на основе того, где сущность упомянута (контекст, структура), насколько точно она определена, ссылаются ли на этот раздел внешние источники и как часто его просматривают пользователи. Эти оценки важности сущностей затем используются как сигнал для ранжирования самого документа в результатах поиска.
  • US7783644B1
  • 2010-08-24
  • Поведенческие сигналы

  • Индексация

  • Семантика и интент

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)
Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.
  • US9558233B1
  • 2017-01-31
  • Ссылки

  • Поведенческие сигналы

  • Антиспам

seohardcore