SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента

SYSTEMS AND METHODS FOR SCORING DOCUMENTS (Системы и методы оценки документов)
  • US8799107B1
  • Google LLC
  • 2004-09-30
  • 2014-08-05
  • EEAT и качество
  • SERP
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.

Описание

Какую проблему решает

Патент решает проблему оценки качества документов, которые имеют слабую или отсутствующую естественную ссылочную структуру (poor link structure). Традиционные алгоритмы, основанные на анализе ссылок (например, PageRank), неэффективны для таких типов контента. В качестве примеров приводятся оцифрованные печатные материалы (книги, журналы, газеты, статьи, каталоги), а также аудио- и видеозаписи. Изобретение предлагает метод оценки таких документов с использованием внешних сигналов, не связанных напрямую с веб-средой.

Что запатентовано

Запатентована система оценки документов, использующая external signals (внешние сигналы), также называемые offline signals (офлайн-сигналы), для определения качества и авторитетности контента. Система учитывает данные о коммерческом успехе документа (продажи, тираж, списки бестселлеров), а также репутацию связанных с ним сущностей — автора и издателя. Эти независимые от запроса сигналы используются для формирования External Score, который затем комбинируется со стандартной оценкой релевантности (IR Score) для определения итогового ранжирования.

Как это работает

Система работает путем сбора и анализа данных из внешних источников:

  • Оценка документа: Анализируется коммерческий успех, например, попадание в списки бестселлеров (Best Seller List Information) и данные о тираже/продажах (Circulation Information).
  • Оценка сущностей: Анализируется репутация автора и издателя на основе их общих продаж (Author/Publisher Sales Information).
  • Прокси-сигналы: Система может найти веб-документы, связанные с автором, издателем или самим произведением, и использовать их ссылочную оценку (Link-based Score of Related Documents) как прокси-сигнал авторитетности.
  • Поведенческие сигналы: Учитывается взаимодействие пользователей с документом в поиске (выбор из результатов, время доступа).
  • Формирование External Score: Эти сигналы агрегируются для формирования оценки External Score.
  • Комбинирование оценок: External Score (независимый от запроса) комбинируется с IR Score (зависимый от запроса) для получения итоговой оценки ранжирования (Total Score).
  • Учет локации: Вес внешних сигналов может корректироваться в зависимости от местоположения пользователя.

Актуальность для SEO

Высокая. Хотя патент подан в 2004 году (вероятно, в контексте проекта Google Books/Print), описанные в нем принципы являются фундаментальными для современных концепций E-E-A-T и оценки авторитетности сущностей (Entities). Использование внешних, проверяемых сигналов реального мира для оценки качества контента, а также перенос авторитета от связанных сущностей и их официальных сайтов, остаются ключевыми элементами поисковых алгоритмов Google в 2025 году.

Важность для SEO

Патент имеет высокое стратегическое значение (8/10). Он напрямую описывает механизмы, которые лежат в основе оценки авторитетности авторов и издателей. Ключевой инсайт для SEO: ссылочный авторитет официального сайта автора или организации (издателя) может напрямую влиять на ранжирование всего контента, связанного с этой сущностью. Это подчеркивает важность построения сильного бренда и авторитетности как в офлайне (награды, продажи, репутация), так и в онлайне (ссылочный профиль официального сайта).

Детальный разбор

Термины и определения

Author Sales Information (Информация о продажах автора)
Данные об общем количестве документов, проданных автором. Используется как сигнал авторитетности автора.
Best Seller List Information (Информация о списках бестселлеров)
Данные о присутствии и позиции документа (например, книги) в авторитетных списках бестселлеров (например, New York Times). Используется как прямой сигнал качества и популярности документа.
Circulation Information (Информация о тираже/обращении)
Данные о количестве проданных копий конкретного документа.
Document (Документ)
Любой машиночитаемый продукт. Включает веб-страницы, электронные письма, файлы, а также оцифрованные печатные материалы (книги, журналы, статьи) и другие медиа (аудио, видео).
External Score (Внешняя оценка)
Оценка документа, сгенерированная на основе External Signals. Является независимой от поискового запроса оценкой качества/авторитетности.
External Signals (Внешние сигналы)
Сигналы, используемые для оценки документа, которые не связаны с поисковым запросом. Включают офлайн-данные и данные о связанных сущностях.
IR Score (Information Retrieval Score, Оценка информационного поиска)
Стандартная оценка релевантности документа поисковому запросу, основанная на Online Signals (например, частота термина, его расположение в документе).
Link-based Score of Related Documents (Ссылочная оценка связанных документов)
Оценка авторитетности (например, PageRank) веб-документа (например, сайта автора или издателя), который связан с оцениваемым документом. Используется как прокси-сигнал.
Offline Signals (Офлайн-сигналы)
Подмножество External Signals, относящееся к атрибутам печатной (не онлайновой) версии документа (например, данные о продажах, тираже).
Online Signals (Онлайн-сигналы)
Информация, связанная с онлайн-версией документа (например, текст, метаданные, структура), используемая для расчета IR Score.
Publisher Sales Information (Информация о продажах издателя)
Данные об общем количестве документов, проданных издателем. Используется как сигнал авторитетности издателя.
Total Score (Итоговая оценка)
Финальная оценка ранжирования документа, полученная путем комбинации IR Score и External Score.
User Behavior Information (Информация о поведении пользователей)
Данные о том, как часто документ выбирается из результатов поиска и сколько времени пользователи тратят на его изучение.

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов, описывающих разные аспекты использования внешних сигналов.

Claims 1, 3, 6 (Независимые пункты): Описывают использование данных о продажах и географии для конкретного документа (Claim 1), его издателя (Claim 3) и его автора (Claim 6).

  1. Идентификация сущности (документ/книга, издатель или автор).
  2. Определение количества проданных единиц, связанных с этой сущностью.
  3. Определение размера или конкретных географических регионов, где были осуществлены продажи.
  4. Оценка (Scoring) документа на основе комбинации объема продаж И географического охвата. (Claim 6 уточняет, что оценка увеличивается по мере роста продаж).

Система придает значение не только количеству продаж, но и их географическому распределению (например, национальные продажи ценятся выше локальных).

Claim 10 (Независимый пункт): Описывает механизм генерации оценки на основе одного из внешних сигналов и локации пользователя.

  1. Генерация первой оценки на основе ОДНОГО из следующих сигналов: списки бестселлеров, тираж, продажи издателя, продажи автора, поведение пользователей или ссылочная оценка связанного веб-документа.
  2. Генерация второй оценки на основе информации о местоположении пользователя (user location information), связанной с локациями пользователей, которые получают доступ к документу.
  3. Присвоение документу итоговой оценки на основе первой и второй оценок.

Система может адаптировать оценку авторитетности в зависимости от географического контекста пользователя и географических данных о доступе к документу.

Claim 19 (Независимый пункт - Система): Описывает систему, которая генерирует оценку документа, комбинируя несколько групп сигналов.

Оценка генерируется на основе комбинации:

  • Группа А (Офлайн-авторитет): Списки бестселлеров, И/ИЛИ тираж, И/ИЛИ продажи издателя/автора.
  • Группа Б (Онлайн-сигналы): Поведение пользователей И/ИЛИ ссылочная оценка связанного веб-документа.
  • Группа В (Локализация): Информация, связанная с локациями пользователей, получающих доступ к документу.

Claim 21 (Независимый пункт): Описывает полный процесс обработки запроса, комбинирующий стандартное ранжирование, внешние сигналы и локализацию.

  1. Получение поискового запроса.
  2. Идентификация печатного документа (print document), релевантного запросу.
  3. Определение IR Score (на основе частоты, расположения или характеристик термина в документе).
  4. Определение External Score (на основе любого из внешних сигналов).
  5. Генерация итоговой оценки (Total Score) на основе комбинации IR Score и External Score, А ТАКЖЕ на основе локации, откуда был получен запрос.
  6. Предоставление документа в результатах поиска на позиции, основанной на итоговой оценке.

Где и как применяется

Изобретение затрагивает этапы индексирования для расчета независимых от запроса оценок и этап ранжирования для их применения.

CRAWLING – Сканирование и Сбор данных
На этом этапе происходит сбор данных из внешних источников (например, покупка данных о продажах, парсинг списков бестселлеров) и потенциальная оцифровка печатного контента (OCR).

INDEXING – Индексирование и извлечение признаков
Основной этап для расчета External Score.

  1. Извлечение метаданных: Из оцифрованного документа извлекаются сущности (Автор, Издатель, Название).
  2. Сбор внешних сигналов: Данные из внешних источников (продажи, тиражи, списки бестселлеров) ассоциируются с соответствующими документами и сущностями.
  3. Поиск связанных веб-документов: Система ищет в веб-индексе документы, связанные с автором, издателем или названием произведения.
  4. Извлечение прокси-сигналов: Рассчитывается или извлекается ссылочная оценка (Link-based score, например, PageRank) этих связанных веб-документов.
  5. Расчет External Score: Все собранные внешние сигналы агрегируются в External Score (независимый от запроса) и сохраняются в индексе.

RANKING – Ранжирование
На этом этапе рассчитывается стандартная оценка релевантности.

  1. Система идентифицирует документы, соответствующие запросу.
  2. Рассчитывается IR Score (зависимый от запроса) на основе онлайн-сигналов (текстовая релевантность).

RERANKING – Переранжирование (или финальные стадии RANKING)
На этом этапе происходит комбинирование оценок.

  1. Из индекса извлекается предварительно рассчитанный External Score для кандидатов.
  2. Система определяет местоположение пользователя.
  3. Происходит расчет Total Score путем комбинации IR Score и External Score, потенциально с корректировкой весов на основе локации пользователя.

Входные данные:

  • Оцифрованный контент и его метаданные (Автор, Издатель).
  • Внешние базы данных (Списки бестселлеров, данные о продажах).
  • Веб-индекс (для поиска связанных документов и их ссылочных оценок).
  • Поисковый запрос и локация пользователя.

Выходные данные:

  • External Score (на этапе индексирования).
  • Total Score и отсортированный список результатов (на этапе ранжирования).

На что влияет

  • Конкретные типы контента: В первую очередь влияет на контент, существующий как в офлайне, так и в онлайне, и имеющий слабую ссылочную структуру: оцифрованные книги, научные статьи, журналы, каталоги.
  • Сущности (Entities): Влияет на оценку авторитетности Авторов, Издателей и Организаций.
  • Специфические запросы: Наибольшее влияние на запросы, где интент связан с поиском авторитетной информации, книг, публикаций или информации об авторах/издателях.

Когда применяется

  • Условия применения: Алгоритм применяется при ранжировании документов, для которых доступны External Signals. Он особенно важен, когда стандартные ссылочные сигналы для самого документа отсутствуют или ненадежны.
  • Временные рамки: Расчет External Score происходит на этапе индексирования (офлайн или асинхронно). Применение и комбинирование с IR Score происходит в реальном времени во время обработки запроса.

Пошаговый алгоритм

Процесс А: Расчет External Score (Индексирование)

  1. Идентификация документа: Получение документа (например, оцифрованной книги).
  2. Извлечение сущностей: Идентификация Автора, Издателя и Названия.
  3. Сбор данных о продажах и тираже: Получение Circulation Information для документа, Author Sales Information и Publisher Sales Information. Определение географического охвата продаж.
  4. Сбор данных о репутации: Проверка наличия документа или автора в Best Seller Lists.
  5. Поиск связанных веб-документов: Выполнение поиска по имени автора, издателя или названию документа для идентификации связанных веб-страниц (например, официальных сайтов).
  6. Извлечение ссылочных оценок: Получение Link-based Score (например, PageRank) для найденных связанных веб-документов.
  7. Сбор поведенческих данных: Агрегация User Behavior Information (клики, время доступа) для документа.
  8. Нормализация и взвешивание: Нормализация собранных сигналов.
  9. Генерация External Score: Агрегация нормализованных сигналов в единую оценку External Score.
  10. Сохранение: Сохранение External Score в индексе вместе с документом.

Процесс Б: Ранжирование (Обработка запроса)

  1. Получение запроса и локации: Получение поискового запроса и определение местоположения пользователя.
  2. Идентификация кандидатов: Поиск документов, релевантных запросу.
  3. Расчет IR Score: Определение IR Score для кандидатов на основе онлайн-сигналов (текстовая релевантность).
  4. Получение External Score: Извлечение предварительно рассчитанного External Score для кандидатов.
  5. Локальная корректировка (Опционально): Корректировка веса External Score на основе локации пользователя и географических данных о продажах/доступе.
  6. Расчет Total Score: Комбинирование IR Score и External Score по формуле.
  7. Ранжирование: Сортировка документов по Total Score и формирование выдачи.

Какие данные и как использует

Данные на входе

Система использует разнообразные данные, преимущественно фокусируясь на внешних и офлайн-сигналах.

  • Репутационные факторы (Внешние):
    • Best Seller List Information: Наличие и позиция в списках бестселлеров.
    • Circulation Information: Количество проданных копий документа.
    • Publisher Sales Information: Общие продажи издателя.
    • Author Sales Information: Общие продажи автора.
  • Географические факторы:
    • Географический охват продаж (национальный, региональный, локальный).
    • Страна продаж.
    • Местоположение пользователя, выполняющего поиск.
    • Локации пользователей, которые ранее получали доступ к документу.
  • Ссылочные факторы (Прокси):
    • Link-based score (например, PageRank) связанных веб-документов (сайтов автора, издателя).
  • Поведенческие факторы:
    • User Behavior Information: Частота выбора документа из результатов поиска.
    • Время, проведенное пользователями при доступе к документу (Dwell Time).
  • Контентные факторы (для IR Score):
    • Частота вхождения поисковых терминов.
    • Расположение терминов в документе (заголовок, контент, футер).
    • Характеристики терминов (шрифт, размер, цвет).

Какие метрики используются и как они считаются

  • External Score: Агрегированная оценка внешних сигналов. Патент предлагает нормализацию и суммирование или усреднение оценок по отдельным сигналам, возможно с разными весами.
  • IR Score: Стандартная оценка информационного поиска, основанная на релевантности контента запросу.
  • Total Score: Итоговая оценка ранжирования. Патент приводит конкретную формулу для линейной комбинации:

TOTAL SCORE(x)=α⋅IR SCORE(x)+β⋅EXTERNAL SCORE(x)\text{TOTAL SCORE}(x) = \alpha \cdot \text{IR SCORE}(x) + \beta \cdot \text{EXTERNAL SCORE}(x)

Где xx — это документ, а α\alpha и β\beta — весовые функции или константы, позволяющие регулировать важность IR Score и External Score относительно друг друга.

  • Географическая оценка: Метрика, оценивающая размер или значимость географического региона продаж. Документы с более широким географическим охватом (например, национальным) оцениваются выше, чем документы с локальным охватом.

Выводы

  1. Авторитетность через офлайн-сигналы (E-E-A-T): Патент демонстрирует, как Google использует реальные, проверяемые офлайн-сигналы для оценки качества и авторитетности контента, особенно когда традиционные веб-сигналы (ссылки) недоступны. Это раннее воплощение принципов E-E-A-T.
  2. Важность оценки сущностей: Система явно оценивает авторитетность связанных сущностей (Авторов и Издателей) на основе их коммерческого успеха и репутации (общие продажи, награды). Авторитет сущности переносится на связанный с ней контент.
  3. Перенос ссылочного авторитета (Proxy PageRank): Критически важный механизм: система идентифицирует официальные веб-сайты автора или издателя и использует их ссылочную оценку (Link-based score) для влияния на ранжирование документов, созданных этой сущностью.
  4. Комбинирование сигналов: Ранжирование зависит от комбинации релевантности (IR Score) и авторитетности (External Score). Авторитетность может компенсировать недостаток прямой текстовой релевантности или отсутствие ссылок на сам документ.
  5. Локализация авторитетности: Авторитетность не универсальна. Система учитывает географический охват продаж и может корректировать вес сигналов авторитетности в зависимости от местоположения пользователя.

Практика

Best practices (это мы делаем)

  • Развитие авторитетности сущностей (E-E-A-T): Активно работайте над повышением реальной авторитетности авторов и организации (издателя). Публикации в авторитетных изданиях, получение наград, высокие продажи (если применимо) и попадание в профессиональные рейтинги являются важными External Signals, которые Google может учитывать.
  • Усиление официальных сайтов: Инвестируйте в развитие и продвижение официальных сайтов организации и ключевых авторов. Согласно патенту, ссылочный авторитет (PageRank) этих сайтов может использоваться как прокси-сигнал для повышения ранжирования всего контента, связанного с этими сущностями.
  • Четкая атрибуция контента: Убедитесь, что весь контент четко атрибутирован автору и организации (издателю). Это необходимо для того, чтобы система могла корректно связать контент с сущностями и применить соответствующие External Scores.
  • Оптимизация под поведенческие факторы: Создавайте привлекательные сниппеты и качественный контент, который удерживает пользователя. Патент явно упоминает частоту выбора документа из поиска и время доступа (Dwell Time) как компоненты External Score.
  • Локальная авторитетность: Для локального бизнеса или контента с региональной привязкой фокусируйтесь на завоевании авторитетности в целевом регионе. Система может повышать вес сигналов, если они совпадают с локацией пользователя.

Worst practices (это делать не надо)

  • Игнорирование авторитетности автора/бренда: Создание контента без работы над репутацией его создателей. Если автор и издатель не имеют внешних сигналов авторитетности, их контент будет проигрывать материалам от признанных экспертов.
  • Накрутка поведенческих факторов: Манипуляции с кликами или временем на сайте. Хотя эти факторы упоминаются, система использует их в комбинации с трудно поддающимися манипуляции офлайн-сигналами (например, реальными продажами или списками бестселлеров).
  • Разделение бренда и контента: Запуск контент-проектов отдельно от основного, авторитетного сайта бренда. Это мешает переносу ссылочного авторитета с основного сайта на контент, как описано в механизме Link-based Score of Related Documents.

Стратегическое значение

Этот патент подтверждает стратегическую важность построения авторитетности на уровне сущностей (Entity-Based SEO). Он показывает, что Google стремится находить и использовать любые доступные сигналы для оценки качества, выходя за рамки традиционного анализа ссылок и контента. Долгосрочная SEO-стратегия должна включать построение реального авторитета в индустрии (E-E-A-T) и обеспечение того, чтобы этот авторитет был виден для поисковых систем через сильные официальные веб-ресурсы и четкую связь между сущностями и их контентом.

Практические примеры

Сценарий: Продвижение научной статьи или книги эксперта

  1. Задача: Повысить видимость новой научной публикации эксперта в поиске.
  2. Действия (Офлайн): Эксперт публикуется в авторитетном журнале (Publisher Authority). Публикация получает цитирования и, возможно, отраслевые награды (аналог Best Seller List в академической среде).
  3. Действия (Онлайн - Сайт эксперта): Создается и оптимизируется официальный сайт эксперта. Наращивается качественный ссылочный профиль этого сайта (получение Link-based Score). На сайте размещается информация о публикации.
  4. Действия (Онлайн - Сайт издателя): Публикация размещается на сайте издателя с четкой атрибуцией автора.
  5. Как работает механизм: Google индексирует публикацию. Он определяет автора и издателя. Система оценивает офлайн-сигналы (авторитет журнала, награды). Затем система находит официальный сайт эксперта и использует его PageRank как прокси-сигнал.
  6. Результат: Публикация получает высокий External Score за счет комбинации репутации издателя, автора и ссылочного авторитета сайта автора, что значительно повышает ее позиции в выдаче, даже если на саму страницу публикации мало прямых ссылок.

Вопросы и ответы

Что такое «External Signals» и «Offline Signals» в контексте этого патента?

External Signals — это любые сигналы качества, не зависящие от поискового запроса. Offline Signals — это подмножество внешних сигналов, которые происходят из реального мира, вне интернета. К ним относятся данные о продажах книг, тиражи журналов, попадание в списки бестселлеров (например, New York Times), а также общая репутация и коммерческий успех автора или издателя.

Как этот патент связан с E-E-A-T?

Этот патент является одним из ранних описаний принципов E-E-A-T (Опыт, Экспертиза, Авторитетность, Надежность). Он описывает конкретные методы измерения Авторитетности (Authoritativeness) и Экспертизы (Expertise) путем анализа проверяемых внешних сигналов, таких как коммерческий успех, награды и репутация авторов и издателей в реальном мире.

Что такое «Link-based Score of Related Documents» и почему это важно для SEO?

Это механизм переноса авторитета. Если на сам документ (например, PDF статьи или страницу книги) нет прямых ссылок, система находит связанный веб-документ (например, официальный сайт автора или издателя) и использует его ссылочную оценку (PageRank) как прокси-сигнал для ранжирования исходного документа. Это означает, что прокачка ссылочного профиля вашего официального сайта напрямую помогает ранжироваться всему контенту, который с вами связан.

Влияет ли местоположение пользователя на работу этого алгоритма?

Да, патент явно подчеркивает важность географии. Система учитывает, где были осуществлены продажи (национальный уровень ценится выше локального) и может корректировать вес этих сигналов в зависимости от местоположения пользователя. Например, для пользователя из США данные о продажах в США могут иметь больший вес, чем международные данные.

Как комбинируются офлайн-сигналы и стандартная релевантность?

Система рассчитывает две оценки: External Score (на основе офлайн-сигналов, независимая от запроса) и IR Score (стандартная текстовая релевантность, зависимая от запроса). Итоговая оценка Total Score является их взвешенной линейной комбинацией (α*IR + β*External). Это позволяет регулировать баланс между релевантностью и авторитетностью.

Применяется ли этот патент только к книгам и Google Books?

Хотя примеры в патенте в основном касаются книг, журналов и газет (вероятно, из-за контекста Google Books в то время), определение «документ» в патенте очень широкое и включает любые машиночитаемые материалы, в том числе аудио и видео. Принципы использования внешних сигналов авторитетности применимы к любому контенту, где можно оценить репутацию создателя.

Как Google получает данные о продажах книг или тиражах журналов?

Патент не детализирует источники получения данных, но упоминает, что эта информация может быть доступна от издателей или «других источников». На практике это может включать покупку данных у агрегаторов (например, Nielsen BookScan), парсинг публичных источников (списки бестселлеров) или получение данных напрямую от партнеров (издателей).

Учитывает ли система поведенческие факторы?

Да, патент явно включает User Behavior Information как один из внешних сигналов. Учитывается, как часто документ выбирают из результатов поиска и сколько времени пользователи тратят на его изучение (Dwell Time). Это подтверждает важность оптимизации сниппетов и качества контента.

Что важнее: авторитет автора или авторитет издателя?

Патент рассматривает оба фактора как отдельные сигналы: Author Sales Information и Publisher Sales Information. Оба вносят вклад в External Score. В зависимости от ниши и конкретной реализации веса могут различаться, но для максимального эффекта необходимо работать над обоими направлениями.

Как я могу использовать этот патент для улучшения SEO моего сайта?

Сосредоточьтесь на построении реальной авторитетности вашего бренда и авторов. Убедитесь, что у вас есть сильный официальный сайт с хорошим ссылочным профилем, так как его авторитет может переноситься на ваш контент. Четко указывайте авторство контента, чтобы связать его с авторитетными сущностями. Демонстрируйте любые внешние признаки успеха — награды, публикации в СМИ, высокие рейтинги.

Похожие патенты

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
  • US7603350B1
  • 2009-10-13
  • EEAT и качество

  • Knowledge Graph

  • SERP

Как Google использует популярность сущностей в Веб-поиске для ранжирования результатов в Вертикальном поиске (Музыка, Книги, Товары)
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы определить авторитетность и популярность сущностей (песен, книг, товаров) и скорректировать их позиции в вертикальной выдаче.
  • US9779140B2
  • 2017-10-03
  • Поведенческие сигналы

  • SERP

Как Google использует контекст и анализ офлайн-поведения (Read Ranking) для соединения физических документов с цифровыми копиями
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
  • US20110295842A1
  • 2011-12-01
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google ранжирует сущности (книги, фильмы, людей), анализируя тематичность и авторитетность их упоминаний в вебе
Google использует механизм для оценки значимости конкретных сущностей (например, изданий книг или фильмов). Система анализирует, как эти сущности упоминаются на релевантных веб-страницах, учитывая уверенность распознавания (Confidence) и то, насколько страница посвящена именно этой сущности (Topicality). Эти сигналы агрегируются с учетом авторитетности и релевантности страниц для расчета итоговой оценки сущности, которая затем корректирует ее ранжирование в поиске.
  • US20150161127A1
  • 2015-06-11
  • Семантика и интент

  • EEAT и качество

  • SERP

Популярные патенты

Как Google использует LLM для генерации поисковых сводок (SGE), основываясь на контенте веб-сайтов, и итеративно уточняет ответы
Google использует Большие Языковые Модели (LLM) для создания сводок (AI-ответов) в результатах поиска. Для повышения точности и актуальности система подает в LLM не только запрос, но и контент из топовых результатов поиска (SRDs). Патент описывает, как система выбирает источники, генерирует сводку, проверяет факты, добавляет ссылки на источники (linkifying) и аннотации уверенности. Кроме того, система может динамически переписывать сводку, если пользователь взаимодействует с одним из источников.
  • US11769017B1
  • 2023-09-26
  • EEAT и качество

  • Ссылки

  • SERP

Как Google игнорирует часто меняющийся контент и ссылки в нем, определяя "временные" блоки шаблона сайта
Google использует механизм для отделения основного контента от динамического шума (реклама, виджеты, дата). Система сравнивает разные версии одной страницы, чтобы найти часто меняющийся контент. Затем она анализирует HTML-структуру (путь) этого контента и статистически определяет, является ли этот структурный блок "временным" для всего сайта. Такой контент игнорируется при индексации и таргетинге рекламы, а ссылки в нем могут не учитываться при расчете PageRank.
  • US8121991B1
  • 2012-02-21
  • Индексация

  • Техническое SEO

  • Структура сайта

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует данные веб-поиска и клики пользователей для классификации бизнесов и построения иерархии категорий
Google анализирует логи веб-поиска (введенные ключевые слова и последующие клики по результатам), чтобы понять, как пользователи интуитивно классифицируют бизнесы. Эти данные используются для автоматического построения динамической иерархической структуры категорий. Эта структура затем применяется для улучшения точности поиска, в частности, для оптимизации моделей распознавания речи в голосовых системах.
  • US7840407B2
  • 2010-11-23
  • Поведенческие сигналы

  • Семантика и интент

  • Структура сайта

Как Google использует всплески поискового интереса и анализ новостей для обновления Графа Знаний в реальном времени
Google отслеживает аномальный рост запросов о сущностях (людях, компаниях) как индикатор реального события. Система анализирует свежие документы, опубликованные в этот период, извлекая факты в формате Субъект-Глагол-Объект (SVO). Эти факты используются для оперативного обновления Графа Знаний или добавления блока «Недавно» в поисковую выдачу.
  • US9235653B2
  • 2016-01-12
  • Knowledge Graph

  • Свежесть контента

  • Семантика и интент

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google динамически фильтрует и изменяет подсказки Autocomplete в реальном времени при вводе навигационного запроса
Google использует систему для оптимизации функции автозаполнения (Autocomplete). При вводе частичного запроса система определяет широкий набор потенциальных навигационных ссылок (Superset) и фильтрует его до узкого подмножества (Subset) на основе сигналов, таких как история поиска, популярность и тип документа. Интерфейс может динамически изменять отображаемые подсказки, если пользователь делает паузу при вводе.
  • US9454621B2
  • 2016-09-27
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

seohardcore