Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google использует офлайн-сигналы (продажи, тиражи, списки бестселлеров) для ранжирования книг и печатных изданий

    SYSTEMS AND METHODS FOR SCORING DOCUMENTS (Системы и методы оценки документов)
    • US8762225B1
    • Google LLC
    • 2014-06-24
    • 2004-09-30
    2004 EEAT и качество Индексация Патенты Google Поведенческие сигналы

    Google использует внешние «офлайн-сигналы» для ранжирования документов с плохой ссылочной структурой (книги, журналы). К ним относятся: попадание в списки бестселлеров (с учетом локации пользователя), данные о тиражах, общие продажи издателя или автора, а также ссылочный вес связанных веб-сайтов. Эти сигналы комбинируются с традиционной оценкой релевантности.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему оценки и ранжирования документов, которые имеют слабую или отсутствующую ссылочную структуру (poor link structure). Традиционные алгоритмы, основанные на анализе ссылок (например, PageRank), неэффективны для таких типов контента, как отсканированные печатные издания (книги, журналы, газеты, статьи, каталоги), а также аудио- и видеозаписи. Цель — разработать механизм оценки качества и авторитетности этих документов, используя их реальные показатели популярности.

    Что запатентовано

    Запатентована система оценки документов, которая использует External signals (внешние сигналы), также называемые Offline signals (офлайн-сигналы). Эти сигналы не связаны напрямую с поисковым запросом и отражают метрики печатной версии документа. Система генерирует External Score на основе таких данных, как списки бестселлеров, тиражи, данные о продажах автора или издателя, поведение пользователей и ссылочные метрики связанных веб-ресурсов.

    Как это работает

    Система работает путем комбинирования двух типов оценок:

    • IR Score (Information Retrieval Score): Традиционная оценка релевантности документа поисковому запросу (на основе online signals, таких как частота и расположение ключевых слов).
    • External Score: Оценка авторитетности, рассчитанная на основе внешних/офлайн-сигналов.

    Система собирает данные из внешних источников (например, списки бестселлеров New York Times, данные от издателей). Особое внимание уделяется локализации: внешние сигналы (например, продажи в определенном регионе) могут иметь больший вес, если они соответствуют местоположению пользователя. Финальный Total Score рассчитывается как взвешенная сумма IR Score и External Score (например, по формуле α*IR + β*External).

    Актуальность для SEO

    Высокая. Хотя патент является разделом заявки, поданной еще в 2004 году, описанные концепции фундаментальны для работы Google Books и Google Scholar. Использование офлайн-сигналов для оценки авторитетности является ключевым элементом концепции E-E-A-T. Хотя конкретные реализации могли эволюционировать, принцип использования реальных метрик и авторитетности сущностей для оценки контента остается крайне актуальным.

    Важность для SEO

    Влияние на SEO значительное (7/10). Патент имеет критическое значение для вертикалей, связанных с публикациями (книги, медиа, научные статьи). Для общего SEO он предоставляет конкретный фреймворк того, как Google может количественно оценивать авторитетность на основе проверяемых внешних метрик, а не только ссылок. Это подтверждает важность реальной репутации автора и издателя (Entity Authority) для ранжирования их контента.

    Детальный разбор

    Термины и определения

    Author sales information (Информация о продажах автора)
    Внешний сигнал, включающий данные об общем количестве документов, проданных автором. Может учитываться географическое распределение продаж.
    Best seller list information (Информация из списков бестселлеров)
    Внешний сигнал, указывающий, появлялся ли документ в списках бестселлеров (например, New York Times), его позицию и дату.
    Circulation information (Информация о тираже)
    Внешний сигнал, включающий данные о количестве проданных копий конкретного документа. Может учитываться географическое распределение тиража.
    Document (Документ)
    Любой машиночитаемый продукт. В контексте патента часто подразумеваются print documents (печатные издания), такие как книги, журналы, газеты, которые были оцифрованы.
    External Score (Внешняя оценка)
    Оценка документа, основанная на External signals. Отражает авторитетность и популярность; не зависит от поискового запроса.
    External signals / Offline signals (Внешние / Офлайн-сигналы)
    Сигналы, используемые для оценки документа, которые могут происходить из офлайн-мира или относиться к печатной версии документа (например, данные о продажах, тиражах).
    IR Score (Information Retrieval Score)
    Оценка релевантности документа поисковому запросу, основанная на online signals (например, наличие и расположение поисковых терминов).
    Link-based score of related documents (Ссылочная оценка связанных документов)
    Внешний сигнал, использующий ссылочный вес (например, PageRank) связанного веб-документа (например, сайта издателя или автора) для оценки самого документа (например, книги).
    Publisher sales information (Информация о продажах издателя)
    Внешний сигнал, включающий данные об общем количестве документов, проданных издателем.
    Total Score (Общая оценка)
    Финальная оценка ранжирования, являющаяся комбинацией IR Score и External Score.
    User behavior information (Информация о поведении пользователей)
    Внешний сигнал, включающий данные о том, как часто документ выбирается из результатов поиска (selected) и сколько времени пользователи тратят на его просмотр.

    Ключевые утверждения (Анализ Claims)

    Данный патент (US8762225B1) является разделом (Divisional) более ранней заявки (от 2004 года). Из-за этого его Claims (Формула изобретения) узко сфокусированы на конкретном аспекте общей системы — использовании списков бестселлеров с учетом локализации пользователя.

    Claim 1 (Независимый пункт): Описывает метод оценки документа (книги) с использованием локализованных списков бестселлеров.

    1. Система получает поисковый запрос и определяет местоположение (location), откуда он получен.
    2. Идентифицирует первый документ, связанный с запросом.
    3. Определяет первую оценку (IR Score) на основе фактора, связанного с поисковым термином.
    4. Определяет, что документ соответствует книге, которая появилась в списке бестселлеров (best seller list).
    5. Определяет вторую оценку (External Score) на основе того, что книга появилась в списке бестселлеров в этом местоположении.
    6. Эта вторая оценка выше, чем оценка, которую получил бы другой документ, фигурирующий в списке бестселлеров в другом местоположении, не совпадающем с местоположением пользователя.
    7. Генерирует комбинированную оценку (Total Score) на основе первой и второй оценок и предоставляет результат.

    Google патентует использование списков бестселлеров как сигнала ранжирования и подчеркивает важность локализации этого сигнала. Если книга является бестселлером именно в регионе пользователя, она получает более высокий бустинг.

    Claim 4 и Claim 11 (Независимые пункты): Повторяют механизм Claim 1, применяя его к «печатным документам» в целом (Claim 4) и снова к книгам (Claim 11), подтверждая логику географической корректировки оценки.

    Зависимые пункты (например, Claims 6-10, 13-20): Расширяют состав факторов для External Score. Вторая оценка может также основываться на:

    • Circulation Information (Тираж).
    • Publisher Sales Information (Общие продажи издателя).
    • Author Sales Information (Общие продажи автора).
    • User Behavior Information (Количество доступов к документу).
    • Link-based score связанного веб-документа.

    Где и как применяется

    Изобретение затрагивает несколько этапов поиска, интегрируя офлайн-данные в онлайн-ранжирование.

    CRAWLING & INDEXING – Сканирование, Сбор данных и Индексирование
    На этих этапах система собирает External signals из внешних источников (базы данных издательств, списки бестселлеров) и ассоциирует их с соответствующими оцифрованными документами в индексе. Также рассчитываются ссылочные оценки (Link-based score) связанных веб-ресурсов (сайты авторов/издателей). External Score может быть предварительно рассчитан и сохранен.

    RANKING – Ранжирование
    Во время обработки запроса система рассчитывает IR Score на основе релевантности запросу и извлекает предварительно рассчитанный External Score.

    RERANKING – Переранжирование
    На этом этапе External Score корректируется с учетом местоположения пользователя (как подчеркнуто в Claims). Затем IR Score и скорректированный External Score комбинируются для получения Total Score с использованием весовых коэффициентов.

    Входные данные:

    • Поисковый запрос и местоположение пользователя.
    • Корпус документов (включая оцифрованные печатные издания).
    • База данных External signals (списки бестселлеров, тиражи, продажи авторов/издателей).
    • Данные о поведении пользователей и ссылочные оценки связанных сайтов.

    Выходные данные:

    • Отсортированный список результатов поиска с рассчитанными Total Scores.

    На что влияет

    • Конкретные типы контента: В первую очередь влияет на print documents: книги, журналы, газеты, научные статьи, каталоги. Также упоминаются аудио- и видеозаписи. Наиболее релевантно для систем типа Google Books и Google Scholar.
    • Специфические запросы: Влияет на запросы, связанные с опубликованными работами (поиск книги по теме, автору или названию).
    • Географические ограничения: Патент явно указывает на использование местоположения пользователя для корректировки веса внешних сигналов, придавая приоритет локальной популярности.

    Когда применяется

    • Триггеры активации: Алгоритм применяется, когда в результатах поиска присутствуют документы, идентифицированные как имеющие офлайн-аналоги (например, книги), для которых доступны External signals и которые имеют слабую собственную ссылочную структуру.

    Пошаговый алгоритм

    Процесс А: Сбор и индексирование (Офлайн)

    1. Сбор внешних данных: Получение данных из различных источников: списки бестселлеров (глобальные и региональные), данные о тиражах, общие продажи издателей и авторов.
    2. Индексирование документов: Сканирование и OCR печатных изданий.
    3. Ассоциация данных: Сопоставление внешних сигналов с соответствующими документами в индексе.
    4. Расчет ссылочных оценок связанных ресурсов: Идентификация веб-сайтов авторов и издателей, расчет их ссылочных оценок (например, PageRank).
    5. Предварительный расчет External Score: Генерация базового External Score для документов на основе собранных данных.

    Процесс Б: Обработка запроса (В реальном времени)

    1. Получение запроса и локации: Система получает поисковый запрос и определяет местоположение пользователя.
    2. Идентификация документов: Поиск релевантных документов в корпусе.
    3. Расчет IR Score: Определение релевантности каждого документа запросу.
    4. Определение External Score: Извлечение предварительно рассчитанного External Score и его корректировка:
      • Локализация сигналов: Увеличение веса тех внешних сигналов, которые релевантны местоположению пользователя (например, если книга — бестселлер в стране пользователя, этот сигнал получает больший вес).
      • Учет поведения пользователей: Интеграция актуальных данных о кликах и времени просмотра документа.
    5. Расчет Total Score: Комбинирование IR Score и скорректированного External Score. В патенте приводится формула: TOTAL SCORE(x) = α*IR SCORE(x) + β*EXTERNAL SCORE(x).
    6. Формирование выдачи: Сортировка документов на основе Total Score и предоставление результатов пользователю.

    Какие данные и как использует

    Данные на входе

    Патент описывает использование широкого спектра нестандартных для SEO факторов, классифицируемых как External signals.

    • Офлайн-факторы (Репутационные и Популярность):
      • Best seller list information: Попадание в список, позиция, дата, источник списка.
      • Circulation information: Количество проданных копий документа.
      • Publisher sales information: Общее количество документов, проданных издателем (репутация издателя).
      • Author sales information: Общее количество документов, проданных автором (репутация автора).
    • Географические факторы: Местоположение пользователя. Используется для взвешивания всех вышеперечисленных офлайн-факторов (например, локальные продажи или региональные списки бестселлеров).
    • Поведенческие факторы:
      • Количество раз, когда документ был выбран (selected) из результатов поиска.
      • Количество времени, которое пользователи тратят на доступ к документу.
    • Ссылочные факторы (Косвенные):
      • Link-based score (например, PageRank) связанных веб-документов. Система использует ссылочный вес сайта издателя или автора для оценки самой книги.
    • Контентные факторы (для IR Score): Частота терминов, расположение терминов (заголовок, контент), характеристики терминов (шрифт, размер, цвет).

    Какие метрики используются и как они считаются

    • IR Score: Рассчитывается на основе стандартных метрик информационного поиска (например, BM25 или аналоги).
    • External Score: Комбинированная оценка, агрегирующая нормализованные значения внешних сигналов. Система может взвешивать разные сигналы по-разному.
    • Локализованное взвешивание: Метрики, связанные с местоположением пользователя, получают больший вес. Например, данные о продажах в США весят больше для пользователя из США.
    • Total Score: Финальная метрика ранжирования. В патенте приводится формула:

      TOTAL SCORE(x) = α*IR SCORE(x) + β*EXTERNAL SCORE(x)

      Где x — документ, α и β — весовые функции (или константы), используемые для балансировки важности релевантности (IR) и внешней авторитетности (External).

    Выводы

    1. Использование реальных метрик для оценки авторитетности: Google активно использует проверяемые офлайн-сигналы (Offline signals) для ранжирования контента, который не имеет традиционных онлайн-сигналов (ссылок). Это один из механизмов квантификации E-E-A-T.
    2. Трансфер авторитетности сущностей (Entity Authority Transfer): Репутация сущностей (автора и издателя), измеряемая их общими продажами и признанием (бестселлеры), напрямую влияет на ранжирование отдельных документов, созданных этими сущностями.
    3. Трансфер ссылочного веса (Link Equity Transfer): Патент описывает механизм, при котором ссылочный вес (Link-based score) веб-сайта автора или издателя может использоваться для оценки их книг. Авторитетность сайта переносится на связанный с ним контент.
    4. Критичность локализации: Местоположение пользователя играет ключевую роль в интерпретации внешних сигналов. Авторитетность может быть локальной — книга, популярная в регионе пользователя, получит преимущество перед книгой, популярной в другом регионе.
    5. Комбинированное ранжирование: Финальная оценка является комбинацией релевантности запросу (IR Score) и независимой от запроса авторитетности (External Score), с возможностью настройки баланса между ними через веса α и β.

    Практика

    Best practices (это мы делаем)

    Хотя патент в первую очередь относится к Google Books и печатным изданиям, его принципы имеют более широкое применение для SEO и E-E-A-T.

    • Демонстрация реальной авторитетности (E-E-A-T): Акцентируйте внимание на реальных достижениях бизнеса, авторов и экспертов. Если сущность имеет значительную офлайн-репутацию (награды, публикации в авторитетных изданиях, высокие продажи, упоминания в СМИ), убедитесь, что эта информация четко представлена онлайн. Это помогает Google связать онлайн-присутствие с офлайн-сигналами.
    • Построение авторитетных веб-ресурсов для сущностей: Развивайте сильные веб-сайты для авторов, экспертов и организаций. Согласно патенту, ссылочный вес этих сайтов (Link-based score of related documents) может быть перенесен на контент, созданный этими сущностями (книги, статьи).
    • Четкая ассоциация контента с сущностями: Используйте микроразметку (Schema.org для Person, Organization, Book, Article), чтобы обеспечить четкую связь контента с его создателем и издателем. Это позволяет системе корректно применять External Signals к документу.
    • Точность метаданных (для издателей/авторов): Убедитесь, что метаданные публикаций (ISBN, автор, издатель) точны и консистентны. Это критически важно для того, чтобы Google мог корректно ассоциировать External signals (например, данные о продажах) с вашим контентом.
    • Локализация авторитетности: Для локального бизнеса фокусируйтесь на получении признания в своем регионе (местные награды, публикации в местных СМИ). Патент подтверждает, что Google придает больший вес сигналам авторитетности, релевантным местоположению пользователя.

    Worst practices (это делать не надо)

    • Имитация авторитетности без подтверждения: Создание контента от неизвестных авторов или организаций без подтвержденной репутации. Такой контент будет иметь низкий External Score, так как отсутствуют проверяемые офлайн-сигналы.
    • Игнорирование онлайн-репутации авторов: Размещение качественного контента от авторов, чья онлайн-репутация не поддерживается или отсутствует (нет официального сайта, профилей). Важно работать над авторитетностью источника контента.
    • Фокус только на оптимизации текста: Полагаться исключительно на IR Score (оптимизация под ключевые слова). В нишах, где важна экспертиза, External Score (авторитетность) может стать решающим фактором ранжирования.

    Стратегическое значение

    Патент подтверждает долгосрочную стратегию Google по поиску внешних, объективных метрик авторитетности для дополнения или замены сигналов, основанных на ссылках. Он подчеркивает важность распознавания сущностей (Entity Reconciliation) — способности Google связывать офлайн-достижения и метрики с онлайн-присутствием. Это фундаментальный аспект построения E-E-A-T, показывающий, что для Google важна не только онлайн-активность, но и реальный вклад в индустрию или область знаний.

    Практические примеры

    Сценарий: SEO-стратегия для известного автора

    1. Ситуация: Известный автор, чьи книги становились бестселлерами и имеют высокие продажи (сильные Offline signals), запускает новый веб-сайт для продвижения своих услуг и новых публикаций.
    2. Действия SEO-специалиста:
      • Создать детальную страницу «Об авторе», перечислив все ключевые публикации, награды и упоминания о попадании в списки бестселлеров.
      • Использовать микроразметку Schema.org (Person, Book), чтобы четко связать автора с его работами.
      • Активно работать над получением качественных ссылок на новый сайт с авторитетных ресурсов (СМИ, университеты, литературные порталы).
    3. Ожидаемый результат (согласно патенту):
      • Книги автора будут лучше ранжироваться в Google Books за счет высоких External Scores (продажи, бестселлеры).
      • Новый веб-сайт быстрее наберет авторитетность, так как Google свяжет его с сущностью автора, имеющей сильные офлайн-сигналы.
      • Ссылочный вес, полученный сайтом (Link-based score), может улучшить ранжирование книг автора (трансфер авторитетности).

    Вопросы и ответы

    Применяется ли этот патент только к Google Books?

    В первую очередь, да. Патент явно описывает решение проблем ранжирования print documents (книг, журналов, газет). Однако концепция использования External signals для оценки авторитетности применима шире и является частью основы для оценки E-E-A-T в основном поиске для авторов, экспертов и организаций.

    Что такое «Link-based score of related documents» и как это использовать в SEO?

    Это использование ссылочного веса (например, PageRank) связанного веб-сайта для оценки документа, у которого нет своего ссылочного веса. Например, для оценки книги Google может использовать PageRank официального сайта ее автора или издателя. Для SEO это означает, что развитие авторитетного официального сайта для бренда или автора может улучшить ранжирование связанных с ними продуктов или публикаций.

    Насколько важна локализация в этом патенте?

    Локализация критически важна. В Claims (Формуле изобретения) этого патента основной акцент сделан на том, что внешние сигналы (в частности, списки бестселлеров) получают значительно больший вес, если они релевантны местоположению пользователя. Книга-бестселлер в Германии получит преимущество для пользователя из Германии.

    Как этот патент связан с E-E-A-T?

    Этот патент можно рассматривать как один из ранних механизмов квантификации E-E-A-T. Он показывает, как Google использует объективные, проверяемые офлайн-метрики (продажи, признание критиков через бестселлеры) как прокси для оценки опыта, экспертности, авторитетности и надежности автора и издателя.

    Как Google получает данные о продажах книг и тиражах?

    Патент не детализирует источники, но упоминает, что информация может быть получена от издателей, из списков бестселлеров (например, New York Times, USA Today) или «других источников». На практике это могут быть агрегаторы данных книжного рынка (например, Nielsen BookScan) и прямые фиды от издательств.

    Учитывает ли Google поведение пользователей при ранжировании книг?

    Да, патент явно упоминает User behavior information как один из внешних сигналов. Учитывается, как часто документ выбирают из результатов поиска и сколько времени пользователи тратят на его просмотр. Эти данные также могут быть локализованы.

    Что важнее: релевантность тексту запроса (IR Score) или офлайн-авторитетность (External Score)?

    Система использует комбинированный подход. Финальный Total Score — это их взвешенная сумма (α*IR + β*External). Веса α и β позволяют Google настраивать баланс между релевантностью и авторитетностью в зависимости от запроса или типа контента.

    Влияют ли общие продажи издательства на ранжирование отдельной книги?

    Да, патент указывает, что Publisher sales information (общее количество проданных издателем документов) используется как внешний сигнал. Документы, связанные с издателями, имеющими большие объемы продаж, могут ранжироваться выше, чем документы издателей с меньшими продажами.

    Может ли этот механизм использоваться для ранжирования товаров в e-commerce?

    Хотя патент фокусируется на печатных изданиях, логика использования данных о продажах (Circulation information) и популярности (аналог Best seller list) для ранжирования вполне применима и к товарам. Это подтверждает важность популярности продукта и объема его продаж как потенциальных сигналов ранжирования.

    Стоит ли SEO-специалисту фокусироваться на офлайн-PR и построении реального бренда?

    Да. Учитывая, что Google стремится использовать офлайн-сигналы для подтверждения авторитетности (E-E-A-T), работа над реальным признанием в индустрии (публикации в авторитетных СМИ, получение наград, увеличение реальных продаж и популярности) может напрямую влиять на ранжирование сайта или связанного контента.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.