
Патент описывает технологию, лежащую в основе Google Books и Google Scholar. Он раскрывает, как Google сканирует печатные материалы, делает их доступными для поиска наравне с веб-страницами и управляет авторскими правами через протокол разрешений. Ключевой аспект патента — механизмы модификации оригинальной печатной рекламы путем ее замены на обновленную цифровую рекламу или добавления интерактивных гиперссылок.
Патент решает проблему недоступности огромного массива информации, содержащейся в традиционных печатных медиа (книги, журналы, газеты), для стандартного интернет-поиска. Он направлен на интеграцию этого контента в цифровую среду. Кроме того, патент решает сопутствующие критические задачи: управление доступом к материалам, защищенным авторским правом, и монетизацию оцифрованного контента, в частности, путем обновления или активизации устаревшей печатной рекламы.
Запатентована система и метод для интеграции оцифрованных печатных материалов (Printed Items) в результаты веб-поиска. Система включает сбор данных (сканирование, OCR), хранение их в виде наборов данных (Data Sets) и поиск по ним. Ключевыми компонентами являются Permission Protocol для управления авторскими правами и механизмы модификации рекламы. Конкретные пункты (Claims) данного патента сфокусированы на способности системы заменять оригинальную печатную рекламу на обновленную информацию (Updated Advertisement Information) или добавлять гиперссылки к рекламе, сохраняя при этом оригинальную верстку документа.
Система функционирует следующим образом:
Data Sets.Permission Protocol для контроля доступа к своему контенту (например, разрешая только частичный просмотр).Updated Advertisement Information, либо сделать оригинальную рекламу кликабельной, сохраняя исходную верстку.Высокая. Этот патент описывает фундаментальные механизмы, лежащие в основе Google Books и Google Scholar. Интеграция авторитетного контента из разнородных источников (Universal Search) и управление авторскими правами остаются центральными задачами Google. Механизмы монетизации, описанные в патенте, также активно используются.
Влияние на стандартное веб-SEO умеренное (6/10), но стратегическое значение высоко. Патент не описывает факторы ранжирования веб-сайтов. Однако он критически важен для издателей и авторов, чей контент индексируется в Google Books/Scholar. Он определяет конкурентный ландшафт, где оцифрованные печатные материалы напрямую конкурируют с веб-контентом за видимость в SERP по информационным и исследовательским запросам.
Characterization и ведущий к более полному электронному представлению материала.Важно отметить, что данная версия патента (US9684676B1), выданная в 2017 году, является продолжением более ранних заявок. Её Claims (Формула изобретения) узко сфокусированы на механизмах модификации рекламы внутри оцифрованного контента.
Claim 1 (Независимый пункт): Описывает метод модификации отображения оцифрованного печатного материала путем замены рекламы.
Updated Advertisement Information на основе данных оригинальной рекламы.Updated Advertisement Information (Область 2). Оригинальная реклама при этом не видна.Ядро изобретения — технология цифровой замены статической печатной рекламы на динамическую или обновленную рекламу в момент отображения.
Claim 9 (Независимый пункт): Описывает систему, реализующую замену рекламы с акцентом на сохранение верстки (layout).
layout).Updated Advertisement Information (которой не было в оригинале).Этот пункт защищает метод поддержания внешнего вида оригинала при динамической вставке новых рекламных объявлений.
Claim 25 (Независимый пункт): Описывает систему для создания интерактивной рекламы (добавление ссылок).
modified advertisement).Этот пункт защищает механизм превращения статических объявлений в интерактивные элементы, ведущие на релевантные онлайн-ресурсы.
Изобретение описывает создание и функционирование специализированной поисковой системы (например, Google Books/Scholar) и ее интеграцию с основным поиском.
CRAWLING – Сканирование и Сбор данных
Происходит не веб-краулинг, а сбор данных из печатных источников: физическое сканирование (Scanning/Digitizing) и OCR, или прямая загрузка цифровых копий от издателей.
INDEXING – Индексирование и извлечение признаков
Ключевой этап обработки:
layout), идентификация областей контента и рекламных областей.OCR для индексации.Permission Protocol (авторизовано/заблокировано) для различных частей контента.RANKING – Ранжирование
Поисковый движок ищет релевантные Data Sets в базе оцифрованных материалов параллельно с веб-индексом. В патенте упоминается возможность интегрального ранжирования (веб-страницы и печатные материалы ранжируются вместе).
METASEARCH – Метапоиск и Смешивание
Результаты из веб-индекса и базы печатных материалов объединяются в единую выдачу (Universal Search) или отображаются в специализированных вертикалях.
RERANKING – Переранжирование (и Презентация)
На этапе отображения контента пользователю система реализует логику Claims: происходит проверка Permission Protocol и модификация отображения для вставки Updated Advertisement Information или ссылок вместо/поверх оригинальной рекламы.
Permission Protocol разрешает отображение контента или его части пользователю.Процесс А: Сбор и Индексирование (Офлайн)
OCR для извлечения текста. Анализ верстки (layout analysis). Разделение страницы на блоки контента и блоки рекламы.Updated Advertisement Information или релевантных веб-страниц для ссылок.Data Set, включающего текст, изображения, информацию о верстке и метаданные рекламы/обновлений.Permission Protocol.Процесс Б: Поиск и Отображение (Онлайн)
Characterizations (сниппетов), смешивание и ранжирование результатов.Permission Protocol. Неавторизованные части блокируются.OCR; изображения и фотографии из отсканированных копий.layout) оригинального печатного издания (расположение текста, изображений, рекламных блоков).Updated Advertisement Information.Permission Protocol.Патент не детализирует алгоритмы ранжирования, упоминая лишь ранжирование по релевантности. Основные механизмы касаются обработки и отображения контента:
Permission Protocol.Updated Advertisement Information или ссылок на основе данных оригинальной рекламы.Permission Protocol является критически важным компонентом, позволяющим Google индексировать защищенный контент, предоставляя правообладателям гранулярный контроль над его отображением.Updated Advertisement Information) или превращения её в интерактивную (добавление гиперссылок).layout) оригинала, даже при модификации рекламных блоков. Это важно для сохранения контекста и удобства чтения.Патент имеет ограниченное применение для стандартного SEO веб-сайтов, но критически важен для издателей, авторов и исследователей.
Для издателей и авторов:
Permission Protocol), чтобы определить объем предварительного просмотра. Это позволяет сбалансировать видимость в поиске и защиту контента для стимулирования продаж.Для всех SEO-специалистов:
OCR, плохой индексации и снижению видимости контента.Патент подтверждает долгосрочную стратегию Google по организации всей мировой информации, а не только веб-страниц. Он демонстрирует технические и юридические подходы к интеграции защищенного авторским правом контента. Для SEO-специалистов это подчеркивает необходимость учитывать в анализе конкурентной среды результаты из специализированных индексов (Вертикалей), которые имеют уникальные конвейеры обработки данных и принципы ранжирования.
Сценарий 1: Замена рекламы в оцифрованном журнале (Claim 1 и 9)
advertisement data). Система определяет, что Модель А устарела, и находит актуальную рекламу Модели Z того же бренда (Updated Advertisement Information).layout).Сценарий 2: Добавление интерактивности к рекламе (Claim 25)
modified advertisement, добавляя интерактивную ссылку к изображению.Сценарий 3: Управление доступом (Permission Protocol)
Permission Protocol), издатель устанавливает, что только 20% книги доступно для предварительного просмотра.Является ли этот патент основой для Google Books и Google Scholar?
Да, этот патент и его родительские заявки описывают фундаментальную технологию для этих сервисов. Он включает методы сканирования печатных материалов, их индексации с помощью OCR, отображения в результатах поиска наравне с веб-страницами и управления авторскими правами через Permission Protocol.
Влияет ли этот патент на ранжирование моего обычного веб-сайта?
Напрямую нет. Он не описывает алгоритмы ранжирования веб-страниц. Однако он описывает механизм, который позволяет оцифрованным печатным материалам появляться в выдаче (Universal Search) и конкурировать с вашим сайтом за трафик, особенно по информационным и исследовательским запросам.
Означает ли этот патент, что Google изменяет содержание книг и журналов?
Патент описывает изменение только рекламных блоков, а не основного редакционного контента. Система модифицирует или заменяет рекламу (advertisement data) для повышения ее актуальности или интерактивности, но сохраняет основной контент (content data) и общую верстку (layout) оригинала.
Что такое 'Permission Protocol' и как он работает?
Это механизм для управления авторскими правами. Он позволяет правообладателям (издателям) контролировать, какие части их оцифрованных материалов могут быть показаны пользователям. Издатели могут разрешить полный доступ, ограничить предварительный просмотр определенным процентом страниц или полностью заблокировать отображение контента.
Что такое 'Updated Advertisement Information'?
Это новая, актуальная рекламная информация (например, современный цифровой баннер или контекстная реклама), которую система использует для динамической замены устаревшей печатной рекламы при отображении оцифрованного документа. Это позволяет монетизировать просмотры архивного контента.
В чем разница между заменой рекламы (Claim 1) и модификацией рекламы (Claim 25)?
Замена рекламы (Claim 1) подразумевает полное скрытие оригинального объявления и показ вместо него Updated Advertisement Information. Модификация рекламы (Claim 25) подразумевает добавление интерактивности к существующей рекламе, например, превращение статичного изображения в кликабельную ссылку, ведущую на сайт рекламодателя или страницу заказа.
Как система определяет, где находится контент, а где реклама на отсканированной странице?
Патент подразумевает использование анализа макета (Layout Analysis) на этапе индексации. Система сегментирует изображение на различные области (контент и реклама) и сохраняет информацию об их расположении. Это необходимо для того, чтобы впоследствии можно было модифицировать рекламу, не нарушая отображение основного контента.
Ранжируются ли результаты из печатных изданий отдельно от веб-результатов?
Патент предлагает вариант интегрального ранжирования. Веб-страницы и печатные материалы могут перечисляться вместе и ранжироваться совместно на основе релевантности. На практике Google часто смешивает эти результаты в универсальной выдаче (Metasearch) или в специализированных вертикалях.
Какова практическая польза этого патента для SEO-специалиста?
Основная польза — стратегическое понимание экосистемы поиска Google. Необходимо учитывать результаты из вертикалей Google Books и Scholar как полноценных конкурентов. Также это подчеркивает важность построения авторитета (E-E-A-T) через публикации в авторитетных печатных изданиях, которые затем индексируются Google.
Актуален ли этот патент, учитывая снижение популярности печатных медиа?
Патент остается высокоактуальным. Огромное количество авторитетной, исторической и академической информации хранится в печатном виде. Google продолжает оцифровывать эти материалы, и описанные в патенте механизмы поиска, управления доступом и монетизации активно используются в Google Books и Google Scholar.

Индексация

SERP
Ссылки

Индексация
Ссылки
Семантика и интент

Индексация

Ссылки
SERP
Семантика и интент

Семантика и интент
Мультимедиа
Персонализация

Структура сайта
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Семантика и интент
Персонализация
EEAT и качество

Семантика и интент
Персонализация
Поведенческие сигналы

EEAT и качество
Ссылки

Поведенческие сигналы
Индексация
Техническое SEO

Мультимедиа
EEAT и качество
Семантика и интент

Ссылки
Индексация
Краулинг
