
Патент описывает технологию защиты авторских прав при просмотре контента. Чтобы пользователь мог оценить релевантность, но не мог скопировать весь текст, Google показывает релевантный фрагмент (Region of Interest) четко, а остальную часть страницы — в искаженном виде (размытие, пикселизация). Это инфраструктурный патент, не влияющий на SEO продвижение обычных сайтов.
Патент решает проблему баланса между необходимостью предоставить пользователю достаточно информации для оценки релевантности найденного контента (особенно платного или защищенного авторским правом) и необходимостью защитить этот контент от несанкционированного копирования. Он позволяет индексировать и искать по защищенному контенту (например, книгам), не предоставляя полный доступ к документу.
Запатентован метод генерации составного изображения (composite image) для предварительного просмотра документа. Суть изобретения в том, чтобы отобразить часть документа, релевантную запросу (Region of Interest или ROI), в четком виде, а остальную часть документа или страницы — в намеренно искаженном виде (distorted representation). Это позволяет пользователю понять контекст, но предотвращает копирование всего документа.
Система работает на этапе отображения результата пользователю. После выбора документа из результатов поиска система определяет Region of Interest (ROI) на основе запроса. Генерируются два изображения: четкое изображение ROI и искаженное изображение всей страницы (например, путем пикселизации или размытия). Затем эти два изображения объединяются. Это может быть реализовано либо путем наложения (overlay) четкого ROI поверх искаженного фона в соответствующем месте, либо с помощью «выноски» (callout), где четкий ROI показан рядом с искаженной страницей с указателем.
Высокая (для специфических сервисов). Технология, описанная в патенте, активно используется в таких продуктах, как Google Books, для предоставления предварительного просмотра защищенного контента. Для общего веб-поиска и стандартных веб-сайтов патент не актуален.
Влияние минимальное (1/10). Патент является чисто техническим и описывает внутренние процессы Google по обработке и отображению изображений для защиты контента (DRM). Он не описывает механизмы ранжирования, индексирования или оценки качества контента в веб-поиске. Он не дает никаких практических рекомендаций для SEO-специалистов, продвигающих стандартные веб-сайты.
Region of Interest.Важное примечание: В патенте присутствует "Certificate of Correction" (Сертификат об исправлении), который удалил слова "менее" (less) и "более" (more) из формулировки Claim 1, которые присутствовали в исходном тексте. Анализ ниже учитывает исправленную версию.
Claim 1 (Независимый пункт): Описывает основной метод генерации защищенного изображения документа.
first image). Это изображение представляет Region of Interest (ROI), который является частью документа, релевантной поисковому запросу.second image). Это изображение является искаженным представлением (distorted representation) документа, включающим как релевантную часть (ROI), так и нерелевантные части.composite image) с использованием первого и второго изображений.Claim 9 и 10 (Зависимые): Уточняют возможность модификации изображений.
Система может модифицировать первое или второе изображение в ответ на поисковый запрос. Конкретные примеры модификации включают подчеркивание (underlining), обводку (outlining) или выделение (highlighting) поискового термина на изображении.
Claim 11 (Зависимый): Описывает один из способов компоновки.
Генерация составного изображения происходит путем наложения (overlaid) первого изображения на второе.
Claim 14 (Зависимый): Описывает альтернативный способ компоновки.
Генерация составного изображения включает первое изображение, второе изображение и выноску (callout), указывающую на первое и второе изображения.
Claim 34 (Независимый пункт): Описывает конкретный способ реализации наложения.
Составное изображение генерируется путем наложения первого изображения (ROI) на второе (искаженное) таким образом, что первое изображение закрывает (obscures) только ту часть второго изображения, которая соответствует области интереса.
Патент описывает внутренние процессы Google без прямых рекомендаций для SEO. Он не относится к основным этапам архитектуры веб-поиска, таким как сканирование или ранжирование. Он относится исключительно к уровню представления данных в специфических вертикалях, где требуется защита контента (например, Google Books).
INDEXING – Индексирование и извлечение признаков
Хотя сам механизм применяется позже, на этапе индексирования система должна подготовить необходимые данные. Для печатных материалов применяется сканирование и оптическое распознавание символов (OCR). Критически важно извлечение и сохранение точных координат (bounding boxes) всех слов на странице. Эти данные необходимы для последующего точного определения и вырезания ROI.
Уровень представления результатов (Presentation Layer)
Механизм применяется после того, как ранжирование завершено и пользователь выбрал для просмотра результат из защищенного корпуса. Вместо того чтобы отдавать пользователю полный текст или полный образ страницы, система генерирует безопасное составное изображение.
Входные данные:
Bounding Box).Выходные данные:
Composite Image), готовое для отображения пользователю.Процесс А: Подготовка данных (Офлайн / Индексирование)
bounding boxes) и размеров всех слов на каждой странице.Процесс Б: Обработка запроса на просмотр (Реальное время)
Предпосылка: Пользователь выбрал документ. Система определила релевантный ROI и страницу.
pixelation, blurring).cropping) изображения по границам ROI, используя координаты Bounding Box.highlighting).Overlay): Четкий ROI помещается поверх искаженного фона в соответствии с его координатами.Callout): Четкий ROI помещается рядом с искаженной страницей, и добавляется указатель.Патент фокусируется на обработке изображений и не использует стандартные SEO-факторы.
bounding box) для слов, которые могут быть получены в процессе оптического распознавания символов (OCR).ROI и опциональной подсветки терминов.Патент не использует метрики для ранжирования или оценки качества. Он использует методы обработки и генерации изображений.
pixelation).change of brightness) или контраста.blurring).image filtering).downsampling).bounding box.Bounding Box).ВАЖНО: Патент является инфраструктурным, описывает механизмы отображения и защиты контента и не дает практических выводов для SEO-продвижения сайтов.
Информация в патенте отсутствует. Патент не предлагает никаких действий для владельцев сайтов или SEO-специалистов по оптимизации контента для веб-поиска.
Информация в патенте отсутствует. Патент не направлен против каких-либо SEO-манипуляций или тактик.
Патент демонстрирует технические и юридические решения Google, позволившие индексировать и предоставлять доступ к огромным массивам информации за пределами общедоступного веба (например, к книгам). Он показывает способность Google глубоко анализировать структуру документов вплоть до координат отдельных слов. Однако для стратегии SEO продвижения стандартных сайтов это значения не имеет.
Практических примеров для SEO нет.
Пример использования технологии (не SEO):
Пользователь ищет цитату в Google Books. Он нажимает на результат и видит страницу книги. Абзац, содержащий искомую цитату (Region of Interest), отображается четким текстом с выделенными ключевыми словами (модификация). Вся остальная часть страницы сильно размыта (Distorted Image), что не позволяет прочитать или скопировать остальной текст, но дает понять, в какой части страницы (контекст) находится цитата.
Влияет ли этот патент на ранжирование моего сайта в Google?
Нет, этот патент не имеет никакого отношения к ранжированию сайтов в веб-поиске. Он описывает исключительно способ отображения контента для его защиты от копирования (DRM), например, при предварительном просмотре книг в Google Books. Он не затрагивает алгоритмы оценки качества или релевантности.
Может ли мой сайт быть «искажен» в результатах поиска согласно этому патенту?
Если ваш сайт находится в общедоступном вебе, этот механизм к нему не применяется. Патент предназначен для контента, требующего защиты от копирования (платный контент, книги). Стандартные веб-страницы отображаются в поиске обычным образом, и их сниппеты на SERP формируются иначе.
Что такое Region of Interest (ROI) в контексте этого патента?
Region of Interest — это та часть документа, которая наиболее релевантна запросу пользователя (например, предложение или абзац). Согласно патенту, именно эта часть показывается пользователю в четком виде, чтобы он мог оценить релевантность находки, в то время как остальной контент искажается.
Какие методы искажения использует Google?
В патенте упоминается несколько возможных методов для того, чтобы сделать контент нечитаемым или непригодным для копирования. К ним относятся пикселизация (pixelation), размытие (blurring), изменение яркости или контраста, а также понижение разрешения (downsampling).
Зачем Google показывает остальную часть страницы в искаженном виде, а не только сниппет?
Искаженное изображение остальной части страницы используется для демонстрации контекста. Это помогает пользователю понять, где именно в документе находится релевантный фрагмент (Region of Interest) — в начале, в конце, в таблице и т.д., что улучшает пользовательский опыт при оценке результата.
В патенте описаны два метода отображения: Overlay и Callout. В чем разница?
При методе Overlay (наложение) четкий фрагмент (ROI) накладывается поверх искаженной страницы точно в том месте, где он расположен. При методе Callout (выноска) четкий фрагмент показывается отдельно (например, сбоку от искаженной страницы) и соединяется с местом его расположения указателем или стрелкой.
Есть ли в этом патенте хоть что-то полезное для SEO-специалиста?
Для специалиста, занимающегося продвижением стандартных веб-сайтов (e-commerce, контент-проекты), практической пользы нет. Патент полезен только для общего понимания того, как работают специфические вертикали Google, такие как Google Books, и как они решают проблемы защиты авторских прав.
Упоминается ли в патенте подсветка ключевых слов?
Да, патент предусматривает возможность модификации изображения Region of Interest. В качестве примеров модификации приводятся выделение (highlighting), подчеркивание (underlining) или обводка (outlining) поисковых терминов, чтобы помочь пользователю быстрее найти их в тексте.
Как система определяет точное местоположение текста на странице?
Система использует данные о структуре документа, в частности, координаты ограничивающих прямоугольников (bounding box) для слов. Эти данные генерируются в процессе индексации, часто с помощью оптического распознавания текста (OCR) или извлекаются из формата электронного документа (например, PDF).
Патент подан в 2004 году. Актуален ли он сейчас?
Да, технология актуальна и по сей день. Механизмы, описанные в патенте, лежат в основе систем предварительного просмотра защищенного контента. Любой, кто пользовался Google Books для просмотра фрагментов книг, видел реализацию этих принципов на практике.

Семантика и интент
Поведенческие сигналы
SERP

SERP
Ссылки

Поведенческие сигналы
Семантика и интент
SERP

SERP
Семантика и интент


Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
EEAT и качество

Ссылки
SERP

Local SEO
Ссылки
SERP

Техническое SEO
SERP
Ссылки

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
SERP

Ссылки
SERP
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
