
Google использует эту технологию для обработки визуальных запросов (например, фотографий текста). Анализируя как распознанный текст (OCR), так и его точную верстку (шрифт, расположение, размеры — структурную информацию), Google идентифицирует оригинальный авторитетный источник (канонический документ). Это позволяет найти точное издание или формат, гарантируя совпадение не только содержания, но и внешнего вида.
Патент решает задачу точной идентификации конкретного авторитетного источника (Canonical Document), когда пользователь предоставляет изображение текста (Visual Query), например, фотографию страницы книги или документа. Сложность заключается в том, что один и тот же текст может существовать в разных документах или изданиях с разной версткой. Изобретение направлено на поиск точного совпадения не только по тексту, но и по его визуальной структуре, даже если качество изображения низкое.
Запатентована система обработки визуальных запросов, которая комбинирует оптическое распознавание символов (OCR) с анализом Structural Information (верстка, шрифты, позиционирование текста). Система оценивает надежность распознанного текста, выделяет высококачественные строки (High Quality Textual Strings) и ищет в базе данных Canonical Document, который совпадает как по тексту, так и по структуре. Это позволяет точно атрибутировать источник контента по изображению.
Система работает следующим образом:
OCR для извлечения текста и одновременно извлекается Structural Information (расположение символов, размеры, шрифты, переносы строк).Text Quality Score), часто с использованием языковых моделей (иногда с учетом местоположения пользователя).High Quality Textual Strings.Canonical Document, который содержит эти строки И чья структура соответствует структуре текста на исходном изображении.Высокая. Описанные механизмы являются фундаментальными для работы сервисов визуального поиска, таких как Google Lens. Способность точно идентифицировать источник текста по изображению и сопоставлять его с оригинальной версткой остается ключевой задачей в Information Retrieval для мультимодальных запросов и атрибуции контента.
Влияние на традиционное SEO (ранжирование в веб-поиске) низкое. Этот патент описывает инфраструктуру и методы для визуального поиска, а не алгоритмы ранжирования веб-страниц. Однако он имеет стратегическое значение для понимания того, как Google индексирует и атрибутирует контент. Патент демонстрирует, что Google индексирует не только текст, но и его структуру (верстку). Для SEO-специалистов это подчеркивает важность статуса сайта как канонического источника для обеспечения видимости в Google Lens и подобных сервисах.
OCR, которая имеет высокую оценку надежности (Text Quality Score).Structural Information.OCR.Claim 1 (Независимый пункт): Описывает основной метод обработки визуального запроса для поиска канонического источника.
Visual Query (изображение) от клиента.OCR для получения: (a) распознанных текстовых символов и (b) Structural Information. Структурная информация определяет позицию символов относительно опорных точек (Reference Point Elements) на изображении.High Quality Textual Strings.Canonical Document. Критерии извлечения: документ должен содержать эти высококачественные строки И его структура должна соответствовать (consistent with) структурной информации из визуального запроса.Ядром изобретения является использование не только текста (OCR), но и его точного расположения и верстки (Structural Information) для идентификации источника. Это позволяет системе различать, например, два разных издания книги с идентичным текстом, но разной версткой.
Claim 11 (Независимый пункт): Описывает вариацию метода с условным форматом результата.
Quality Score для высококачественной строки.image version).machine readable text version).Система адаптирует формат вывода. Если уверенность в точности распознавания и сопоставления высока, предоставляется текст. Если уверенность ниже, предоставляется изображение оригинала.
Изобретение применяется в рамках системы обработки визуальных запросов (например, Google Lens) и затрагивает несколько этапов поиска.
INDEXING – Индексирование и извлечение признаков
На этом этапе система должна обрабатывать и индексировать Canonical Documents (книги, веб-страницы, PDF). Критически важно, что индексируется не только текст этих документов, но и их Structural Information (верстка, расположение текста, шрифты). Это позволяет в дальнейшем выполнять сопоставление структуры.
QUNDERSTANDING – Понимание Запросов
На этом этапе может использоваться географическое местоположение клиента (если доступно) для выбора соответствующей языковой модели, что улучшает точность OCR (например, выбор между британским и американским английским).
RANKING – Ранжирование (Точнее, Retrieval/Matching в визуальном поиске)
Это основной этап применения патента. Это не традиционное ранжирование веб-страниц, а процесс сопоставления (matching) изображения с каноническим источником.
OCR для извлечения текста и структуры.High Quality Textual Strings).Structural Information в качестве сигналов для нахождения точного соответствия.Входные данные:
Выходные данные:
Canonical Document, соответствующая визуальному запросу (в формате изображения или машиночитаемого текста).Structural Information и идентифицировать High Quality Textual Strings, достаточные для сопоставления с базой данных канонических документов.Процесс работы системы (OCR Search System) при получении визуального запроса:
OCR обрабатывает изображение. Извлекаются: Structural Information (позиционирование, размеры, шрифты, верстка относительно опорных точек).Text Evaluation Engine оценивает каждый распознанный символ. Language-Conditional Character Probability (может использоваться языковая модель, выбранная на основе географии).Text Quality Score (на оценку могут влиять соседние символы).High Quality Textual Strings.consistent with) структурной информации визуального запроса.OCR.OCR на уровне символов, слов или строк. Может быть бинарной или числовой.consistent with the structural information).Canonical Documents.Canonical Document), что критически важно для атрибуции контента в визуальном поиске (например, Google Lens).Text Quality Score) и применяет локализованные языковые модели (на основе географического положения пользователя) для повышения точности OCR.Хотя патент в большей степени описывает внутренние механизмы визуального поиска, он дает важные инсайты для SEO-стратегии в контексте индексации, каноникализации и оптимизации под визуальный поиск (VSO).
Canonical Document для вашего контента. Это требует предоставления высококачественного, машиночитаемого текста (HTML, качественные PDF). Это гарантирует, что при визуальном поиске вашего контента (например, через скриншот) система атрибутирует его вам.Structural Information, понятная и последовательная верстка может способствовать более точной идентификации вашего контента как канонического источника.OCR и повысить вероятность генерации High Quality Textual Strings, ведущих к вашему контенту.Canonical Document для сопоставления с визуальными запросами, хотя OCR и может его прочитать.OCR и затруднить анализ Structural Information, снижая вероятность точного сопоставления.Патент подтверждает, что индексация Google выходит за рамки ключевых слов и охватывает представление и структуру контента. Это критически важно для эры мультимодального и визуального поиска (Google Lens). Стратегически, SEO должно учитывать не только ЧТО сказано, но и КАК это представлено. Атрибуция контента становится все более точной, и Google может идентифицировать первоисточник, даже если контент был скопирован в виде изображения.
Сценарий: Атрибуция контента при визуальном поиске скриншота
OCR и извлекает Structural Information (шрифты, переносы строк, отступы) из скриншота.Canonical Document. Допустим, ваш контент также скопирован на Сайт Б, но с немного другой версткой.Structural Information, она идентифицирует Сайт А как точный источник, так как его верстка соответствует скриншоту. Пользователю будет возвращена ссылка на Сайт А.Что такое «Структурная информация» (Structural Information) в контексте этого патента и почему это важно?
Structural Information — это данные о визуальной верстке и представлении текста: размеры шрифтов, точное расположение символов и слов друг относительно друга и относительно краев страницы или полей. Это важно, потому что позволяет Google не просто найти документ с похожим текстом, а идентифицировать точный первоисточник. Например, это позволяет отличить разные издания книги или разные сайты с одинаковым текстом, но разным оформлением.
Что в контексте этого патента означает "Канонический документ" (Canonical Document)?
Это оригинальный и авторитетный источник контента. Система Google стремится найти именно этот первоисточник (например, официальную страницу статьи или скан книги от издателя), а не его копию. Важно, что каноничность здесь относится не только к тексту, но и к его оригинальной структуре и верстке.
Влияет ли этот патент на ранжирование моего сайта в обычном веб-поиске?
Прямого влияния на ранжирование в традиционном веб-поиске этот патент не оказывает. Он описывает механизм обработки визуальных запросов (поиск по картинке) и идентификации источника текста на изображении. Он не описывает сигналы, используемые для ранжирования веб-страниц в органической выдаче.
Как SEO-специалист может использовать знание об этом патенте?
Знание этого патента полезно для оптимизации под визуальный поиск (VSO) и обеспечения корректной атрибуции контента. Необходимо использовать чистую верстку и читаемые шрифты, а также убедиться, что ваш сайт индексируется как канонический источник. Это гарантирует, что при поиске через Google Lens пользователи будут направлены на ваш ресурс.
Как система определяет качество распознанного текста (Text Quality Score)?
Система оценивает каждый символ, используя Language-Conditional Character Probability. Эта метрика проверяет, насколько хорошо последовательность символов соответствует статистическим моделям языка (языковой модели). Если последовательность выглядит как естественный язык, оценка качества повышается. Также учитываются оценки соседних символов.
Влияет ли географическое положение пользователя на работу этого алгоритма?
Да, это предусмотрено патентом. Географическое положение может использоваться для выбора более точной языковой модели. Например, если пользователь находится в Великобритании, система применит модель британского английского, что повысит точность распознавания текста и последующую оценку его качества.
В каком формате Google вернет результат, если найдет источник?
Патент описывает возможность возврата результата как в виде машиночитаемого текста, так и в виде изображения из канонического источника. В одном из вариантов (Claim 11) выбор формата зависит от уверенности системы (Quality Score): высокая уверенность — текст, низкая уверенность — изображение.
Что означает «комбинация визуального запроса и канонического документа»?
Это функция улучшения пользовательского опыта (UX), описанная в патенте. Если пользователь отправил размытую фотографию текста, система может взять чистый текст или изображение из найденного канонического источника и наложить его поверх исходной фотографии пользователя, совместив ориентацию. Это создает эффект «очистки» изображения.
Как этот патент связан с Google Lens?
Этот патент описывает базовую технологию, которая используется в Google Lens для функций, связанных с текстом. Когда пользователь использует Lens для копирования текста с изображения или поиска информации по фотографии документа, применяются механизмы OCR, анализа структуры и поиска канонического источника, описанные здесь.
Нужно ли мне оптимизировать шрифты и верстку специально под этот алгоритм?
Специально под этот алгоритм оптимизировать не нужно, но следует придерживаться лучших практик веб-дизайна: использовать читаемые шрифты, логичную структуру и контрастную верстку. Это улучшает пользовательский опыт и одновременно гарантирует, что системы OCR смогут корректно распознать текст и структуру вашего контента при визуальном запросе.


Мультимедиа
Индексация
EEAT и качество

Мультиязычность
Local SEO
EEAT и качество

Индексация

Мультимедиа
EEAT и качество
Ссылки

Local SEO
Поведенческие сигналы

Персонализация
EEAT и качество
Поведенческие сигналы

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Local SEO

Индексация
SERP
Персонализация

Ссылки
SERP
Поведенческие сигналы

EEAT и качество
Свежесть контента
Семантика и интент

Ссылки
Семантика и интент
SERP

Поведенческие сигналы
Персонализация
SERP
