
Google использует технологию для обработки визуальных запросов (например, фотографий страниц книги). Система выполняет OCR и применяет сложный алгоритм оценки качества распознавания, учитывающий контекст и языковые модели. Это позволяет выделить наиболее надежные строки текста, которые затем используются для точного поиска и возврата пользователю оригинального канонического документа (цифровой версии).
Патент решает проблему надежного поиска оригинального цифрового документа (Canonical Document), когда в качестве запроса используется изображение текста (Visual Query), например, фотография страницы. Такие изображения часто бывают низкого качества, что приводит к ошибкам оптического распознавания символов (OCR). Использование зашумленного текста затрудняет точное сопоставление с оригиналом. Изобретение предлагает метод фильтрации ошибок OCR для повышения точности идентификации источника.
Запатентована система, которая улучшает точность идентификации источника по визуальному запросу за счет сложного механизма оценки качества результатов OCR. Ключевым элементом является оценка достоверности распознавания каждого символа с учетом его контекста — оценок соседних символов и соответствия языковой модели. Это позволяет выделить «высококачественные текстовые строки» (High Quality Textual Strings), которые затем используются для точного поиска канонического документа.
Система получает визуальный запрос и выполняет OCR. Затем происходит оценка качества. Для каждого символа рассчитывается вероятность его появления с учетом языковой модели (Language-Conditional Character Probability). Далее вычисляется оценка качества символа (Text Quality Score), причем эта оценка зависит от оценок соседних символов (с использованием параметра Transition Cost). Система идентифицирует строки с наивысшей совокупной оценкой качества. Эти надежные строки используются как запрос для поиска в базе данных канонических документов, и найденный источник возвращается пользователю.
Высокая. Технологии визуального поиска, такие как Google Lens, активно развиваются и интегрируются в поисковые продукты. Возможность быстро и точно связать физический объект (книгу, документ) с его цифровой канонической версией является ключевой функцией современных поисковых систем и сервисов типа Google Books.
Влияние на SEO минимальное (2/10). Патент описывает инфраструктурную технологию обработки визуальных запросов и повышения качества OCR, а не алгоритмы ранжирования веб-страниц. Он критически важен для понимания механизмов работы визуального поиска текста, но не предоставляет прямых практических рекомендаций для традиционного SEO продвижения сайтов.
Claim 1 (Независимый пункт): Описывает основной метод обработки визуального запроса для поиска канонического документа.
OCR для извлечения символов в непрерывной области изображения.scoring) каждого символа. Эта оценка основана на оценках качества (как высоких, так и низких) окружающих символов. Оценка частично базируется на Transition Cost, которая определяет, насколько схожей будет оценка символа с оценками соседей (чем выше стоимость, тем больше схожесть).Claim 5 (Зависимый от 1): Детализирует процесс идентификации высококачественных строк.
Claim 6 (Зависимый от 1): Уточняет, что оценка символа может быть бинарной: либо символ высокого качества, либо низкого.
Claim 7 (Зависимый от 1): Уточняет, что процесс оценки символа включает генерацию Language-Conditional Character Probability — метрики, показывающей, насколько хорошо символ и предшествующие ему символы соответствуют языковой модели.
Claim 9 (Зависимый от 1): Описывает логику выбора формата возвращаемого документа в зависимости от рассчитанной оценки качества (Quality Score).
Изобретение применяется в системах визуального поиска (например, Google Lens) и системах поиска по книгам (Google Books).
INDEXING – Индексирование (Подготовка)
Для работы системы необходима база данных Canonical Documents (например, оцифрованные книги, проиндексированные документы). Эта база создается на этапе индексирования.
QUNDERSTANDING – Понимание Запросов (Основное применение)
На этом этапе происходит обработка входящего Visual Query. Система выполняет OCR, проводит сложную контекстную оценку качества распознавания (Scoring) и выделяет High Quality Textual Strings. Это является ключевым процессом интерпретации визуального запроса.
RANKING – Ранжирование (Извлечение)
Выделенные высококачественные строки используются как запрос для поиска точных или близких совпадений в индексе канонических документов и извлечения соответствующего источника.
Входные данные:
Visual Query (изображение, содержащее текст).Выходные данные:
Canonical Document (в формате изображения или машиночитаемого текста).OCR обнаруживает в нем текст, который потенциально может соответствовать каноническому документу в базе данных.Visual Query (изображение с текстом) от клиента.OCR обрабатывает изображение для извлечения символов и генерации первичных данных распознавания.Language-Conditional Character Probability: Для каждого символа оценивается вероятность его появления в данном контексте на основе языковой модели.Text Quality Score: Вычисляется оценка качества для каждого символа. Эта оценка зависит не только от вероятности (пункт а), но и от оценок качества соседних символов. Используется механизм сглаживания (с учетом Transition Cost), чтобы оценки соседних символов были схожими. Оценка может быть бинарной.High Quality Textual Strings — последовательности символов, имеющие высокую совокупную оценку качества. (В одном из вариантов реализации: сначала оцениваются слова, затем строки, состоящие из высококачественных слов).Canonical Documents.Visual Query), содержащее текст, который необходимо распознать и сопоставить.Text Quality Score (Оценка качества текста): Метрика для символа, слова или строки. Может быть числовой или бинарной (Claim 6). Рассчитывается на основе вероятностей и контекста.Language-Conditional Character Probability: Вероятностная метрика, показывающая соответствие последовательности символов языковой модели (например, на основе N-грамм символов).Transition Cost: Параметр алгоритма скоринга, используемый для сглаживания оценок качества между соседними символами. Определяет степень влияния оценок соседних символов.High Quality и для выбора формата вывода (текст vs изображение, Claim 9).OCR. Система использует языковую модель и оценки соседних символов (сглаживание через Transition Cost), чтобы выделить наиболее надежные (High Quality) строки даже в очень шумном или искаженном изображении.Canonical Document).Quality Score) в правильности распознавания (Claim 9).Патент носит преимущественно инфраструктурный характер и описывает внутренние процессы обработки визуальных запросов. Он не дает прямых практических выводов для стандартного SEO продвижения сайтов.
Canonical Document) доступна для индексации Google (например, через Google Books или в виде индексируемого PDF/HTML на вашем сайте). Это позволит системе связать визуальный запрос пользователя с вашим контентом.Text Quality Scores при обработке OCR.Патент подтверждает стратегическую важность визуального поиска как альтернативного способа доступа к информации. Google инвестирует в технологии, позволяющие преодолеть разрыв между физическим миром (печатный текст) и цифровым индексом. Для владельцев контента это подчеркивает необходимость присутствия в цифровом пространстве в качестве индексируемого канонического источника для обеспечения максимальной доступности информации.
Сценарий: Продвижение книги или каталога
Canonical Document.OCR, идентифицирует High Quality Textual Strings, находит каноническую PDF-версию в индексе Google. Пользователю предоставляется ссылка на скачивание или просмотр оригинального цифрового каталога.Влияет ли этот патент на ранжирование моего сайта в основном веб-поиске?
Нет, напрямую не влияет. Патент описывает технологию визуального поиска — как Google обрабатывает изображения, содержащие текст, чтобы найти оригинальный цифровой документ. Он не затрагивает алгоритмы ранжирования сайтов по текстовым запросам в стандартной выдаче.
Что такое "Канонический документ" (Canonical Document) в контексте этого патента? Это то же самое, что и страница с rel=canonical?
Нет. В данном патенте Canonical Document означает эталонную цифровую версию контента, который был сфотографирован пользователем. Например, если пользователь фотографирует страницу из «Войны и мира», каноническим документом будет цифровая версия этой книги в базе данных Google (например, в Google Books). Это не связано с SEO-тегом rel=canonical, который используется для устранения дубликатов веб-страниц.
Как Google определяет качество распознанного текста (OCR), если фотография размыта?
Система использует сложный механизм оценки. Она не просто полагается на уверенность OCR-движка для каждого символа в отдельности. Она учитывает контекст: насколько вероятно появление этого символа с точки зрения языковой модели (Language-Conditional Probability) и каково качество соседних символов (используя Transition Cost). Это позволяет выделить надежные участки текста даже при плохом качестве изображения.
Что такое "Language-Conditional Character Probability"?
Это показатель того, насколько вероятно появление определенного символа в данном контексте (после определенных предыдущих символов) с точки зрения статистики языка. Например, после букв "АЛГОРИ" вероятность появления буквы "Т" очень высока, а буквы "Ъ" — крайне мала. Эта вероятность используется для расчета итоговой оценки качества распознавания.
Что такое "Transition Cost", упоминаемая в Claim 1?
Это технический параметр алгоритма оценки качества, который отвечает за "сглаживание" результатов. Он определяет, насколько оценка одного символа должна быть похожа на оценки его соседей. Это помогает избежать ситуаций, когда один символ ошибочно признан качественным среди некачественных соседей, и наоборот, повышая общую надежность выделения текстовых строк.
Зачем Google иногда возвращает изображение канонического документа вместо текста?
В патенте (Claim 9) указано, что если общая оценка качества (Quality Score) распознавания ниже определенного порога, система предпочтет вернуть изображение оригинального документа, чтобы избежать предоставления пользователю текста с ошибками. Если уверенность высока, возвращается машиночитаемый текст.
Как этот патент связан с Google Lens?
Этот патент описывает базовую технологию, которая, вероятно, лежит в основе функции распознавания, копирования и поиска текста в Google Lens. Когда вы наводите камеру на текст и нажимаете "Поиск", Google Lens использует подобный механизм для выделения надежных строк и поиска их в интернете или Google Books.
Могу ли я оптимизировать свой контент под этот алгоритм?
Единственная релевантная оптимизация — это обеспечение доступности вашего контента в виде индексируемого цифрового Canonical Document. Если у вас есть печатные материалы, убедитесь, что их цифровые копии (HTML или PDF с текстовым слоем) доступны для Google. Это позволит пользователям находить ваш контент через визуальный поиск.
Влияет ли качество печати или шрифта на работу этого алгоритма?
Да, безусловно. Хотя алгоритм и пытается компенсировать плохое качество изображения и распознавания с помощью контекста и языковых моделей, чем четче исходный текст и лучше условия съемки, тем выше будет Text Quality Score распознанных строк и тем быстрее система найдет канонический документ.
Может ли этот алгоритм распознать текст на фоне сложного изображения или рекламы?
Да, система предназначена для работы с любыми визуальными запросами, содержащими текст. Она анализирует непрерывные области текста. Если текст на рекламе распознан с высоким качеством (благодаря контексту и языковой модели), он будет использован для поиска канонического источника, если таковой существует в базе Google.

Мультимедиа
Индексация
EEAT и качество

Мультимедиа
EEAT и качество

Мультиязычность
Local SEO
EEAT и качество

Мультимедиа
Индексация
Семантика и интент

Индексация

Ссылки
Краулинг
Техническое SEO

Индексация
Ссылки
SERP

Поведенческие сигналы
Мультимедиа
SERP

Персонализация
EEAT и качество
Поведенческие сигналы

Ссылки
Антиспам
SERP

Семантика и интент
Поведенческие сигналы
SERP

SERP
Персонализация
Поведенческие сигналы

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
Индексация
Техническое SEO
