
Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
Патент решает задачу преодоления разрыва между физическим миром и цифровым контентом. Он описывает инфраструктуру, позволяющую пользователям взаимодействовать с rendered documents (печатными материалами или текстом на экране) и мгновенно находить соответствующий электронный контент или инициировать действия. Ключевая техническая проблема — надежная идентификация документа по короткому, потенциально содержащему ошибки фрагменту, что достигается за счет агрессивного использования контекстных данных.
Запатентована система, которая использует информацию, захваченную с rendered document, в сочетании с обширным контекстом (scan context) для идентификации электронного контента. Система позволяет накладывать цифровые слои (markup или modifications) поверх физического контента и отслеживает взаимодействие пользователей с документами для анализа популярности (Read Ranking). Конкретные Claims в этой публикации фокусируются на использовании контекста в запросе и хранении модификаций отдельно от оригинала.
Система функционирует как экосистема для визуального или физического поиска:
markup (аннотации, рекламу) и предлагает действия. Модификации пользователя хранятся отдельно от контента (как указано в Claims).Высокая. Патент описывает фундаментальные принципы, лежащие в основе современных систем визуального поиска, таких как Google Lens. Использование контекста для уточнения запросов и концепция соединения физического взаимодействия с цифровыми действиями являются центральными элементами современных поисковых технологий.
Патент имеет значительное стратегическое влияние на SEO (8/10). Хотя он не описывает конкретные алгоритмы веб-ранжирования, он закладывает основу для Visual Search и вводит концепцию Read Ranking (раздел 14.2 патента). Это предполагает, что Google может собирать данные о популярности контента в физическом мире и использовать их как сигнал авторитетности, аналогичный ссылочному графу в вебе. Понимание этой инфраструктуры критично для стратегии омниканального SEO.
rendered document. Включает оптическое сканирование, фотографирование (например, Google Lens) или аудиозапись чтения текста.offsets).Life Library), манеру сканирования и сигналы окружающей среды.overlay). Согласно Claims, хранится отдельно от контента.OCR.Патент US20110295842A1 является дивизионной заявкой (Divisional Application). Его Claims сосредоточены на специфических аспектах системы, хотя общее описание (Specification) охватывает гораздо более широкую экосистему физического поиска.
Claims 1, 14, 19 (Независимые пункты): Описывают метод и систему для хранения модификаций электронного документа, доступ к которому инициирован через оптический захват.
rendered document.context information, связанная с захватом (включая идентификацию самого документа).context information.modifications) этого контента (например, аннотации).Ядро изобретения, защищенное этими Claims, заключается в двух аспектах: (1) Обязательное включение контекста в поисковый запрос при физическом поиске, и (2) Архитектурное решение хранить пользовательские модификации как отдельный слой, не изменяя исходный контент.
Зависимые Claims (например, 2, 11, 16, 20): Детализируют процесс динамического объединения (merging) модификаций с контентом при последующем доступе. Также описывается фильтрация (filtering) модификаций (например, по пользователю или теме) перед объединением.
Изобретение описывает полную архитектуру системы для обработки запросов, исходящих из физического мира (Visual/Physical Search).
INDEXING – Индексирование и извлечение признаков
Система предполагает, что индексы могут быть улучшены для поддержки физического поиска (Section 4.1). Это включает:
Read Ranking), основанное на агрегированной статистике сканирования.QUNDERSTANDING – Понимание Запросов
Основной этап применения. Захваченные данные интерпретируются как запрос. Критически важным является этап Query Construction и Context Analysis. Система объединяет распознанный текст с обширным контекстом (Scan Context) для формирования точного запроса, что позволяет использовать очень короткие фрагменты.
RANKING – Ранжирование
Поисковая система обрабатывает обогащенный контекстом запрос. При ранжировании могут учитываться факторы, специфичные для физического поиска:
Read Ranking как сигнала ранжирования (Section 14.2).RERANKING – Переранжирование
Результаты могут переранжироваться на основе недавней истории пользователя. Если текущий скан соответствует документу, который пользователь сканировал недавно, этот документ получит повышение.
Входные данные:
Scan Manner), окружающие звуки/изображения (Environment Signals).Life Library), атрибуты, привычки.Выходные данные:
Markup/Modifications (действия, аннотации, реклама).P-Commerce).Алгоритмы активируются при получении данных от устройства захвата (сканера, камеры телефона/Google Lens, микрофона). Система постоянно использует контекст для интерпретации этих данных.
Процесс обработки захвата (на основе FIG. 1 и описания):
rendered document.OCR, распознавания речи или Autocorrelation. Может быть итеративным с обратной связью от поисковой системы.Scan Context (время, местоположение, манера сканирования, история пользователя, среда).Modifications) или разметки (Markup).Патент описывает чрезвычайно широкий спектр входных данных, используемых для идентификации контента и понимания намерений пользователя.
Контентные факторы:
OCR или распознавание речи).Autocorrelation (смещения токенов).Технические факторы (Scan Manner):
Временные факторы:
Географические факторы (Location):
Пользовательские факторы (User Context):
Life Library) — недавние сканы и долгосрочные привычки.Мультимедиа факторы (Environment Signals):
Патент не приводит формул, но описывает ключевые метрики и концепции для оценки.
data-stream analysis) от всех пользователей системы: кто, что, когда и где читает (Section 14.2). Используется как сигнал авторитетности.Uncertain OCR).Scan Context (время, место, история, среда) для разрешения неоднозначности коротких запросов. Это подтверждает стратегию Google по использованию контекста во всех типах поиска.Read Ranking (анализ того, что люди читают и сканируют в физическом мире) предполагает, что вовлеченность в реальном мире может рассматриваться как сигнал авторитетности для соответствующего цифрового контента.P-Commerce), аннотирования, перевода. Физический документ становится интерфейсом к цифровым сервисам.Life Library для персонализации, маркетинга и улучшения контекстного понимания.Modifications) отдельно от основного контента, что позволяет создавать динамические и персонализированные слои информации.OCR) и идентификацию вашего контента при сканировании.Read Ranking подчеркивает важность создания контента, который настолько ценен, что пользователи захотят его сохранить, поделиться или взаимодействовать с ним физически (распечатать, цитировать). Это косвенно подтверждает ценность глубины и полезности контента для SEO.OCR и невозможности идентификации контента.Патент подтверждает стратегию Google по индексированию и пониманию не только цифрового мира, но и физической реальности. Для SEO это означает важность омниканального подхода. Авторитетность и популярность бренда или контента в реальном мире (Read Ranking) потенциально могут влиять на цифровую видимость. Система подчеркивает, что любой физический объект или текст может стать точкой входа в поисковую экосистему Google.
Сценарий 1: Использование Read Ranking для повышения ранжирования исследования
Read Ranking. Система видит всплеск интереса к физической версии документа.Read Ranking как сигнал авторитетности, повышая цифровую версию исследования в выдаче.Сценарий 2: Оптимизация PDF-каталога для Visual Search
P-Commerce).Что такое «Read Ranking» и почему это важно для SEO?
Read Ranking — это метрика, описанная в патенте (Section 14.2), которая отражает популярность документов на основе анализа того, что пользователи сканируют из физических версий. Это аналог PageRank для офлайн-мира. Для SEO это важно, так как патент указывает, что эти данные могут использоваться для ранжирования результатов поиска. Популярность вашего контента офлайн может стать сигналом для ранжирования онлайн.
Насколько важен контекст (Scan Context) в этом патенте?
Контекст имеет решающее значение. Поскольку захваченные фрагменты часто короткие и могут содержать ошибки OCR, система полагается на Scan Context (время, местоположение, историю пользователя, окружающую среду) для точной идентификации документа. Это позволяет системе понять контекст чтения и соответствующим образом скорректировать результаты поиска.
Как этот патент связан с Google Lens?
Этот патент описывает фундаментальную технологию и инфраструктуру, которые делают возможной работу Google Lens. Он объясняет, как изображение текста преобразуется в поисковый запрос, как используется контекст для его уточнения и как система находит соответствующий цифровой контент. Google Lens — это современная реализация концепций, изложенных в этом патенте.
Как SEO-специалист может оптимизировать контент под эту систему?
Ключевые направления — это оптимизация под Visual Search и обеспечение доступности. Используйте четкую типографику, чтобы облегчить OCR. Убедитесь, что у любого контента, который может быть распечатан (например, PDF), есть индексируемая цифровая каноническая версия с текстовым слоем. Для Local SEO обеспечьте соответствие между физическими материалами и цифровыми данными.
Что такое «Rendered Document»?
Rendered Document — это любой визуализированный документ, который человек может прочитать: печатная страница, текст на экране компьютера, вывеска, этикетка продукта. Для SEO это означает, что Google рассматривает любой физический текст как потенциальную точку входа в поиск.
Патент упоминает хранение модификаций отдельно от контента. Что это значит?
Это архитектурное решение (подчеркнутое в Claims) позволяет Google накладывать дополнительную информацию (аннотации пользователей — Modifications, рекламу, переводы — Markup) поверх исходного контента, не изменяя сам оригинал. Это обеспечивает гибкость в управлении правами доступа и персонализацией.
Что такое «Life Library» и зачем она нужна Google?
Life Library — это архив всего, что пользователь когда-либо сканировал. Для пользователя это удобный архив. Для Google это источник данных о привычках, интересах и поведении пользователя в реальном мире. Эта информация используется для персонализации поиска и уточнения контекста будущих запросов.
Означает ли этот патент, что Google отслеживает все, что я читаю на бумаге?
Система отслеживает только те взаимодействия, которые происходят через активное сканирование контента с помощью совместимого устройства (например, Google Lens). Она не отслеживает чтение пассивно. Однако она собирает данные о том, *что*, *когда* и *где* было отсканировано для формирования Life Library и расчета Read Ranking.
Что такое автокорреляция (Autocorrelation) в этом патенте?
Autocorrelation — это альтернативный метод распознавания текста, который не требует полного OCR. Система анализирует расстояния (смещения) между повторяющимися символами в отсканированном фрагменте. Эта последовательность смещений формирует уникальную сигнатуру, по которой можно найти текст в индексе, что может быть эффективнее традиционного OCR.
Какое значение этот патент имеет для контента в PDF?
Для PDF-контента этот патент критически важен. Чтобы система могла найти PDF по сканированному фрагменту, PDF-файл должен быть проиндексирован Google и содержать текстовый слой, а не только изображения страниц. PDF, состоящие только из сканов, будут недоступны для этой технологии.

Семантика и интент
Персонализация
Мультимедиа

Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Knowledge Graph

Персонализация
Семантика и интент
Мультимедиа

Поведенческие сигналы
Семантика и интент
Мультимедиа

Семантика и интент
Персонализация
Поведенческие сигналы

Техническое SEO
Ссылки

Семантика и интент
Поведенческие сигналы
Персонализация

Поведенческие сигналы
Семантика и интент
EEAT и качество

Персонализация
Поведенческие сигналы
SERP

Структура сайта
SERP
Ссылки

EEAT и качество
SERP
Knowledge Graph

Поведенческие сигналы
Мультиязычность
Персонализация

Структура сайта
Техническое SEO
Индексация
