Система идентифицирует цифровой контент по сканированному фрагменту из физического мира, используя не только текст, но и обширный контекст (время, местоположение, историю пользователя). Патент также вводит концепцию «Read Ranking» — отслеживание популярности физических документов на основе того, что люди сканируют, как потенциальный сигнал ранжирования.
Описание
Какую задачу решает
Патент решает задачу преодоления разрыва между физическим миром и цифровым контентом. Он описывает инфраструктуру, позволяющую пользователям взаимодействовать с rendered documents (печатными материалами или текстом на экране) и мгновенно находить соответствующий электронный контент или инициировать действия. Ключевая техническая проблема — надежная идентификация документа по короткому, потенциально содержащему ошибки фрагменту, что достигается за счет агрессивного использования контекстных данных.
Что запатентовано
Запатентована система, которая использует информацию, захваченную с rendered document, в сочетании с обширным контекстом (scan context) для идентификации электронного контента. Система позволяет накладывать цифровые слои (markup или modifications) поверх физического контента и отслеживает взаимодействие пользователей с документами для анализа популярности (Read Ranking). Конкретные Claims в этой публикации фокусируются на использовании контекста в запросе и хранении модификаций отдельно от оригинала.
Как это работает
Система функционирует как экосистема для визуального или физического поиска:
- Захват: Пользователь сканирует (оптически или акустически) фрагмент текста.
- Сбор контекста: Система собирает контекстные сигналы (время, GPS, история пользователя, окружающая среда, манера сканирования).
- Формирование запроса: Поисковый запрос формируется на основе распознанного текста И собранного контекста (как указано в Claims).
- Поиск и Идентификация: Система ищет электронный аналог. Контекст используется для разрешения неоднозначности.
- Действия и Разметка: После идентификации система извлекает связанный markup (аннотации, рекламу) и предлагает действия. Модификации пользователя хранятся отдельно от контента (как указано в Claims).
Актуальность для SEO
Высокая. Патент описывает фундаментальные принципы, лежащие в основе современных систем визуального поиска, таких как Google Lens. Использование контекста для уточнения запросов и концепция соединения физического взаимодействия с цифровыми действиями являются центральными элементами современных поисковых технологий.
Важность для SEO
Патент имеет значительное стратегическое влияние на SEO (8/10). Хотя он не описывает конкретные алгоритмы веб-ранжирования, он закладывает основу для Visual Search и вводит концепцию Read Ranking (раздел 14.2 патента). Это предполагает, что Google может собирать данные о популярности контента в физическом мире и использовать их как сигнал авторитетности, аналогичный ссылочному графу в вебе. Понимание этой инфраструктуры критично для стратегии омниканального SEO.
Детальный разбор
Термины и определения
- Rendered Document (Визуализированный документ)
- Документ, воспринимаемый человеком, будь то в печатной форме или на экране (монитор, дисплей). Физический источник информации.
- Scanning/Capturing (Сканирование/Захват)
- Процесс получения информации из rendered document. Включает оптическое сканирование, фотографирование (например, Google Lens) или аудиозапись чтения текста.
- Signature (Сигнатура)
- Набор данных, извлеченных из захваченного фрагмента, используемый для идентификации документа. Может включать текст или смещения токенов (offsets).
- Context / Scan Context (Контекст сканирования)
- Факторы, внешние по отношению к захваченному тексту, которые помогают идентифицировать документ. Включает время, географическое положение, историю пользователя (Life Library), манеру сканирования и сигналы окружающей среды.
- Markup (Разметка) / Modifications (Модификации)
- Дополнительная функциональность или данные (аннотации, ссылки, реклама), связанные с документом. Рассматривается как «оверлей» (overlay). Согласно Claims, хранится отдельно от контента.
- Read Ranking (Ранжирование по чтению)
- Концепция определения популярности документов и их суб-регионов на основе анализа агрегированных данных о том, что пользователи сканируют и читают в физическом мире. Аналог PageRank для офлайн-контента.
- Life Library (Библиотека жизни)
- Цифровой архив всего, что пользователь захватил или прочитал. Используется для персонализации и анализа поведения.
- Autocorrelation (Автокорреляция)
- Метод генерации сигнатуры путем анализа смещений между повторяющимися токенами в тексте, без необходимости полного OCR.
Ключевые утверждения (Анализ Claims)
Патент US20110295842A1 является дивизионной заявкой (Divisional Application). Его Claims сосредоточены на специфических аспектах системы, хотя общее описание (Specification) охватывает гораздо более широкую экосистему физического поиска.
Claims 1, 14, 19 (Независимые пункты): Описывают метод и систему для хранения модификаций электронного документа, доступ к которому инициирован через оптический захват.
- Система получает запрос на контент, содержащий оптически захваченную информацию из rendered document.
- Идентифицируется context information, связанная с захватом (включая идентификацию самого документа).
- Формулируется поисковый запрос, основанный на захваченной информации И идентифицированном context information.
- Запрошенный контент извлекается из репозитория.
- Система получает модификации (modifications) этого контента (например, аннотации).
- Система сохраняет полученные модификации ОТДЕЛЬНО от запрошенного контента.
Ядро изобретения, защищенное этими Claims, заключается в двух аспектах: (1) Обязательное включение контекста в поисковый запрос при физическом поиске, и (2) Архитектурное решение хранить пользовательские модификации как отдельный слой, не изменяя исходный контент.
Зависимые Claims (например, 2, 11, 16, 20): Детализируют процесс динамического объединения (merging) модификаций с контентом при последующем доступе. Также описывается фильтрация (filtering) модификаций (например, по пользователю или теме) перед объединением.
Где и как применяется
Изобретение описывает полную архитектуру системы для обработки запросов, исходящих из физического мира (Visual/Physical Search).
INDEXING – Индексирование и извлечение признаков
Система предполагает, что индексы могут быть улучшены для поддержки физического поиска (Section 4.1). Это включает:
- Индексирование информации о существовании и формате бумажной версии документа.
- Индексирование популярности бумажных документов (Read Ranking), основанное на агрегированной статистике сканирования.
QUNDERSTANDING – Понимание Запросов
Основной этап применения. Захваченные данные интерпретируются как запрос. Критически важным является этап Query Construction и Context Analysis. Система объединяет распознанный текст с обширным контекстом (Scan Context) для формирования точного запроса, что позволяет использовать очень короткие фрагменты.
RANKING – Ранжирование
Поисковая система обрабатывает обогащенный контекстом запрос. При ранжировании могут учитываться факторы, специфичные для физического поиска:
- Приоритет документам, существующим в бумажной форме.
- Использование контекста для разрешения неоднозначности (например, местоположение пользователя влияет на выбор релевантного издания).
- Использование Read Ranking как сигнала ранжирования (Section 14.2).
RERANKING – Переранжирование
Результаты могут переранжироваться на основе недавней истории пользователя. Если текущий скан соответствует документу, который пользователь сканировал недавно, этот документ получит повышение.
Входные данные:
- Сырые данные захвата (изображение/аудио).
- Данные с сенсоров устройства: время, GPS, скорость/направление сканирования (Scan Manner), окружающие звуки/изображения (Environment Signals).
- Данные о пользователе: ID, история сканирования (Life Library), атрибуты, привычки.
Выходные данные:
- Идентифицированный электронный документ и местоположение в нем.
- Связанная Markup/Modifications (действия, аннотации, реклама).
На что влияет
- Типы контента: Влияет на любой контент, имеющий физическое представление: книги, журналы, газеты, каталоги, визитки, меню, вывески, текст на экранах.
- Специфические запросы: Особенно сильно влияет на локальные запросы (сканирование вывески бизнеса) и коммерческие запросы (сканирование продукта или каталога — P-Commerce).
- Ниши: E-commerce, издательское дело, образование, локальный бизнес.
Когда применяется
Алгоритмы активируются при получении данных от устройства захвата (сканера, камеры телефона/Google Lens, микрофона). Система постоянно использует контекст для интерпретации этих данных.
Пошаговый алгоритм
Процесс обработки захвата (на основе FIG. 1 и описания):
- Захват данных: Получение оптических или аудио данных из rendered document.
- Предварительная обработка данных: Улучшение качества сигнала.
- Распознавание и извлечение сигнатуры: Преобразование данных в сигнатуру (текст или смещения) с помощью OCR, распознавания речи или Autocorrelation. Может быть итеративным с обратной связью от поисковой системы.
- Пост-обработка: Фильтрация вывода распознавания.
- Сбор контекста: Параллельный сбор данных Scan Context (время, местоположение, манера сканирования, история пользователя, среда).
- Конструирование запроса: Формирование поисковых запросов на основе сигнатуры и контекста (как указано в Claims).
- Поиск и контекстный анализ: Идентификация исходного документа и местоположения захвата с использованием индексов и контекста.
- Извлечение документа: Извлечение электронного аналога.
- Анализ разметки (Markup Analysis): Идентификация связанных модификаций (Modifications) или разметки (Markup).
- Объединение и Действия: Объединение контента с модификациями (как указано в Claims) и выполнение действий (отображение, покупка, аннотирование).
Какие данные и как использует
Данные на входе
Патент описывает чрезвычайно широкий спектр входных данных, используемых для идентификации контента и понимания намерений пользователя.
Контентные факторы:
- Текстовые фрагменты (через OCR или распознавание речи).
- Символы, логотипы, штрихкоды, иконки.
- Сигнатуры, основанные на Autocorrelation (смещения токенов).
Технические факторы (Scan Manner):
- Направление, скорость, ускорение сканирования.
- Жесты (движения сканера для указания намерений).
Временные факторы:
- Точное время и дата сканирования.
Географические факторы (Location):
- Физическое местоположение (GPS, сетевые данные).
Пользовательские факторы (User Context):
- Идентификация пользователя.
- История сканирования (Life Library) — недавние сканы и долгосрочные привычки.
- Недавняя цифровая активность (недавно распечатанные или открытые документы).
Мультимедиа факторы (Environment Signals):
- Окружающие звуки, разговоры (захваченные микрофоном).
- Изображения окружающей среды (захваченные камерой).
Какие метрики используются и как они считаются
Патент не приводит формул, но описывает ключевые метрики и концепции для оценки.
- Read Ranking (Ранжирование по чтению): Метрика популярности физических документов и их частей. Рассчитывается путем агрегации и анализа потока данных (data-stream analysis) от всех пользователей системы: кто, что, когда и где читает (Section 14.2). Используется как сигнал авторитетности.
- Контекстуальная релевантность: Оценка вероятности совпадения документа на основе агрегации контекстных сигналов. Вероятность повышается, если документ соответствует времени, месту и истории пользователя.
- OCR/Recognition Confidence: Вероятностные оценки точности распознавания. Система может использовать «неопределенный OCR» (Uncertain OCR).
- Measure of Sufficiency (Мера достаточности): Определение момента, когда захвачено достаточно информации для уникальной идентификации.
Выводы
- Основа Визуального Поиска и критичность Контекста: Патент описывает фундаментальную архитектуру для соединения физического мира с цифровым (например, Google Lens). Ключевым элементом является агрессивное использование Scan Context (время, место, история, среда) для разрешения неоднозначности коротких запросов. Это подтверждает стратегию Google по использованию контекста во всех типах поиска.
- «Read Ranking» как потенциальный сигнал ранжирования: Введение концепции Read Ranking (анализ того, что люди читают и сканируют в физическом мире) предполагает, что вовлеченность в реальном мире может рассматриваться как сигнал авторитетности для соответствующего цифрового контента.
- Физическое взаимодействие как триггер цифровых действий: Система спроектирована не только для поиска, но и для инициирования действий: коммерции (P-Commerce), аннотирования, перевода. Физический документ становится интерфейсом к цифровым сервисам.
- Глубокое отслеживание поведения (Life Library): Система предполагает детальное отслеживание читательских привычек пользователя через Life Library для персонализации, маркетинга и улучшения контекстного понимания.
- Архитектура хранения модификаций: Claims патента защищают механизм хранения пользовательских аннотаций (Modifications) отдельно от основного контента, что позволяет создавать динамические и персонализированные слои информации.
Практика
Best practices (это мы делаем)
- Оптимизация под Visual Search (Google Lens): Обеспечивайте четкое визуальное представление контента. Используйте стандартную типографику и контрастный дизайн как на сайте, так и в любых печатных материалах (PDF, брошюры). Это облегчает распознавание (OCR) и идентификацию вашего контента при сканировании.
- Обеспечение каноничности и доступности: Убедитесь, что у любого контента, который может существовать в физической форме (например, статьи, распечатанные пользователями, PDF-руководства), есть легко индексируемая и доступная цифровая каноническая версия. PDF должны содержать текстовый слой, а не только изображения.
- Стимулирование реальной вовлеченности (для Read Ranking): Концепция Read Ranking подчеркивает важность создания контента, который настолько ценен, что пользователи захотят его сохранить, поделиться или взаимодействовать с ним физически (распечатать, цитировать). Это косвенно подтверждает ценность глубины и полезности контента для SEO.
- Усиление локального контекста (Local SEO): Поскольку местоположение является ключевым контекстным сигналом, для локального бизнеса критично обеспечить соответствие между физическими материалами (меню, вывески, визитки) и цифровой информацией (Google Business Profile, сайт).
Worst practices (это делать не надо)
- Использование текста в виде изображений без альтернативы: Размещение важной информации только в виде изображений затрудняет ее захват и интерпретацию системами визуального поиска.
- Сложная или нечитаемая типографика: Использование слишком мелких, неконтрастных или декоративных шрифтов может привести к ошибкам OCR и невозможности идентификации контента.
- Несогласованность онлайн и офлайн контента: Значительные расхождения между печатной и цифровой версиями документа помешают системе установить связь.
Стратегическое значение
Патент подтверждает стратегию Google по индексированию и пониманию не только цифрового мира, но и физической реальности. Для SEO это означает важность омниканального подхода. Авторитетность и популярность бренда или контента в реальном мире (Read Ranking) потенциально могут влиять на цифровую видимость. Система подчеркивает, что любой физический объект или текст может стать точкой входа в поисковую экосистему Google.
Практические примеры
Сценарий 1: Использование Read Ranking для повышения ранжирования исследования
- Ситуация: Компания публикует отраслевое исследование и распространяет печатные копии на конференции.
- Действие пользователя: Участники конференции читают исследование и используют Google Lens (технологию на базе патента), чтобы сканировать интересные цитаты.
- Работа системы: Google идентифицирует источник и регистрирует эти взаимодействия как сигналы для Read Ranking. Система видит всплеск интереса к физической версии документа.
- Влияние на SEO: Когда другие пользователи ищут информацию по этой теме в Google, поисковая система может использовать данные Read Ranking как сигнал авторитетности, повышая цифровую версию исследования в выдаче.
Сценарий 2: Оптимизация PDF-каталога для Visual Search
- Задача: Обеспечить переход на сайт при сканировании продукта в печатном каталоге.
- Действия: Обеспечить четкую типографику в каталоге и точное соответствие текста на сайте тексту в каталоге. PDF-версия каталога должна быть индексируемой.
- Результат: При сканировании текста продукта в каталоге система идентифицирует электронную карточку товара и предлагает пользователю перейти на нее (инициируя P-Commerce).
Вопросы и ответы
Что такое «Read Ranking» и почему это важно для SEO?
Read Ranking — это метрика, описанная в патенте (Section 14.2), которая отражает популярность документов на основе анализа того, что пользователи сканируют из физических версий. Это аналог PageRank для офлайн-мира. Для SEO это важно, так как патент указывает, что эти данные могут использоваться для ранжирования результатов поиска. Популярность вашего контента офлайн может стать сигналом для ранжирования онлайн.
Насколько важен контекст (Scan Context) в этом патенте?
Контекст имеет решающее значение. Поскольку захваченные фрагменты часто короткие и могут содержать ошибки OCR, система полагается на Scan Context (время, местоположение, историю пользователя, окружающую среду) для точной идентификации документа. Это позволяет системе понять контекст чтения и соответствующим образом скорректировать результаты поиска.
Как этот патент связан с Google Lens?
Этот патент описывает фундаментальную технологию и инфраструктуру, которые делают возможной работу Google Lens. Он объясняет, как изображение текста преобразуется в поисковый запрос, как используется контекст для его уточнения и как система находит соответствующий цифровой контент. Google Lens — это современная реализация концепций, изложенных в этом патенте.
Как SEO-специалист может оптимизировать контент под эту систему?
Ключевые направления — это оптимизация под Visual Search и обеспечение доступности. Используйте четкую типографику, чтобы облегчить OCR. Убедитесь, что у любого контента, который может быть распечатан (например, PDF), есть индексируемая цифровая каноническая версия с текстовым слоем. Для Local SEO обеспечьте соответствие между физическими материалами и цифровыми данными.
Что такое «Rendered Document»?
Rendered Document — это любой визуализированный документ, который человек может прочитать: печатная страница, текст на экране компьютера, вывеска, этикетка продукта. Для SEO это означает, что Google рассматривает любой физический текст как потенциальную точку входа в поиск.
Патент упоминает хранение модификаций отдельно от контента. Что это значит?
Это архитектурное решение (подчеркнутое в Claims) позволяет Google накладывать дополнительную информацию (аннотации пользователей — Modifications, рекламу, переводы — Markup) поверх исходного контента, не изменяя сам оригинал. Это обеспечивает гибкость в управлении правами доступа и персонализацией.
Что такое «Life Library» и зачем она нужна Google?
Life Library — это архив всего, что пользователь когда-либо сканировал. Для пользователя это удобный архив. Для Google это источник данных о привычках, интересах и поведении пользователя в реальном мире. Эта информация используется для персонализации поиска и уточнения контекста будущих запросов.
Означает ли этот патент, что Google отслеживает все, что я читаю на бумаге?
Система отслеживает только те взаимодействия, которые происходят через активное сканирование контента с помощью совместимого устройства (например, Google Lens). Она не отслеживает чтение пассивно. Однако она собирает данные о том, *что*, *когда* и *где* было отсканировано для формирования Life Library и расчета Read Ranking.
Что такое автокорреляция (Autocorrelation) в этом патенте?
Autocorrelation — это альтернативный метод распознавания текста, который не требует полного OCR. Система анализирует расстояния (смещения) между повторяющимися символами в отсканированном фрагменте. Эта последовательность смещений формирует уникальную сигнатуру, по которой можно найти текст в индексе, что может быть эффективнее традиционного OCR.
Какое значение этот патент имеет для контента в PDF?
Для PDF-контента этот патент критически важен. Чтобы система могла найти PDF по сканированному фрагменту, PDF-файл должен быть проиндексирован Google и содержать текстовый слой, а не только изображения страниц. PDF, состоящие только из сканов, будут недоступны для этой технологии.