
Google использует систему для индексации контента внутри нативных мобильных приложений, который ранее был недоступен для поиска. Система запускает приложение в виртуальной машине, эмулирующей операционную систему устройства, переходит к конкретным экранам или состояниям (environment instances) и извлекает описательные данные. Ключевой особенностью является извлечение текстовых данных, которые разработчики встраивают специально для поисковых систем, но которые не видны пользователю при обычном использовании приложения.
Патент решает проблему недоступности контента внутри нативных мобильных приложений (native applications) для традиционных поисковых систем. В отличие от веб-страниц, контент внутри приложений, особенно графически насыщенных (например, игр или 3D-туров), часто не содержит видимого текста для индексации. Ранее поиск мог полагаться только на внешние метаданные (например, описание в App Store). Изобретение позволяет поисковой системе понять содержание конкретных экранов или функций (environment instances) внутри приложения и оценивать их релевантность запросам.
Запатентована система и метод для генерации индексных данных для конкретных состояний (environment instances) нативного приложения. Суть изобретения заключается в механизме извлечения текстовых данных, которые описывают контент этого состояния, но при этом не отображаются пользователю (invisible textual data). Эти скрытые данные, предоставленные разработчиком специально для индексации, извлекаются (часто с помощью виртуальной машины), обрабатываются и сохраняются в поисковом индексе (Application Index), позволяя поисковой системе предлагать пользователям глубокие ссылки (deep links) на конкретный контент внутри приложений.
Система работает следующим образом:
environment instances внутри приложения, часто с помощью набора URI (Uniform Resource Identifiers), предоставленных издателем.Application Indexer, который создает виртуальную машину (Virtual Machine), эмулирующую операционную систему мобильного устройства.environment instance (используя URI).Extractors) перехватывают текстовые данные, переданные процессу рендеринга, но помеченные как невидимые для пользователя. Например, это может быть текстовый объект (text view object), наложенный на графический контент (OpenGL surface view), но с атрибутом невидимости.Application Index, который затем используется поисковой системой.Высокая. Этот патент описывает базовые технические принципы того, что стало известно как Google App Indexing (позже интегрировано в Firebase). Индексация контента приложений и возможность перехода по глубоким ссылкам из результатов поиска являются критически важными элементами современной мобильной экосистемы и стратегий ASO/SEO. Механизмы, описанные здесь, лежат в основе того, как Google интегрирует контент приложений в органический поиск.
Патент имеет высокое значение (85/100) для SEO и особенно для ASO (App Store Optimization). Он описывает механизм, который позволяет контенту из приложений ранжироваться в органическом поиске наряду с веб-результатами. Для компаний, чьи продукты или услуги представлены в мобильных приложениях, понимание этого механизма критично для обеспечения видимости их контента. Это напрямую влияет на стратегии разработки приложений, требуя интеграции специфических методов индексации для максимизации трафика из поиска.
environment instances. Используется поисковой системой наряду с Web Index.Application Index.Text Extractor, Image Extractor), предназначенный для извлечения определенных типов данных из процесса рендеринга приложения.environment instance, которые передаются в процесс рендеринга приложения, но помечены так, чтобы не отображаться на экране пользователя. Предназначены специально для индексации.environment instance внутри приложения (глубокая ссылка). Используется для навигации к контенту как при индексации, так и при переходе пользователя из результатов поиска.Claim 1 (Независимый пункт): Описывает основной метод индексации контента нативных приложений с использованием виртуальной машины и извлечением скрытого текста.
environment instances для нативного приложения. Это делается путем получения набора URI от издателя приложения.environment instance система определяет описывающие его текстовые данные, которые не видны пользователю при рендеринге. Процесс определения этих данных включает: environment instance.environment instance в VM.invisible textual data (т.е. не предназначенных для отображения).Ядром изобретения является комбинация использования VM для рендеринга глубоких ссылок (URI) и специфического механизма извлечения текста, который был намеренно скрыт от пользователя, но предоставлен для индексации.
Claim 2 (Зависимый от 1): Описывает альтернативный вариант, где издатель предоставляет URI и сами текстовые данные, описывающие environment instance. Это может позволить системе получить данные без необходимости их извлечения через VM.
Claim 3 (Зависимый от 1): Уточняет техническую реализацию извлечения скрытого текста в VM.
Генерация environment instance включает создание первого графического представления (OpenGL surface view). Извлечение текста включает создание текстового объекта (text view object), содержащего текстовые данные, который накладывается поверх графического представления, и последующее извлечение данных из этого текстового объекта. Это подтверждает механизм "наложения" скрытого текста на графический контент для целей индексации.
Claim 4, 5 и 6 (Зависимые): Описывают функциональность результата поиска (Deep Linking).
Система генерирует результат поиска на основе индексированных данных (Claim 4). Результат поиска включает URI и изображение environment instance. Выбор результата пользователем приводит к запуску приложения и навигации к соответствующему контенту (Claim 5), либо к предложению установить приложение, если оно не установлено (Claim 6).
Изобретение затрагивает ключевые этапы поисковой архитектуры, обеспечивая возможность поиска внутри приложений.
CRAWLING – Сканирование и Сбор данных
Это основной этап применения патента. Application Indexer выполняет функцию краулера для нативных приложений. Вместо загрузки HTML используется Virtual Machine для запуска приложения и эмуляции взаимодействия с ним. Сбор данных происходит либо путем перехода по предоставленным издателем URI, либо путем автоматизированного исследования структуры приложения (automated process that explores various menus).
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит извлечение ключевой информации из отрендеренных environment instances. Ключевым процессом является извлечение invisible textual data с помощью Extractors. Также могут извлекаться видимый текст, изображения, видео и ссылки. Данные сохраняются в специализированном Application Index.
METASEARCH – Метапоиск и Смешивание
Поисковая система одновременно обращается к Web Index и Application Index. Результаты из обоих индексов (веб-страницы и глубокие ссылки на environment instances) смешиваются и предоставляются на единой странице результатов поиска (SERP).
Входные данные:
Выходные данные:
Index Data) для каждого environment instance, включающие извлеченный текст, URI (deep link), и, возможно, изображения или видео (скриншоты).Application Index.Алгоритм индексации применяется при обнаружении нового приложения или обновлении существующего.
environment instances они должны быть достижимы либо через автоматическое исследование, либо через предоставленные URI.invisible textual data, либо через предоставление списка URI с соответствующими описаниями.Процесс индексации нативного приложения (на примере использования VM):
Application Indexer запускает виртуальную машину, эмулирующую целевую операционную систему устройства.environment instance.TextView объектов), которые были помечены как невидимые для пользователя.environment instance.Application Index.Патент фокусируется на следующих типах данных, извлекаемых из приложения:
Invisible textual data. Это ключевой элемент патента. Текст, предоставляемый разработчиком для описания графического или интерактивного контента, который не отображается пользователю (например, ключевые слова, сниппеты).rendered textual data), который отображается в интерфейсе.Image data и Video data. Система может извлекать изображения (скриншоты) или видеофрагменты environment instance для использования в результатах поиска.Uniform Resource Identifiers (URIs). Глубокие ссылки, используемые для доступа к конкретным environment instances.native application map).Патент не описывает метрики ранжирования, а фокусируется на процессе индексации. Он описывает, какие данные собираются, но не как они взвешиваются поисковой системой.
Ключевые механизмы обработки данных:
TextView, ImageView) во время работы приложения в VM.invisible textual data для понимания контента, особенно в графических приложениях. В отличие от веб-SEO, где скрытый текст часто считается манипуляцией, в контексте этого патента это основной легитимный механизм предоставления информации поисковой системе.Uniform Resource Identifiers являются основой для индексации конкретных состояний приложения. Наличие проработанной структуры URI внутри приложения необходимо для того, чтобы контент был проиндексирован и доступен из поиска.TextView) и рендеринг на графических поверхностях (OpenGL surface view). Использование стандартных компонентов облегчает работу экстракторов.Web Index и Application Index, что позволяет пользователям бесшовно переходить из поиска непосредственно в релевантный контент приложения. Это стирает границы между вебом и приложениями в контексте поиска информации.Для SEO/ASO специалистов, работающих с мобильными приложениями, этот патент диктует необходимость тесного взаимодействия с командой разработки для реализации App Indexing.
environment instances), особенно тех, где мало видимого текста, необходимо предоставлять системе индексации релевантные описательные данные. Согласно патенту, это реализуется через invisible textual data (на практике – через API индексации или атрибуты видимости для текстовых полей).environment instances. Каждый уникальный фрагмент контента должен иметь свой URI.TextView и ImageView), так как система индексации оптимизирована для извлечения данных из них.Virtual Machine, приложение должно работать стабильно. Ошибки и сбои могут помешать эффективной индексации контента.invisible textual data информации, которая не соответствует реальному контенту environment instance, с целью манипуляции ранжированием. Хотя патент описывает этот механизм как легитимный, злоупотребление им может привести к санкциям (система может верифицировать данные).Этот патент имеет фундаментальное стратегическое значение для мобильного поиска. Он демонстрирует техническое решение Google для преодоления разрыва между вебом и нативными приложениями. Стратегия SEO должна учитывать, что контент приложения является таким же объектом поиска, как и веб-страница. Долгосрочная стратегия требует интеграции процессов SEO и ASO, а также включения требований к индексации на самых ранних этапах проектирования и разработки приложений.
Сценарий: Индексация товара в E-commerce приложении
android-app://com.example.store/products/nike-air-max-2025.environment instance) разработчик размещает видимый текст (цена, название).invisible textual data (или данные передаются через API индексации). Эти данные содержат: Application Indexer Google запускает приложение в VM, переходит по URI, рендерит карточку товара и извлекает видимые и невидимые текстовые данные.Что такое "Environment Instance" в контексте этого патента?
Это конкретный экран, состояние или функция внутри мобильного приложения. Например, это может быть карточка товара в магазине, страница профиля пользователя, конкретный уровень в игре или даже интерактивный 3D-тур. Каждый Environment Instance обычно имеет уникальный URI (глубокую ссылку), позволяющий системе индексировать его отдельно.
Патент описывает использование "скрытого текста" (invisible textual data). Разве это не запрещенный прием в SEO?
В традиционном веб-SEO использование скрытого текста часто считается манипуляцией. Однако в контексте индексации нативных приложений, как описано в этом патенте, это легитимный и основной механизм. Поскольку многие приложения (например, игры) графически насыщены и не содержат достаточно видимого текста, Google предлагает этот механизм как способ для разработчиков описать контент для поисковой системы.
Как именно система извлекает этот скрытый текст?
Система запускает приложение в виртуальной машине (Virtual Machine), эмулирующей ОС устройства. Когда приложение рендерит экран, оно передает данные в процесс рендеринга. Система индексации использует экстракторы (Extractors) для перехвата этих данных непосредственно из объектов интерфейса (например, TextView в Android), даже если эти объекты помечены как невидимые для пользователя.
Должны ли мы сами предоставлять Google список URI для индексации, или система найдет их автоматически?
Патент описывает оба варианта. Вы можете предоставить набор URI (set of uniform resource identifiers) для индексации (Claim 1), что гарантирует сканирование нужных разделов. Также система может использовать автоматизированный процесс исследования (automated exploration) внутри виртуальной машины. Рекомендуется использовать первый вариант для контроля над индексацией.
Как этот патент связан с Firebase App Indexing?
Этот патент описывает базовую технологию и инфраструктуру, которую Google разработал для индексации приложений. Firebase App Indexing является практической реализацией и инструментом (API), который разработчики используют для предоставления данных (URI и описательного текста) системе, описанной в патенте.
Что произойдет, если мы предоставим неверные данные в скрытом тексте?
Если данные в invisible textual data не соответствуют реальному контенту экрана, это может быть расценено как клоакинг. Патент упоминает возможность верификации данных (Verifier) либо с помощью виртуальной машины (сравнивая скрытый текст с видимыми элементами или другими сигналами), либо с помощью асессоров (human reviewers). Предоставление неточных данных рискованно.
Может ли система индексировать игры, созданные на Unity или других кроссплатформенных движках?
Патент не ограничивает типы приложений, но описывает механизм извлечения на примере стандартных компонентов ОС (например, TextView, OpenGL surface view). Если кроссплатформенный движок использует стандартные нативные компоненты для рендеринга или предоставляет данные через стандартные API индексации, система сможет их обработать. В противном случае индексация может быть затруднена.
Какие данные, кроме текста, может извлекать система?
Помимо видимого и невидимого текста, система может извлекать изображения (Image Extractor) и видео (Video Extractor). Это позволяет Google генерировать скриншоты или даже короткие видеопревью контента приложения для отображения непосредственно в результатах поиска, делая сниппет более привлекательным.
Что произойдет, если пользователь нажмет на результат поиска, но приложение у него не установлено?
Патент (Claim 6) предусматривает это. Если приложение не установлено на устройстве пользователя, выбор результата поиска приведет к предложению установить приложение. Обычно пользователя направляют на страницу приложения в соответствующем магазине (Google Play или App Store).
Влияет ли этот патент на ранжирование веб-сайтов?
Напрямую нет. Патент описывает индексацию контента для Application Index. Однако он влияет на общую видимость в мобильной выдаче. Если контент приложения будет признан высоко релевантным и займет высокую позицию в виде Deep Link, это может уменьшить видимость и трафик соответствующих веб-страниц на мобильных устройствах.

Индексация
Краулинг
SERP

Индексация
SERP

Индексация
SERP
Персонализация

Индексация
Краулинг
Ссылки

Индексация
Краулинг

Семантика и интент
Поведенческие сигналы
SERP

Поведенческие сигналы
SERP

EEAT и качество
Поведенческие сигналы
SERP

Поведенческие сигналы
Мультимедиа
Семантика и интент

Семантика и интент
Персонализация
Поведенческие сигналы

Поведенческие сигналы
SERP

Семантика и интент
Безопасный поиск
Поведенческие сигналы

Поведенческие сигналы
EEAT и качество

Свежесть контента
Ссылки
Техническое SEO

SERP
Ссылки
Структура сайта
