
Google использует виртуальные машины для эмуляции мобильных операционных систем (например, Android). В этой среде запускаются нативные приложения, и система извлекает текст, изображения и структуру непосредственно из процесса рендеринга контента. Это позволяет индексировать внутренние страницы приложений и показывать их в результатах поиска вместе с веб-страницами, реализуя механизм Deep Linking.
Патент решает проблему "невидимости" контента, находящегося внутри нативных мобильных приложений (Native Applications), для традиционных поисковых систем. Ранее поисковые системы индексировали преимущественно веб-ресурсы или только метаданные приложений (например, описание в App Store), но не могли сканировать и анализировать информацию на внутренних экранах (Application Pages) приложения. Изобретение позволяет сделать этот контент доступным для поиска.
Запатентована система и метод для индексирования контента нативных приложений, работающих независимо от браузера. Суть изобретения заключается в использовании виртуальной машины (Virtual Machine), эмулирующей мобильную операционную систему, для запуска приложения. Система перехватывает данные (текст, изображения, списки), передаваемые процессу рендеринга (Rendering Process) приложения, и индексирует этот контент, привязывая его к уникальным идентификаторам страниц приложения (URI). Также запатентован метод смешивания результатов веб-поиска и поиска по приложениям.
Система работает следующим образом:
User Device OS Virtual Machine), имитирующая ОС мобильного устройства (например, Android).Extractors) для перехвата структурированных данных (например, объектов TextView, ListView), которые передаются в процесс рендеринга. Это обеспечивает высокую точность извлечения текста и структуры, включая контент, скрытый за прокруткой.Application Index), где контент ассоциируется с ID приложения и URI конкретной страницы.Deep Links на контент внутри приложений.Высокая. Патент описывает фундаментальные механизмы App Indexing (технология, эволюционировавшая в Firebase App Indexing). Возможность поиска контента внутри приложений и интеграция его в основную выдачу через Deep Linking остается критически важной для Google в условиях доминирования мобильного трафика и экосистем приложений.
Патент имеет высокое значение (85/100) для SEO-стратегий компаний, у которых есть нативные мобильные приложения. Он описывает механизм, позволяющий контенту из приложений ранжироваться в основной поисковой выдаче наравне с веб-страницами. Это критически важно для привлечения и вовлечения пользователей непосредственно из поиска Google. Понимание этого механизма требует интеграции стратегий Web SEO и ASO, а также технической реализации Deep Linking.
Web Index.Deep Linking.Application Page), релевантную запросу.Text Extractor, Image Extractor, List Extractor), которые перехватывают данные, передаваемые процессу рендеринга.TextView (текст), ImageView (изображения) и ListView (списки) как примеры для Android. Экстракторы получают данные из этих объектов.Claim 1 (Независимый пункт): Описывает основной процесс индексирования нативного приложения.
Application Pages) в VM.Claim 2 (Зависимый от 1): Уточняет процесс доступа к страницам.
Система может получать от издателя приложения данные, указывающие, какие именно страницы должны быть проиндексированы, и ограничивать доступ только этими страницами.
Claim 3 (Зависимый от 1): Уточняет метод извлечения контента. Генерация данных включает извлечение текстовых данных, которые передаются в процесс рендеринга приложения. Это означает перехват сырых данных до отображения, а не анализ готового изображения (OCR).
Claim 8 (Независимый пункт): Описывает процесс объединения результатов поиска (Blending).
Web Index).Application Index).Claim 9 (Зависимый от 8): Уточняет функциональность результата поиска для приложения (Deep Linking). Результат включает изображение страницы приложения и данные, которые при выборе пользователем вызывают запуск приложения и открытие конкретной релевантной страницы.
Claim 17 (Независимый пункт): Детализирует процесс извлечения данных с акцентом на перехвате данных рендеринга.
Claim 18, 19, 20 (Зависимые от 17): Уточняют природу извлекаемых данных. Данные представляют собой объекты класса View, такие как text view object (текст) и list view object (списки).
Изобретение охватывает весь жизненный цикл индексирования и поиска контента приложений.
CRAWLING – Сканирование и Сбор данных
Основное применение патента. Вместо Googlebot используется User Device OS Virtual Machine. Система эмулирует взаимодействие с приложением для обнаружения новых страниц (автоматическое исследование меню и ссылок) или сканирует страницы по предоставленному списку URI (Claim 2).
INDEXING – Индексирование и извлечение признаков
Система извлекает признаки (текст, изображения, структуру) не из HTML, а непосредственно из процесса рендеринга приложения, перехватывая объекты View (TextView, ListView). Извлеченные данные сохраняются в Application Index, структурированные по App ID и Application Page URI.
METASEARCH – Метапоиск и Смешивание
Ключевой этап применения (Claim 8). Система объединяет результаты из Web Index и Application Index. Происходит формирование универсальной выдачи, включающей как веб-ссылки, так и Deep Links в приложения.
Входные данные:
Receiving Cache).Выходные данные:
Application Index.Процесс А: Индексирование приложения (Офлайн/Периодический)
User Device OS Virtual Machine), эмулирующую целевую мобильную ОС.Application Pages) путем автоматического исследования интерфейса или путем доступа по списку URI, предоставленному разработчиком (Claim 2).Text Extractor, List Extractor и т.д.). Они перехватывают данные (например, объекты TextView, ListView), передаваемые в Rendering Process.Screen Extractor).Receiving Cache для индексации.Application Index и ассоциируются с ID приложения и URI данной страницы.Процесс Б: Обработка запроса и выдача результатов (Реальное время)
Web Index и Application Index.Deep Linking (URI).Система использует данные, извлеченные непосредственно из среды выполнения приложения.
View class objects). Извлекаются данные из стандартных компонентов: TextView objects (или аналоги): для получения текста.ListView objects (или аналоги): для получения данных из списков и меню.ImageView objects (или аналоги): для получения изображений.TextView.Native Application Identifier: Уникальный идентификатор приложения.Application Page Identifier (URI): Идентификатор конкретной страницы внутри приложения.application page link data).web page link data).Патент не описывает конкретные метрики ранжирования, но детализирует методы извлечения данных:
Rendering Process (Claim 3, 17). Это обеспечивает доступ к точному тексту в бинарном виде и позволяет получить полный текст, даже если он скрыт за прокруткой (scrollable elements). В качестве альтернативы упоминается OCR (Optical Character Recognition) по изображению страницы (Claim 5), но основной акцент сделан на перехвате объектов.ListView, Groups) позволяет системе понимать структуру контента на странице (например, связь между именем и телефоном в списке контактов).Application Pages) являются аналогом веб-страниц в этом процессе.TextView). Это дает Google доступ к чистым, структурированным данным и позволяет индексировать контент, скрытый за прокруткой.Deep Linking каждая важная страница внутри приложения должна иметь уникальный идентификатор (URI). Без этого система не сможет проиндексировать страницу отдельно.Application Page Identifier). Это фундамент для работы описанной системы.TextView, ListView). Система полагается на перехват данных из этих объектов. Использование кастомных компонентов может помешать индексации.TextView) должен быть оптимизирован под ключевые запросы, аналогично оптимизации веб-страниц. Google извлекает этот текст для ранжирования.TextView).Патент подчеркивает стратегию Google по созданию единого поискового опыта, стирающего границы между вебом и нативными приложениями. Для SEO это означает, что оптимизация больше не ограничивается только веб-сайтом. Нативное приложение становится активом, который должен участвовать в органическом поиске. Стратегия должна быть комплексной (Web + App), обеспечивая техническую возможность индексации и оптимизацию контента в обеих средах.
Сценарий: Индексация карточки товара в eCommerce приложении
android-app://com.example.shop/product/{product_id}. Они убеждаются, что название товара, описание и цена отображаются с использованием стандартных компонентов (TextView).Text Extractors перехватывают текст (название, цена, описание) из TextView. Этот контент индексируется в Application Index.Deep Link) сразу открывает карточку товара в приложении.Как именно Google "видит" контент внутри приложения? Используется ли OCR?
Основной метод Google — не OCR. Система запускает приложение в эмулируемой среде (виртуальной машине) и перехватывает данные, которые передаются процессу рендеринга. Если текст отображается с помощью стандартного компонента (например, TextView в Android), Google извлекает этот текст напрямую из объекта. Это точнее, чем OCR, и позволяет индексировать контент, скрытый за прокруткой. OCR упоминается (Claim 5), но как альтернативный метод.
Что такое Application Page URI и почему он критически важен?
Это уникальный адрес (Deep Link) конкретного экрана внутри приложения, аналог URL для веб-страницы. Он критически важен, так как Google индексирует контент, привязывая его именно к этому URI (Claim 1). Без него система не сможет направить пользователя на конкретный экран из результатов поиска.
Что необходимо сделать технически, чтобы приложение индексировалось этим методом?
Необходимо реализовать поддержку Deep Linking (URI) для всех важных экранов. Также критически важно использовать стандартные компоненты интерфейса ОС (например, TextView, ListView) для отображения контента, так как система извлекает данные именно из них. Использование нестандартных или кастомных компонентов может помешать индексации.
Как этот патент связан с Firebase App Indexing?
Этот патент описывает фундаментальную инфраструктуру и методы, которые Google использует для сканирования и индексирования приложений на своей стороне (через эмуляцию). Firebase App Indexing — это набор инструментов (SDK и API), который Google предоставляет разработчикам для облегчения этого процесса, позволяя им более явно управлять индексацией.
Нужно ли оптимизировать текст внутри приложения под SEO?
Абсолютно. Поскольку Google извлекает текст непосредственно из экранов приложения (через TextView) и использует его для понимания контента и ранжирования, этот текст (заголовки, описания на индексируемых экранах) должен быть оптимизирован так же, как и контент на веб-страницах.
Может ли контент моего приложения ранжироваться выше, чем мой веб-сайт?
Да. Патент описывает смешивание результатов из веб-индекса и индекса приложений (Claim 8). Если система определит, что страница приложения лучше отвечает на запрос пользователя (особенно на мобильном устройстве, где приложение установлено), она может получить приоритет. Для консолидации сигналов рекомендуется связывать контент (App/Web Parity).
Как система определяет, какие страницы приложения сканировать?
Патент предлагает два метода: автоматическое исследование интерфейса (система сама кликает по меню и ссылкам) или сканирование по списку URI, предоставленному издателем (Claim 2). Для гарантии лучше использовать второй метод или инструменты типа Firebase App Indexing.
Как обрабатываются приложения с динамическим контентом, зависящим от параметров (например, разные товары)?
Каждый уникальный URI (включая параметры) индексируется отдельно. Однако патент упоминает, что для контроля размера индекса система может ограничить индексацию только N наиболее популярными значениями параметров (например, топ-100 самых популярных товаров).
Индексирует ли Google данные, которые приложение загружает с сервера во время работы?
Да. Поскольку приложение запускается в виртуальной машине, оно выполняет свои обычные функции, включая запросы к серверу. Если загруженные данные используются для рендеринга страницы, они будут перехвачены экстракторами. Патент также упоминает Receiving Cache для хранения перехваченных внешних данных.
Что произойдет, если у пользователя не установлено приложение, а он кликнет на результат поиска?
Патент упоминает, что в этом случае выбор результата может направить пользователя на веб-страницу, где приложение можно скачать и установить (например, в Google Play). Это стандартное поведение, часто называемое Deferred Deep Linking.

Индексация
SERP

Индексация
Техническое SEO

Индексация
Краулинг
Ссылки

Индексация
SERP
Персонализация

Индексация
Краулинг

Ссылки
SERP

Ссылки
SERP

EEAT и качество
Ссылки

Антиспам
Ссылки
SERP

Knowledge Graph
SERP
Семантика и интент

SERP
Поведенческие сигналы
EEAT и качество

Ссылки
Семантика и интент
Техническое SEO

EEAT и качество
Антиспам
SERP

Поведенческие сигналы
Ссылки

Техническое SEO
Ссылки
