
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
Патент решает проблему сложности обнаружения и индексации контента, находящегося внутри нативных мобильных приложений (native applications). В отличие от веб-сайтов, где краулеры могут легко анализировать HTML и переходить по ссылкам, нативные приложения не имеют стандартной структуры ссылок и часто не связаны друг с другом. Это затрудняет для поисковых систем обнаружение deep links (ссылок на конкретные страницы внутри приложения), их индексацию и показ в результатах поиска.
Запатентована система и метод для автоматического генерирования глубоких ссылок нативных приложений и индексации контента, полученного по этим ссылкам. Система использует два основных подхода: 1) Для приложений, аффилированных с веб-сайтами и использующих веб-URL, система валидирует связь и использует существующие URL для индексации. 2) Для приложений с кастомными URI система применяет итеративный процесс обнаружения ссылок, запуская приложение в эмулируемой среде и извлекая исходящие ссылки с каждой страницы приложения.
Механизм работы зависит от типа приложения:
Application Manifest), чтобы определить шаблон URI (URI pattern), включая схему (например, http), хост (домен) и путь. Если шаблон URI в приложении совпадает с данными издателя, система считает приложение аффилированным. Далее она выбирает уже известные веб-URL, соответствующие этому шаблону, и индексирует контент приложения, доступный по этим URL.virtual machine), начиная с первого URI (например, главной страницы). Система извлекает исходящие ссылки (outbound URIs) с этой страницы, генерирует следующие страницы по этим ссылкам и повторяет процесс итеративно, пока не обнаружит весь доступный контент.В обоих случаях для извлечения контента могут использоваться extractors в виртуальной машине, которые перехватывают данные (текст, изображения), передаваемые процессу рендеринга приложения.
Высокая. Индексация мобильных приложений (известная как Firebase App Indexing или Google App Indexing) является важной частью стратегии Google по предоставлению пользователям релевантного контента независимо от платформы. Хотя техническая реализация могла эволюционировать (например, больший фокус на API Firebase), базовые принципы, описанные в патенте — верификация аффилиации, использование веб-URL и итеративное обнаружение ссылок — остаются фундаментальными для интеграции контента приложений в поиск.
Патент имеет высокое значение (75/100) для SEO и ASO (App Store Optimization). Он описывает инфраструктуру, которая позволяет контенту из приложений ранжироваться в мобильном поиске наравне с веб-страницами. Понимание этих механизмов критически важно для разработчиков и маркетологов, стремящихся увеличить видимость своего приложения и вовлеченность пользователей через органический поиск. Патент подчеркивает необходимость технической реализации поддержки глубоких ссылок (Deep Linking) и верификации связи между сайтом и приложением.
Application Pages) внутри приложения, в отличие от ссылок на главную страницу приложения.Claim 1 (Независимый пункт): Описывает процесс индексации для приложений, связанных с веб-сайтами.
Publisher Affiliation Data, связывающие приложения с издателями.URI Pattern для приложения.URI Pattern (например, по имени хоста/домену), с издателем, указанным в Publisher Affiliation Data. Совпадение имени хоста URI с доменом издателя приводит к положительному результату.URI Pattern приложения. Выбираются URL, которые начинаются с этого шаблона.Ядро изобретения здесь — строгая проверка аффилиации перед тем, как разрешить приложению индексировать контент, связанный с определенным доменом. Это предотвращает индексацию контента через неавторизованные приложения.
Claim 6 (Зависимый от 1, но описывает альтернативный метод выбора URI): Детализирует итеративный процесс обнаружения ссылок (который может применяться, если URI не выбираются из существующего веб-индекса, как описано в Claim 4 и 5).
URI Pattern для генерации первой страницы приложения.outbound URIs) с текущей страницы приложения.Этот пункт описывает механизм, схожий с веб-краулингом, но применяемый внутри среды нативного приложения для обнаружения контента.
Изобретение применяется на этапах сбора данных и индексации для создания индекса контента приложений.
CRAWLING – Сканирование и Сбор данных
Это основной этап применения патента. Application Crawling And Indexing System выполняет несколько функций:
Publisher Affiliation Data.Application Manifest) для извлечения шаблонов URI.Virtual Machine и использует Extractors для сбора контента (текста, изображений) со страниц приложения.INDEXING – Индексирование и извлечение признаков
Извлеченный контент обрабатывается и сохраняется в индексе приложений (Application Index), который доступен для поиска. Также система использует данные из Веб-индекса (Web Index) для обнаружения URL, которые могут быть использованы как глубокие ссылки.
Входные данные:
Publisher Affiliation Data (связь домен-приложение).Application Manifest).Web Index (для Метода 1).Выходные данные:
Application Page data) в Application Index.Synchronized Content, который дублируется на сайте и в приложении.Extractors (например, стандартные элементы интерфейса, такие как TextView, ImageView в Android).Алгоритм применяется во время планового сканирования и индексации приложений.
Условия активации (Метод 1 - Web-affiliated):
Publisher Affiliation Data.URI Pattern (схему, хост).URI Pattern приложения совпадает с данными аффилиации издателя (доменом).Если аффилиация не подтверждена, URI издателя не обрабатываются для данного приложения.
Условия активации (Метод 2 - Итеративное обнаружение):
Virtual Machine.outbound URIs), которые могут быть обнаружены системой.Процесс А: Индексация аффилированных приложений (Web-affiliated)
Publisher Affiliation Data, определяющие связь между издателями (доменами) и приложениями.URI Pattern (схема, хост, путь) из его манифеста.URI Pattern приложения с доменом издателя из Publisher Affiliation Data.URI Pattern (например, начинаются с http://example.com/path/).Extractors, система извлекает контент (текст, изображения) со сгенерированной страницы приложения.Application Index и связывается с соответствующим URI.Процесс Б: Итеративное обнаружение ссылок (Custom URIs или альтернатива Процессу А)
URI Pattern для приложения (например, из манифеста).outbound URIs. Это может включать анализ извлеченного текста на соответствие URI Pattern или использование API индексации.Extractors и индексируется.Патент фокусируется на инфраструктуре индексации и использует следующие типы данных:
URI Patterns, извлеченные из манифеста (схема, хост, префикс пути).Extractors (например, TextView) из страниц приложения.Extractors (например, ImageView).Extractors (например, ListView).Outbound URIs, обнаруженные на страницах приложения, используются для итеративного краулинга.link popularity) с целью приоритизации краулинга.Конкретные метрики ранжирования в патенте не описаны, но описаны метрики и процессы для индексации:
URI Pattern приложения и домена издателя из Publisher Affiliation Data.URI Pattern в манифесте приложения совпадает с верифицированным доменом издателя. Это защищает контент от индексации через сторонние приложения.Extractors для перехвата данных (текст, изображения), передаваемых на рендеринг. Это означает, что индексируется именно то, что видит пользователь в стандартных элементах интерфейса.intent filters в AndroidManifest.xml для обработки HTTP URL (App Links) или кастомных схем URI.Publisher Affiliation Data.Extractors, ориентированные на стандартные элементы интерфейса (например, TextView, ImageView), старайтесь использовать их для отображения основного контента. Это повышает вероятность корректного извлечения данных.link popularity).Extractors.Патент подтверждает важность концепции "App Indexing" как моста между вебом и нативными приложениями. Стратегически это означает, что SEO больше не ограничивается только веб-сайтами. Для бизнеса, имеющего мобильное приложение, интеграция его контента в поиск является ключевым каналом для привлечения новых пользователей и повторного вовлечения существующих. Понимание того, что Google готов эмулировать приложение и сканировать его изнутри, подчеркивает необходимость рассматривать архитектуру приложения с точки зрения доступности контента для поисковых систем.
Сценарий 1: Индексация приложения интернет-магазина (Аффилированного с сайтом)
URI Pattern, соответствующий сайту (например, http://www.example.com/product/).Publisher Affiliation Data).Extractors извлекают название, описание, цену и изображение товара.Сценарий 2: Индексация контентного приложения без веб-сайта (Кастомные URI)
outbound URIs) на главной странице (с помощью API или анализа текста).Extractors извлекают текст статьи.Что такое "Native Application" в контексте этого патента?
Это приложение, разработанное специально для конкретной операционной системы (например, Android или iOS) и работающее независимо от веб-браузера. Патент проводит четкое различие между нативными приложениями и веб-ресурсами или приложениями, работающими внутри браузера.
Почему Google просто не сканирует приложения так же, как сайты?
Патент объясняет, что в отличие от сайтов, у приложений нет стандартного способа инспекции кода (как HTML) для поиска исходящих ссылок. Также приложения часто не ссылаются друг на друга, как это делают сайты, что затрудняет обнаружение контента. Поэтому требуются специальные методы, такие как использование веб-URL или эмуляция работы приложения.
Что такое "Extractors" и как они работают?
Extractors — это компоненты, работающие внутри виртуальной машины, где Google запускает приложение для индексации. Они предназначены для извлечения контента путем перехвата данных, передаваемых процессу рендеринга приложения. Например, вместо анализа изображения экрана они извлекают фактический текст из объектов типа TextView или данные изображения из ImageView. Это обеспечивает более точную индексацию контента.
Насколько важна верификация связи между сайтом и приложением?
Она критически важна. Патент подчеркивает (особенно в Claim 1), что система будет индексировать контент, связанный с определенным доменом, только через те приложения, которые доказали свою аффилиацию с владельцем этого домена. Это достигается путем сравнения URI Pattern в манифесте приложения с данными от издателя. Без верификации индексация по веб-URL не произойдет.
Может ли Google проиндексировать приложение, если у него нет веб-сайта?
Да. Патент описывает итеративный процесс обнаружения ссылок (Процесс Б). Система запускает приложение, начиная с главной страницы, обнаруживает исходящие ссылки на ней, переходит по ним и повторяет процесс. Это позволяет сканировать структуру приложения и индексировать контент, даже если он доступен только через кастомные URI и не имеет веб-аналогов.
Как Google определяет, какие глубокие ссылки сканировать в первую очередь?
Патент упоминает два механизма. Во-первых, для аффилированных приложений могут использоваться критерии популярности веб-URL. Во-вторых, система может использовать данные о том, какие ссылки реально просматриваются пользователями внутри приложения (link popularity), полученные через API индексации. Это позволяет приоритизировать краулинг на основе вовлеченности.
Влияет ли этот патент на ранжирование веб-страниц?
Напрямую нет. Патент описывает механизм индексации контента *внутри* приложений. Однако он влияет на общую видимость в SERP, позволяя глубоким ссылкам приложений конкурировать с веб-страницами за место в мобильной выдаче. Если контент приложения признан релевантным, он будет показан пользователю.
Что делать, если контент в приложении отображается через WebView (как встроенный браузер)?
Патент фокусируется на индексации контента нативных приложений. Контент, отображаемый через стандартный WebView, обычно рассматривается как веб-контент и индексируется стандартными веб-краулерами при сканировании соответствующего сайта. Описанные в патенте механизмы (Extractors, итеративное обнаружение) нацелены на контент, отображаемый нативными компонентами приложения.
Какие технические требования следуют из этого патента для разработчиков?
Ключевые требования — это реализация поддержки Deep Linking и корректная настройка манифеста приложения (например, intent filters в Android). Приложение должно быть способно обработать URI и отобразить соответствующий контент. Также рекомендуется использовать стандартные элементы UI для отображения контента, чтобы облегчить работу Extractors.
Как этот патент связан с Android App Links или Firebase App Indexing?
Этот патент описывает базовую инфраструктуру и логику, лежащую в основе этих технологий. Android App Links — это реализация механизма использования веб-URL (HTTP) в качестве глубоких ссылок с обязательной верификацией аффилиации (Процесс А). Firebase App Indexing API предоставляет инструменты для помощи в итеративном обнаружении ссылок и передачи сигналов о поведении пользователей, как описано в патенте.

Индексация
SERP

Индексация
Краулинг
SERP

Индексация
Ссылки
Техническое SEO

Индексация
SERP
Персонализация

Индексация
Техническое SEO

Поведенческие сигналы
Персонализация
Семантика и интент

SERP
Семантика и интент
Ссылки

Ссылки
Индексация
Краулинг

SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Ссылки
EEAT и качество
SERP

Персонализация
Поведенческие сигналы
SERP

Семантика и интент
Ссылки

Ссылки
SERP

Структура сайта
SERP
Ссылки
