Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google индексирует контент приложений, сопоставляя отдельные разделы веб-страницы с экранами в приложении

    APPLICATION PARTIAL DEEP LINK TO A CORRESPONDING RESOURCE (Частичная глубокая ссылка приложения на соответствующий ресурс)
    • US10223460B2
    • Google LLC
    • 2019-03-05
    • 2015-08-25
    2015 Индексация Краулинг Патенты Google Ссылки

    Патент описывает механизм индексации нативных приложений (App Indexing). Система идентифицирует конкретные разделы на веб-странице и связывает их с «частичными глубокими ссылками» (Partial Deep Links), ведущими на аналогичный контент внутри приложения. Это позволяет Google верифицировать консистентность контента и использовать веб-страницу как прокси для ранжирования приложения.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает задачу точного сопоставления и верификации контента между веб-ресурсами и нативными мобильными приложениями. Веб-страницы часто содержат несколько разделов, которые в приложении могут быть реализованы на разных экранах. Изобретение позволяет проводить гранулярную верификацию контента (content verification) на уровне отдельных разделов, а не всей страницы. Это повышает точность индексации приложений (App Indexing) и улучшает пользовательский опыт, направляя пользователя из поиска сразу в нужный раздел приложения.

    Что запатентовано

    Запатентована система для создания и использования «частичных глубоких ссылок» (native application partial deep links). Система анализирует веб-ресурс на наличие идентификаторов разделов (portion identifiers), которые определяют конкретные подразделы контента (proper subset of content). Эти разделы сопоставляются с соответствующими глубокими ссылками приложения. Ключевым элементом является верификация консистентности контента между веб-разделом и экраном приложения.

    Как это работает

    Система работает в несколько этапов:

    • Обнаружение: При сканировании веб-ресурса система ищет декларации partial deep links и связанные с ними portion identifiers в коде страницы.
    • Маппинг: Создается карта соответствия (mapping) между адресом веб-раздела и partial deep link приложения.
    • Верификация контента: Система извлекает контент из раздела веб-страницы и сравнивает его с контентом, предоставляемым приложением по глубокой ссылке.
    • Валидация и Индексация: Если контент признан консистентным (consistent content), маппинг валидируется. Это позволяет использовать веб-ресурс как scoring proxy (прокси для оценки) для ранжирования контента приложения.
    • Использование в поиске: Валидированные ссылки могут предоставляться в результатах поиска, ведя пользователя непосредственно в приложение.

    Актуальность для SEO

    Средне-Высокая. Патент описывает ключевые механизмы Google App Indexing (ныне часть Firebase). Хотя развитие PWA снизило зависимость от нативных приложений для некоторого контента, принципы кросс-платформенной верификации контента и использование веб-сигналов для оценки приложений остаются фундаментальными для интеграции приложений в экосистему поиска Google.

    Важность для SEO

    Влияние на SEO (6.5/10). Патент имеет низкое значение для традиционного веб-SEO, но критически важен для стратегий, включающих индексацию нативных приложений (App SEO). Он описывает инфраструктуру, определяющую, как контент приложения будет проиндексирован и показан в поиске. Успешная валидация позволяет переносить авторитет веб-страницы на контент приложения (scoring proxy), подчеркивая важность единой контент-стратегии.

    Детальный разбор

    Термины и определения

    Native Application (Нативное приложение)
    Приложение, разработанное для конкретной ОС (например, Android, iOS) и работающее независимо от браузера.
    Resource Address (Адрес ресурса)
    Идентификатор веб-ресурса, например, URL веб-страницы.
    Portion Identifier (Идентификатор раздела/порции)
    Идентификатор в коде веб-ресурса, который определяет конкретный раздел контента (proper subset of content). Может быть реализован как HTML-фрагмент, атрибут (например, deeplinkid) или байтовый индекс.
    Native Application Partial Deep Link (Частичная глубокая ссылка нативного приложения)
    URI, который запускает нативное приложение и загружает конкретный контент, соответствующий только одному Portion Identifier на веб-странице, а не всей странице целиком.
    Mapping System (Система маппинга)
    Компонент поисковой системы, который идентифицирует и сохраняет связи между URL веб-разделов и URI приложений.
    Content Verification (Верификация контента)
    Процесс проверки того, что контент приложения, доступный по partial deep link, соответствует контенту соответствующего веб-раздела.
    Consistent Content (Консистентный контент)
    Контент, признанный совпадающим по результатам процессов сравнения (например, entity matching, n-gram similarity) при достижении порогового уровня (threshold level of consistency).
    Scoring Proxy (Прокси для оценки)
    Использование веб-ресурса и его сигналов ранжирования для оценки соответствующего контента в нативном приложении после успешной верификации консистентности.

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной метод идентификации и маппинга частичных глубоких ссылок.

    1. Система определяет, что веб-ресурс содержит множество portion identifiers и соответствующие им native application partial deep links.
    2. Каждый portion identifier идентифицирует уникальный подраздел контента (proper subset) на странице.
    3. Система генерирует маппинг (mapping), связывающий адрес ресурса с этими partial deep links, и сохраняет его в индексе (map index).
    4. Критическое условие реализации: Веб-ресурс при рендеринге в браузере отображает все идентифицированные подразделы контента. Однако, когда нативное приложение обрабатывает конкретную partial deep link, оно рендерит только соответствующий этой ссылке подраздел и не рендерит другие.

    Claim 6 (Зависимый): Детализирует процесс работы с веб-контентом.

    Система извлекает (capturing) и сохраняет контент, обозначенный конкретным portion identifier внутри веб-ресурса.

    Claim 7 (Зависимый): Описывает процесс верификации контента.

    Система идентифицирует контент, доступный через native application partial deep link в приложении, и определяет, что этот контент совпадает (matches) с контентом соответствующего раздела веб-ресурса (извлеченным на шаге Claim 6).

    Где и как применяется

    Изобретение является частью инфраструктуры App Indexing и затрагивает несколько этапов поиска.

    CRAWLING – Сканирование и Сбор данных
    Краулеры сканируют веб-ресурсы и обнаруживают в коде (например, в HTML HEAD) декларации partial deep links и связанные с ними portion identifiers.

    INDEXING – Индексирование и извлечение признаков
    Основной этап работы системы. Mapping System обрабатывает данные:

    1. Генерация маппинга: Создаются и сохраняются Mapping data.
    2. Извлечение контента: Контент извлекается из веб-разделов (используя portion identifiers) и из экранов приложений (активируя partial deep links).
    3. Верификация контента (Content verification): Происходит сравнение контента.
    4. Валидация: При успешной верификации связь сохраняется в индексе.
    5. Расчет оценок: Валидация позволяет использовать веб-ресурс как scoring proxy для оценки контента приложения.

    RANKING / RERANKING – Ранжирование / Переранжирование
    Если система определяет, что подраздел веб-контента релевантен запросу, она проверяет Map Index. При наличии валидированной partial deep link и подходящего контекста пользователя (мобильное устройство, установленное приложение), система может предоставить ссылку на приложение вместо или вместе с веб-ссылкой.

    На что влияет

    • Типы контента: Влияет на индексацию контента нативных мобильных приложений (App SEO). Особенно актуально для сложных страниц, которые логически делятся на разделы (товары, рецепты, статьи с комментариями).
    • Ниши: Наиболее актуально для E-commerce, медиа, сервисов бронирования, где распространены нативные приложения, дублирующие функциональность сайта.
    • Устройства: Влияет на формирование выдачи на мобильных устройствах.

    Когда применяется

    • Триггеры активации (Индексация): Обнаружение краулером разметки App Indexing на веб-странице, содержащей portion identifiers и partial deep links.
    • Условия верификации: Контент приложения должен достичь порогового уровня консистентности (threshold level of consistency) с контентом соответствующего веб-раздела.
    • Триггеры активации (Поиск): Релевантность конкретного подраздела контента запросу и наличие валидированной связи в Map Index.

    Пошаговый алгоритм

    Процесс А: Маппинг и Верификация (Индексация)

    1. Сканирование и Идентификация: Система сканирует веб-ресурс и определяет наличие множества portion identifiers и соответствующих им partial deep links.
    2. Генерация маппинга: Создается предварительная карта соответствий.
    3. Извлечение веб-контента (Второй контент): Система извлекает контент из раздела веб-страницы, определенного portion identifier.
    4. Извлечение контента приложения (Первый контент): Система получает контент, предоставляемый приложением при доступе по соответствующей partial deep link (например, путем эмуляции и мониторинга данных).
    5. Сравнение и Верификация: Система определяет, являются ли первый и второй контент консистентными. Используются методы сравнения (entity matching, n-gram similarity, phrase matching, feature similarity).
    6. Валидация: Если достигнут пороговый уровень консистентности:
      • ДА: Пара адресов валидируется и сохраняется в индексе.
      • НЕТ: Пара не валидируется. Partial deep link не будет использоваться в поиске.

    Процесс Б: Использование в поиске (Ранжирование)

    1. Определение релевантности: Система определяет, что конкретная часть контента веб-ресурса релевантна запросу.
    2. Проверка маппинга: Система обращается к Map Index для поиска валидированной partial deep link.
    3. Выбор ссылки: Если ссылка найдена и контекст пользователя подходит, система выбирает эту ссылку.
    4. Предоставление результата: Partial deep link предоставляется пользователю в SERP.

    Какие данные и как использует

    Данные на входе

    • Структурные факторы: HTML-код веб-страницы. Система ищет декларации ссылок (например, <link rel=»alternate»>) и Portion Identifiers. В качестве идентификаторов могут выступать HTML-атрибуты (например, id или deeplinkid, упомянутый в патенте), фрагменты (fragments) или байтовые индексы (byte indexes).
    • Контентные факторы: Текст, изображения и данные, содержащиеся строго внутри раздела веб-страницы, определенного Portion Identifier.
    • Технические факторы: URL веб-страницы и URI (Partial Deep Links) приложения.
    • Данные приложения: Контент, который отображается нативным приложением при активации Partial Deep Link. Этот контент извлекается системой для верификации.

    Какие метрики используются и как они считаются

    • Content Consistency (Консистентность контента): Ключевая метрика, определяющая степень совпадения между контентом приложения и веб-раздела.
    • Методы анализа и сравнения: Патент явно перечисляет методы, используемые для расчета консистентности:
      • entity matching (сопоставление сущностей).
      • n-gram similarity (сходство n-грамм).
      • phrase matching (сопоставление фраз).
      • feature similarity (сходство признаков).
    • Пороговые значения: Система использует threshold level of consistency. Маппинг валидируется, только если расчетная консистентность превышает этот порог.
    • Relevance Score (Оценка релевантности): Стандартные метрики ранжирования, применяемые к веб-контенту. Веб-контент используется как scoring proxy для контента приложения.

    Выводы

    1. Гранулярность маппинга Web-to-App: Google может сопоставлять контент не только на уровне целых страниц, но и на уровне отдельных разделов (proper subset) с помощью partial deep links. Это позволяет точнее связывать веб-сайт и приложение с разной архитектурой.
    2. Веб-контент как эталон для верификации: Контент веб-страницы используется как источник истины для валидации контента в нативном приложении. Консистентность (Consistent content) является обязательным условием для успешной индексации ссылок на приложение.
    3. Повышение точности верификации: Сравнение на уровне разделов (а не целых страниц) повышает точность content verification и снижает количество ложных срабатываний из-за различий в шаблонах и навигации.
    4. Веб-сигналы как прокси для ранжирования приложений (Scoring Proxy): Патент подтверждает, что успешная валидация позволяет использовать веб-ресурс как scoring proxy. Сигналы ранжирования веб-страницы могут влиять на ранжирование соответствующего контента приложения.
    5. Зависимость от реализации на стороне издателя: Функционирование системы зависит от того, внедрил ли издатель необходимую разметку (portion identifiers и partial deep links) в код веб-ресурса.

    Практика

    ВАЖНО: Практические выводы касаются только проектов, имеющих и веб-сайт, и нативное приложение, использующих стратегию App Indexing.

    Best practices (это мы делаем)

    • Обеспечение максимальной консистентности контента: Критически важно, чтобы контент в разделе веб-страницы и на соответствующем экране приложения был идентичен (семантически и фактически). Так как система использует entity matching и phrase matching для проверки, любые расхождения могут привести к провалу верификации.
    • Внедрение гранулярного маппинга (Partial Deep Links): Если веб-страница содержит несколько смысловых блоков (например, описание, отзывы, характеристики), используйте partial deep links для связи каждого блока с соответствующим экраном или состоянием в приложении.
    • Оптимизация веб-контента для ранжирования: Помните, что веб-страница используется как scoring proxy. Чтобы контент приложения хорошо ранжировался, соответствующая веб-страница должна быть качественно оптимизирована по всем стандартам SEO.
    • Использование четких идентификаторов на сайте: Убедитесь, что ключевые разделы контента на веб-странице имеют четкую HTML-структуру и уникальные идентификаторы (например, ID атрибуты), которые можно использовать как portion identifiers для маппинга.
    • Мониторинг статуса валидации: Регулярно проверяйте отчеты о валидации глубоких ссылок (например, в инструментах Firebase) и исправляйте ошибки, связанные с расхождением контента.

    Worst practices (это делать не надо)

    • Неконсистентный контент (Клоакинг через приложения): Показ разного контента на сайте и в приложении. Это будет обнаружено на этапе content verification, и маппинг не будет валидирован.
    • Маппинг всей страницы на неполный экран: Связывание целой веб-страницы с экраном приложения, который отображает только часть контента. Это может привести к провалу верификации из-за недостаточной консистентности.
    • Игнорирование технических требований к разметке: Некорректное указание portion identifiers или ошибок в URI глубоких ссылок приведет к тому, что система не сможет создать карту соответствия.

    Стратегическое значение

    Патент подтверждает стратегию Google по интеграции контента приложений в основной поиск, используя веб как фундамент. Веб-сайт выступает в роли доверенного источника данных о структуре и контенте приложения. Для SEO это означает, что веб-сайт и приложение должны разрабатываться в рамках единой контент-стратегии. Инвестиции в качество веб-контента напрямую влияют на видимость приложения, благодаря механизму scoring proxy.

    Практические примеры

    Сценарий: Индексация разделов страницы товара E-commerce

    1. Ситуация: Страница товара на сайте (example.com/productA) содержит разделы: Описание (#desc), Характеристики (#specs) и Отзывы (#reviews). В приложении это три разных экрана (URI: app://productA/desc, app://productA/specs, app://productA/reviews).
    2. Реализация: В HTML страницы добавляются декларации partial deep links, связывающие каждый веб-раздел с соответствующим URI приложения (используя, например, атрибут deeplinkid, как в патенте, или стандартные механизмы App Indexing).
    3. Действие Google: Система идентифицирует связи. Она извлекает контент из раздела #reviews на сайте и сравнивает его с контентом экрана /reviews в приложении. То же самое для описания и характеристик.
    4. Результат: Если контент совпадает, ссылки валидируются. Пользователь, ищущий «характеристики productA», может получить результат в поиске, который откроет приложение сразу на экране характеристик.

    Вопросы и ответы

    Что такое «Partial Deep Link» и чем он отличается от обычной глубокой ссылки?

    Обычная глубокая ссылка связывает веб-страницу целиком с одним экраном приложения. Partial Deep Link (частичная глубокая ссылка) обеспечивает более гранулярный маппинг: она связывает только конкретный раздел (portion) веб-страницы с соответствующим контентом в приложении. Это полезно, когда одна сложная веб-страница соответствует нескольким экранам в приложении.

    Зачем Google так строго верифицирует контент между приложением и сайтом?

    Верификация (Content verification) необходима для предотвращения манипуляций (например, клоакинга в приложениях) и гарантии качества поиска. Google должен быть уверен, что пользователь увидит в приложении тот же контент, что и на веб-странице. Кроме того, строгая верификация позволяет Google использовать веб-ресурс как scoring proxy.

    Что означает термин «Scoring Proxy» в этом патенте?

    Scoring proxy означает, что Google переносит сигналы ранжирования и оценки качества с веб-ресурса на соответствующий контент в нативном приложении. Это возможно только после подтверждения, что контент идентичен. Таким образом, оптимизация вашей веб-страницы напрямую влияет на ранжирование контента вашего приложения в поиске.

    Какие методы Google использует для сравнения контента сайта и приложения?

    Патент перечисляет конкретные методы для определения консистентности: entity matching (сопоставление сущностей), n-gram similarity (сходство n-грамм), phrase matching (сопоставление фраз) и feature similarity (сходство признаков). Это указывает на глубокий семантический и текстуальный анализ контента.

    Что произойдет, если контент на сайте и в приложении не совпадает?

    Если система определяет, что контент не достигает порогового уровня консистентности (threshold level of consistency), то связь между URL и URI не валидируется. В результате поисковая система не будет показывать ссылку на приложение в результатах поиска для этого контента, что приведет к потере трафика на приложение из поиска.

    Что такое «Portion Identifier» и как его реализовать на сайте?

    Portion Identifier — это механизм для обозначения конкретного раздела контента. Технически это может быть реализовано через стандартные HTML атрибуты id (например, <div id=»reviews»>), фрагменты URL (#reviews). В патенте также упоминается пример специального атрибута deeplinkid.

    Влияет ли этот патент на ранжирование веб-страниц, если у меня нет приложения?

    Нет, прямого влияния нет. Механизм предназначен исключительно для индексации и показа контента нативных приложений. Однако, патент демонстрирует способность Google идентифицировать и обрабатывать отдельные блоки контента на странице (portion identifiers), что концептуально схоже с другими технологиями гранулярного анализа контента.

    Как система получает контент из нативного приложения для сравнения?

    Патент упоминает, что система может эмулировать выполнение нативного приложения и отслеживать получаемые данные. Также могут использоваться инструментированные средства для опроса обработчиков текста и представлений (text handlers, view handlers) приложения для извлечения отображаемого текста и изображений.

    Почему верификация по части страницы лучше, чем верификация всей страницы?

    Веб-страницы и приложения часто имеют разную навигацию и шаблоны. При сравнении всей страницы эти различия могут привести к ложному выводу о несоответствии. Верификация по части страницы (proper subset) позволяет сфокусироваться только на основном контенте, игнорируя различия в оформлении, что повышает надежность процесса и снижает количество ошибок валидации.

    Применим ли этот механизм к Progressive Web Apps (PWA)?

    Нет. Патент строго фокусируется на native applications (нативных приложениях), которые работают независимо от браузера и специфичны для ОС. PWA относятся к приложениям на базе браузера и используют стандартные веб-URL, поэтому данный механизм маппинга и верификации для них не требуется.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.