Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)

DEEP LINKS FOR NATIVE APPLICATIONS (Глубокие ссылки для нативных приложений)

US10073911B2
Google LLC
2015-06-25
2018-09-11

Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.

Какую проблему решает

Патент решает проблему сложности обнаружения и индексации контента, находящегося внутри нативных мобильных приложений (native applications). В отличие от веб-сайтов, где краулеры могут легко анализировать HTML и переходить по ссылкам, нативные приложения не имеют стандартной структуры ссылок и часто не связаны друг с другом. Это затрудняет для поисковых систем обнаружение deep links (ссылок на конкретные страницы внутри приложения), их индексацию и показ в результатах поиска.

Что запатентовано

Запатентована система и метод для автоматического генерирования глубоких ссылок нативных приложений и индексации контента, полученного по этим ссылкам. Система использует два основных подхода: 1) Для приложений, аффилированных с веб-сайтами и использующих веб-URL, система валидирует связь и использует существующие URL для индексации. 2) Для приложений с кастомными URI система применяет итеративный процесс обнаружения ссылок, запуская приложение в эмулируемой среде и извлекая исходящие ссылки с каждой страницы приложения.

Как это работает

Механизм работы зависит от типа приложения:

Приложения, связанные с сайтом (Web-affiliated): Система получает данные об аффилиации от издателя. Затем она анализирует манифест приложения (Application Manifest), чтобы определить шаблон URI (URI pattern), включая схему (например, http), хост (домен) и путь. Если шаблон URI в приложении совпадает с данными издателя, система считает приложение аффилированным. Далее она выбирает уже известные веб-URL, соответствующие этому шаблону, и индексирует контент приложения, доступный по этим URL.
Приложения с кастомными URI: Система определяет базовый шаблон URI. Она запускает приложение в эмулируемой среде (virtual machine), начиная с первого URI (например, главной страницы). Система извлекает исходящие ссылки (outbound URIs) с этой страницы, генерирует следующие страницы по этим ссылкам и повторяет процесс итеративно, пока не обнаружит весь доступный контент.

В обоих случаях для извлечения контента могут использоваться extractors в виртуальной машине, которые перехватывают данные (текст, изображения), передаваемые процессу рендеринга приложения.

Актуальность для SEO

Высокая. Индексация мобильных приложений (известная как Firebase App Indexing или Google App Indexing) является важной частью стратегии Google по предоставлению пользователям релевантного контента независимо от платформы. Хотя техническая реализация могла эволюционировать (например, больший фокус на API Firebase), базовые принципы, описанные в патенте — верификация аффилиации, использование веб-URL и итеративное обнаружение ссылок — остаются фундаментальными для интеграции контента приложений в поиск.

Важность для SEO

Патент имеет высокое значение (75/100) для SEO и ASO (App Store Optimization). Он описывает инфраструктуру, которая позволяет контенту из приложений ранжироваться в мобильном поиске наравне с веб-страницами. Понимание этих механизмов критически важно для разработчиков и маркетологов, стремящихся увеличить видимость своего приложения и вовлеченность пользователей через органический поиск. Патент подчеркивает необходимость технической реализации поддержки глубоких ссылок (Deep Linking) и верификации связи между сайтом и приложением.

Термины и определения

Application Crawling And Indexing System (Система сканирования и индексации приложений): Компонент поисковой системы, отвечающий за обнаружение глубоких ссылок, доступ к контенту внутри приложений и его индексацию.
Application Manifest (Манифест приложения): Файл (например, AndroidManifest.xml), содержащий метаданные о приложении, включая поддерживаемые шаблоны URI (схему, хост, путь).
Application Page (Страница приложения): Конкретная среда отображения внутри нативного приложения, в которой показывается контент (текст, изображения). Отличается от веб-страницы тем, что генерируется внутри приложения, специфичного для операционной системы.
Deep Links (Глубокие ссылки): Ссылки на конкретные страницы контента (Application Pages) внутри приложения, в отличие от ссылок на главную страницу приложения.
Extractors (Экстракторы): Компоненты в виртуальной машине, которые извлекают данные контента (текст, изображения, списки) для индексации. Они перехватывают данные, предоставляемые процессу рендеринга приложения (например, объекты TextView в Android).
Native Application (Нативное приложение): Приложение, разработанное специально для работы на определенной операционной системе и аппаратном обеспечении устройства, работающее независимо от браузера.
Publisher Affiliation Data (Данные об аффилиации издателя): Данные, предоставляемые издателем, которые определяют связь между издателем (например, доменом сайта) и нативным приложением.
Synchronized Content (Синхронизированный контент): Контент, который доступен для представления как на веб-ресурсах, так и на соответствующих страницах нативного приложения.
URI Pattern (Шаблон URI): Структура, определяющая формат адресов контента в приложении. Может соответствовать веб-URL (http://example.com/path) или быть кастомным (app://content/id).
Virtual Machine (Виртуальная машина): Эмулируемая среда операционной системы, используемая системой индексации для запуска нативного приложения и доступа к его контенту с помощью экстракторов.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает процесс индексации для приложений, связанных с веб-сайтами.

Система получает Publisher Affiliation Data, связывающие приложения с издателями.
Для каждого приложения система определяет, аффилировано ли оно с издателем, который предоставляет контент по URL, также используемым как URI приложения. Это определение включает:
1. Определение URI Pattern для приложения.
2. Проверку, совпадает ли издатель, определенный в URI Pattern (например, по имени хоста/домену), с издателем, указанным в Publisher Affiliation Data. Совпадение имени хоста URI с доменом издателя приводит к положительному результату.
Только для приложений, которые определены как аффилированные:
1. Система выбирает URI (которые являются URL хоста издателя) на основе URI Pattern приложения. Выбираются URL, которые начинаются с этого шаблона.
2. Система индексирует контент, доступный по этим URI для нативного приложения, в поисковом индексе.

Ядро изобретения здесь — строгая проверка аффилиации перед тем, как разрешить приложению индексировать контент, связанный с определенным доменом. Это предотвращает индексацию контента через неавторизованные приложения.

Claim 6 (Зависимый от 1, но описывает альтернативный метод выбора URI): Детализирует итеративный процесс обнаружения ссылок (который может применяться, если URI не выбираются из существующего веб-индекса, как описано в Claim 4 и 5).

Приложение запускается, и выбирается первый URI на основе URI Pattern для генерации первой страницы приложения.
Запускается итеративный процесс:
1. Определяются исходящие URI (outbound URIs) с текущей страницы приложения.
2. Один или несколько исходящих URI выбираются для генерации последующих страниц приложения.

Этот пункт описывает механизм, схожий с веб-краулингом, но применяемый внутри среды нативного приложения для обнаружения контента.

Где и как применяется

Изобретение применяется на этапах сбора данных и индексации для создания индекса контента приложений.

CRAWLING – Сканирование и Сбор данных

Это основной этап применения патента. Application Crawling And Indexing System выполняет несколько функций:

Сбор данных об аффилиации: Получение Publisher Affiliation Data.
Анализ пакетов приложений: Сканирование манифестов приложений (Application Manifest) для извлечения шаблонов URI.
Выбор URI (Метод 1): Для аффилированных приложений система выбирает подходящие URL из существующего веб-индекса.
Обнаружение URI (Метод 2): Для приложений с кастомными URI система запускает итеративный процесс краулинга внутри приложения.
Рендеринг и Извлечение: Система запускает приложение в Virtual Machine и использует Extractors для сбора контента (текста, изображений) со страниц приложения.

INDEXING – Индексирование и извлечение признаков

Извлеченный контент обрабатывается и сохраняется в индексе приложений (Application Index), который доступен для поиска. Также система использует данные из Веб-индекса (Web Index) для обнаружения URL, которые могут быть использованы как глубокие ссылки.

Входные данные:

Publisher Affiliation Data (связь домен-приложение).
Пакеты нативных приложений и их манифесты (Application Manifest).
Существующий Web Index (для Метода 1).

Выходные данные:

Индексированные данные страниц приложений (Application Page data) в Application Index.
Связи между веб-URL и соответствующими им глубокими ссылками приложения.

На что влияет

Типы контента: Влияет на любой контент внутри мобильных приложений, который может быть проиндексирован (текст, изображения, списки). Особенно актуально для приложений с богатым контентом: новости, рецепты, базы данных (фильмы, музыка), e-commerce (товары).
Синхронизированный контент: Механизм напрямую нацелен на индексацию Synchronized Content, который дублируется на сайте и в приложении.
Форматы контента: Влияет на контент, который может быть извлечен с помощью Extractors (например, стандартные элементы интерфейса, такие как TextView, ImageView в Android).

Когда применяется

Алгоритм применяется во время планового сканирования и индексации приложений.

Условия активации (Метод 1 - Web-affiliated):

Издатель предоставил Publisher Affiliation Data.
Манифест приложения содержит URI Pattern (схему, хост).
URI Pattern приложения совпадает с данными аффилиации издателя (доменом).

Если аффилиация не подтверждена, URI издателя не обрабатываются для данного приложения.

Условия активации (Метод 2 - Итеративное обнаружение):

Приложение поддерживает глубокие ссылки (кастомные URI или веб-URL).
Система может успешно запустить приложение в Virtual Machine.
На страницах приложения присутствуют исходящие ссылки (outbound URIs), которые могут быть обнаружены системой.

Пошаговый алгоритм

Процесс А: Индексация аффилированных приложений (Web-affiliated)

Получение данных аффилиации: Система получает Publisher Affiliation Data, определяющие связь между издателями (доменами) и приложениями.
Анализ манифеста: Для нативного приложения извлекается URI Pattern (схема, хост, путь) из его манифеста.
Проверка аффилиации: Система сравнивает хост из URI Pattern приложения с доменом издателя из Publisher Affiliation Data.
Принятие решения:
- Если НЕ аффилировано: Не обрабатывать URI издателя для этого приложения. Процесс останавливается.
- Если Аффилировано: Перейти к шагу 5.
Выбор URI: Система ищет в Веб-индексе URL, которые соответствуют URI Pattern (например, начинаются с http://example.com/path/).
Сканирование контента приложения: Для выбранных URI система запускает приложение в виртуальной машине и передает URI приложению для генерации страницы.
Извлечение контента: Используя Extractors, система извлекает контент (текст, изображения) со сгенерированной страницы приложения.
Индексация: Извлеченный контент индексируется в Application Index и связывается с соответствующим URI.

Процесс Б: Итеративное обнаружение ссылок (Custom URIs или альтернатива Процессу А)

Определение шаблона URI: Система определяет базовый URI Pattern для приложения (например, из манифеста).
Инициализация: Система запускает нативное приложение в виртуальной машине и выбирает первый URI (например, главную страницу) для генерации первой страницы приложения.
Начало итерации.
Обнаружение исходящих ссылок: Система анализирует текущую страницу приложения для определения outbound URIs. Это может включать анализ извлеченного текста на соответствие URI Pattern или использование API индексации.
Выбор следующих URI: Система выбирает один или несколько обнаруженных исходящих URI для следующего шага сканирования.
Генерация и Индексация: Для выбранных URI генерируются следующие страницы приложения. Контент извлекается с помощью Extractors и индексируется.
Проверка завершения: Система проверяет, остались ли необработанные URI или достигнуто ли условие остановки.
- Если НЕТ (процесс продолжается): Вернуться к шагу 4 для новых страниц.
- Если ДА: Завершить индексацию для данного приложения.

Какие данные и как использует

Данные на входе

Патент фокусируется на инфраструктуре индексации и использует следующие типы данных:

Технические факторы:
- URL/URI структура: Критически важные данные. Используются URI Patterns, извлеченные из манифеста (схема, хост, префикс пути).
- Application Manifest Data: Используется для определения поддерживаемых приложением URI и проверки аффилиации.
Контентные факторы: (Извлекаются во время индексации)
- Текст: Извлекается с помощью текстовых Extractors (например, TextView) из страниц приложения.
- Изображения: Извлекаются с помощью графических Extractors (например, ImageView).
- Списки: Данные из прокручиваемых списков извлекаются с помощью соответствующих Extractors (например, ListView).
Структурные факторы:
- Внутренние ссылки приложения: Outbound URIs, обнаруженные на страницах приложения, используются для итеративного краулинга.
Внешние данные:
- Publisher Affiliation Data: Данные верификации от издателя, связывающие домен и приложение.
- Web Index: Существующий индекс веб-страниц используется для поиска кандидатов URL для сканирования аффилированных приложений.
Поведенческие факторы (Упоминаются опционально):
- Патент упоминает возможность использования API для отслеживания того, какие ссылки реально просматриваются пользователями внутри приложений. Эти данные могут использоваться как дополнительный источник ссылок и для определения популярности ссылок (link popularity) с целью приоритизации краулинга.

Какие метрики используются и как они считаются

Конкретные метрики ранжирования в патенте не описаны, но описаны метрики и процессы для индексации:

Проверка аффилиации (Affiliation Check): Бинарная проверка (Да/Нет). Основана на точном совпадении хоста из URI Pattern приложения и домена издателя из Publisher Affiliation Data.
Соответствие шаблону URI (URI Pattern Matching): Проверка, начинается ли веб-URL с шаблона URI, поддерживаемого приложением.
Link Popularity (Популярность ссылок) (Опционально): Метрика, основанная на данных о реальном использовании ссылок пользователями внутри приложения. Используется для приоритизации краулинга.

App Indexing требует технической реализации: Индексация контента приложений не происходит автоматически без соответствующей технической подготовки. Приложение должно поддерживать глубокие ссылки (либо через веб-URL, либо через кастомные URI), и эта поддержка должна быть корректно описана в манифесте приложения.
Верификация аффилиации критична для веб-контента: Google строго проверяет связь между доменом и приложением. Индексация контента сайта через приложение возможна только в том случае, если URI Pattern в манифесте приложения совпадает с верифицированным доменом издателя. Это защищает контент от индексации через сторонние приложения.
Два пути индексации: Система может либо использовать уже известные веб-URL для доступа к контенту приложения (если приложение аффилировано с сайтом), либо активно сканировать приложение изнутри, итеративно переходя по внутренним ссылкам (особенно актуально для приложений без сайтов или с уникальным контентом).
Метод извлечения контента (Эмуляция и Экстракторы): Google не просто анализирует скриншоты. Система запускает приложение в виртуальной машине и использует Extractors для перехвата данных (текст, изображения), передаваемых на рендеринг. Это означает, что индексируется именно то, что видит пользователь в стандартных элементах интерфейса.
Поведенческие данные для приоритизации: Патент предусматривает возможность использования данных о реальном поведении пользователей в приложении (популярность ссылок) для определения приоритетов сканирования. Это подчеркивает важность интеграции API индексации (например, Firebase App Indexing API) для передачи этих сигналов.

Best practices (это мы делаем)

Реализация Deep Linking: Убедитесь, что приложение поддерживает глубокие ссылки для всего важного контента. Для Android это означает настройку intent filters в AndroidManifest.xml для обработки HTTP URL (App Links) или кастомных схем URI.
Синхронизация контента сайта и приложения: Если приложение дублирует контент сайта, используйте те же самые HTTP URL для доступа к контенту в приложении. Это упрощает индексацию, так как Google может использовать уже известные веб-URL (Процесс А в патенте).
Верификация связи сайта и приложения: Обязательно подтвердите аффилиацию между сайтом и приложением. Для Android App Links это включает размещение файла Digital Asset Links (assetlinks.json) на веб-сайте. Это соответствует требованию патента о проверке Publisher Affiliation Data.
Использование стандартных элементов UI: Поскольку система использует Extractors, ориентированные на стандартные элементы интерфейса (например, TextView, ImageView), старайтесь использовать их для отображения основного контента. Это повышает вероятность корректного извлечения данных.
Интеграция App Indexing API (например, Firebase): Для приложений с кастомными URI или для улучшения обнаружения ссылок интегрируйте API индексации. Это позволяет явно указывать исходящие ссылки и передавать сигналы о действиях пользователей, что может улучшить приоритизацию сканирования (link popularity).

Worst practices (это делать не надо)

Блокировка доступа к контенту: Размещение всего важного контента за экраном обязательной авторизации (login wall) может помешать системе индексации получить доступ к страницам приложения.
Использование нестандартных или сложных интерфейсов: Использование кастомных движков рендеринга (например, в играх) или сложных интерактивных элементов (Flash, Canvas без текстового представления) для отображения основного контента может помешать работе Extractors.
Игнорирование Deep Linking: Разработка приложения как монолитной структуры без возможности адресации к конкретным экранам через URI делает индексацию контента невозможной.
Несоответствие URI на сайте и в приложении: Если приложение и сайт предоставляют одинаковый контент, но используют разные структуры URI, это усложняет для Google понимание связи между ними и может потребовать более ресурсоемкого итеративного сканирования вместо использования готовых веб-URL.

Стратегическое значение

Патент подтверждает важность концепции "App Indexing" как моста между вебом и нативными приложениями. Стратегически это означает, что SEO больше не ограничивается только веб-сайтами. Для бизнеса, имеющего мобильное приложение, интеграция его контента в поиск является ключевым каналом для привлечения новых пользователей и повторного вовлечения существующих. Понимание того, что Google готов эмулировать приложение и сканировать его изнутри, подчеркивает необходимость рассматривать архитектуру приложения с точки зрения доступности контента для поисковых систем.

Практические примеры

Сценарий 1: Индексация приложения интернет-магазина (Аффилированного с сайтом)

Задача: Обеспечить показ товаров из приложения в результатах поиска Google.
Действия (по Патенту):
- Разработчики настраивают манифест приложения так, чтобы он поддерживал URI Pattern, соответствующий сайту (например, http://www.example.com/product/).
- Маркетологи верифицируют связь между доменом example.com и приложением (Publisher Affiliation Data).
Процесс Google:
- Google проверяет аффилиацию. Она подтверждена.
- Google берет уже известные URL товаров из Веб-индекса (например, http://www.example.com/product/123).
- Google запускает приложение в виртуальной машине, передает ему этот URL.
- Приложение открывает страницу товара 123.
- Extractors извлекают название, описание, цену и изображение товара.
Результат: Контент товара индексируется. Когда пользователь ищет товар 123 на мобильном устройстве, в выдаче появляется глубокая ссылка, ведущая прямо в приложение.

Сценарий 2: Индексация контентного приложения без веб-сайта (Кастомные URI)

Задача: Проиндексировать статьи в приложении, у которого нет веб-версии.
Действия (по Патенту):
- Разработчики реализуют поддержку кастомных URI (например, myapp://article/456) и интегрируют App Indexing API для помощи в обнаружении ссылок.
Процесс Google:
- Google запускает приложение в виртуальной машине, начиная с главной страницы.
- Система обнаруживает исходящие ссылки на статьи (outbound URIs) на главной странице (с помощью API или анализа текста).
- Google переходит по ссылке myapp://article/456.
- Extractors извлекают текст статьи.
- Система итеративно ищет ссылки на другие статьи внутри текущей статьи.
Результат: Статьи индексируются, несмотря на отсутствие веб-сайта, благодаря итеративному процессу обнаружения.

Что такое "Native Application" в контексте этого патента?

Это приложение, разработанное специально для конкретной операционной системы (например, Android или iOS) и работающее независимо от веб-браузера. Патент проводит четкое различие между нативными приложениями и веб-ресурсами или приложениями, работающими внутри браузера.

Почему Google просто не сканирует приложения так же, как сайты?

Патент объясняет, что в отличие от сайтов, у приложений нет стандартного способа инспекции кода (как HTML) для поиска исходящих ссылок. Также приложения часто не ссылаются друг на друга, как это делают сайты, что затрудняет обнаружение контента. Поэтому требуются специальные методы, такие как использование веб-URL или эмуляция работы приложения.

Что такое "Extractors" и как они работают?

Extractors — это компоненты, работающие внутри виртуальной машины, где Google запускает приложение для индексации. Они предназначены для извлечения контента путем перехвата данных, передаваемых процессу рендеринга приложения. Например, вместо анализа изображения экрана они извлекают фактический текст из объектов типа TextView или данные изображения из ImageView. Это обеспечивает более точную индексацию контента.

Насколько важна верификация связи между сайтом и приложением?

Она критически важна. Патент подчеркивает (особенно в Claim 1), что система будет индексировать контент, связанный с определенным доменом, только через те приложения, которые доказали свою аффилиацию с владельцем этого домена. Это достигается путем сравнения URI Pattern в манифесте приложения с данными от издателя. Без верификации индексация по веб-URL не произойдет.

Может ли Google проиндексировать приложение, если у него нет веб-сайта?

Да. Патент описывает итеративный процесс обнаружения ссылок (Процесс Б). Система запускает приложение, начиная с главной страницы, обнаруживает исходящие ссылки на ней, переходит по ним и повторяет процесс. Это позволяет сканировать структуру приложения и индексировать контент, даже если он доступен только через кастомные URI и не имеет веб-аналогов.

Как Google определяет, какие глубокие ссылки сканировать в первую очередь?

Патент упоминает два механизма. Во-первых, для аффилированных приложений могут использоваться критерии популярности веб-URL. Во-вторых, система может использовать данные о том, какие ссылки реально просматриваются пользователями внутри приложения (link popularity), полученные через API индексации. Это позволяет приоритизировать краулинг на основе вовлеченности.

Влияет ли этот патент на ранжирование веб-страниц?

Напрямую нет. Патент описывает механизм индексации контента *внутри* приложений. Однако он влияет на общую видимость в SERP, позволяя глубоким ссылкам приложений конкурировать с веб-страницами за место в мобильной выдаче. Если контент приложения признан релевантным, он будет показан пользователю.

Что делать, если контент в приложении отображается через WebView (как встроенный браузер)?

Патент фокусируется на индексации контента нативных приложений. Контент, отображаемый через стандартный WebView, обычно рассматривается как веб-контент и индексируется стандартными веб-краулерами при сканировании соответствующего сайта. Описанные в патенте механизмы (Extractors, итеративное обнаружение) нацелены на контент, отображаемый нативными компонентами приложения.

Какие технические требования следуют из этого патента для разработчиков?

Ключевые требования — это реализация поддержки Deep Linking и корректная настройка манифеста приложения (например, intent filters в Android). Приложение должно быть способно обработать URI и отобразить соответствующий контент. Также рекомендуется использовать стандартные элементы UI для отображения контента, чтобы облегчить работу Extractors.

Как этот патент связан с Android App Links или Firebase App Indexing?

Этот патент описывает базовую инфраструктуру и логику, лежащую в основе этих технологий. Android App Links — это реализация механизма использования веб-URL (HTTP) в качестве глубоких ссылок с обязательной верификацией аффилиации (Процесс А). Firebase App Indexing API предоставляет инструменты для помощи в итеративном обнаружении ссылок и передачи сигналов о поведении пользователей, как описано в патенте.

Как Google индексирует контент внутри мобильных приложений и формирует сниппеты для App Deep Linking

Google использует виртуальную машину для запуска и рендеринга нативных мобильных приложений с целью извлечения контента, отображаемого на экранах (Application Pages). Система также анализирует установочный пакет приложения (Application Package File) для извлечения иконки и отображаемого имени. Эти данные объединяются для создания информативных результатов поиска (Deep Links), ведущих непосредственно на конкретный контент внутри приложения.

US9881095B2
2018-01-30

Индексация
SERP

Как Google сканирует, индексирует и ранжирует контент внутри мобильных приложений для показа в поиске (App Indexing)

Google использует виртуальные машины для эмуляции мобильных операционных систем (например, Android). В этой среде запускаются нативные приложения, и система извлекает текст, изображения и структуру непосредственно из процесса рендеринга контента. Это позволяет индексировать внутренние страницы приложений и показывать их в результатах поиска вместе с веб-страницами, реализуя механизм Deep Linking.

US9002821B2
2015-04-07

Индексация
Краулинг
SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений

Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.

US9645980B1
2017-05-09

Индексация
Ссылки
Техническое SEO

Как Google индексирует контент внутри мобильных приложений для показа в результатах поиска (App Indexing)

Google использует механизм для индексации контента, который пользователи просматривают в нативных мобильных приложениях. Система получает данные о просмотренном контенте и deep links напрямую от приложения на устройстве. Эта информация сохраняется в индексе (персональном или публичном) и используется для генерации результатов поиска, позволяя пользователям переходить к контенту внутри приложений напрямую из поисковой выдачи.

US10120949B2
2018-11-06

Индексация
SERP
Персонализация

Как Google индексирует внутренний контент мобильных приложений с помощью виртуальных машин и скрытого текста (App Indexing)

Google использует систему для индексации контента внутри нативных мобильных приложений, который ранее был недоступен для поиска. Система запускает приложение в виртуальной машине, эмулирующей операционную систему устройства, переходит к конкретным экранам или состояниям (environment instances) и извлекает описательные данные. Ключевой особенностью является извлечение текстовых данных, которые разработчики встраивают специально для поисковых систем, но которые не видны пользователю при обычном использовании приложения.

US9135346B2
2015-09-15

Индексация
Техническое SEO

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска

Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.

US8131754B1
2012-03-06

Поведенческие сигналы
Персонализация
Семантика и интент

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи

Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.

US10579687B2
2020-03-03

SERP
Семантика и интент
Ссылки

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами

Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.

US8032820B1
2011-10-04

Ссылки
Индексация
Краулинг

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске

Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).

US8498984B1
2013-07-30

SERP
Поведенческие сигналы

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL

Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.

US20140280133A1
2014-09-18

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов

Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.

US8682892B1
2014-03-25

Ссылки
EEAT и качество
SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи

Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).

US9298777B2
2016-03-29

Персонализация
Поведенческие сигналы
SERP

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов

Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.

US6941293B1
2005-09-06

Семантика и интент
Ссылки

Как Google обрабатывает клики по ссылкам на мобильные приложения (App Deep Links) в результатах поиска

Google использует механизм клиентской обработки результатов поиска, ведущих в нативные приложения. Если у пользователя не установлено нужное приложение, система на устройстве автоматически подменяет ссылку приложения (App Deep Link) на эквивалентный веб-URL. Это гарантирует доступ к контенту через браузер и обеспечивает бесшовный пользовательский опыт.

US10210263B1
2019-02-19

Ссылки
SERP

Как Google генерирует интерактивные и иерархические Sitelinks на основе структуры и популярности разделов сайта

Google анализирует навигационную иерархию сайта (DOM), популярность ссылок и глубину разделов для создания интерактивного представления ресурса (расширенных Sitelinks) в SERP. Это позволяет пользователям просматривать ключевые категории и вложенные ссылки через интерфейс вкладок, не покидая страницу результатов поиска.

US9348846B2
2016-05-24

Структура сайта
SERP
Ссылки