SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google индексирует внутренний контент мобильных приложений с помощью виртуальных машин и скрытого текста (App Indexing)

INDEX DATA FOR NATIVE APPLICATIONS (Индексные данные для нативных приложений)
  • US9135346B2
  • Google LLC
  • 2013-06-07
  • 2015-09-15
  • Индексация
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует систему для индексации контента внутри нативных мобильных приложений, который ранее был недоступен для поиска. Система запускает приложение в виртуальной машине, эмулирующей операционную систему устройства, переходит к конкретным экранам или состояниям (environment instances) и извлекает описательные данные. Ключевой особенностью является извлечение текстовых данных, которые разработчики встраивают специально для поисковых систем, но которые не видны пользователю при обычном использовании приложения.

Описание

Какую проблему решает

Патент решает проблему недоступности контента внутри нативных мобильных приложений (native applications) для традиционных поисковых систем. В отличие от веб-страниц, контент внутри приложений, особенно графически насыщенных (например, игр или 3D-туров), часто не содержит видимого текста для индексации. Ранее поиск мог полагаться только на внешние метаданные (например, описание в App Store). Изобретение позволяет поисковой системе понять содержание конкретных экранов или функций (environment instances) внутри приложения и оценивать их релевантность запросам.

Что запатентовано

Запатентована система и метод для генерации индексных данных для конкретных состояний (environment instances) нативного приложения. Суть изобретения заключается в механизме извлечения текстовых данных, которые описывают контент этого состояния, но при этом не отображаются пользователю (invisible textual data). Эти скрытые данные, предоставленные разработчиком специально для индексации, извлекаются (часто с помощью виртуальной машины), обрабатываются и сохраняются в поисковом индексе (Application Index), позволяя поисковой системе предлагать пользователям глубокие ссылки (deep links) на конкретный контент внутри приложений.

Как это работает

Система работает следующим образом:

  • Идентификация контента: Определяются конкретные environment instances внутри приложения, часто с помощью набора URI (Uniform Resource Identifiers), предоставленных издателем.
  • Эмуляция: Система запускает Application Indexer, который создает виртуальную машину (Virtual Machine), эмулирующую операционную систему мобильного устройства.
  • Рендеринг: Нативное приложение запускается внутри виртуальной машины, и система переходит к целевому environment instance (используя URI).
  • Извлечение скрытого текста: Специальные экстракторы (Extractors) перехватывают текстовые данные, переданные процессу рендеринга, но помеченные как невидимые для пользователя. Например, это может быть текстовый объект (text view object), наложенный на графический контент (OpenGL surface view), но с атрибутом невидимости.
  • Индексация: Извлеченные данные используются для описания контента и индексируются в Application Index, который затем используется поисковой системой.

Актуальность для SEO

Высокая. Этот патент описывает базовые технические принципы того, что стало известно как Google App Indexing (позже интегрировано в Firebase). Индексация контента приложений и возможность перехода по глубоким ссылкам из результатов поиска являются критически важными элементами современной мобильной экосистемы и стратегий ASO/SEO. Механизмы, описанные здесь, лежат в основе того, как Google интегрирует контент приложений в органический поиск.

Важность для SEO

Патент имеет высокое значение (85/100) для SEO и особенно для ASO (App Store Optimization). Он описывает механизм, который позволяет контенту из приложений ранжироваться в органическом поиске наряду с веб-результатами. Для компаний, чьи продукты или услуги представлены в мобильных приложениях, понимание этого механизма критично для обеспечения видимости их контента. Это напрямую влияет на стратегии разработки приложений, требуя интеграции специфических методов индексации для максимизации трафика из поиска.

Детальный разбор

Термины и определения

Application Index (Индекс приложений)
База данных, хранящая индексированные данные о контенте нативных приложений, в частности об их environment instances. Используется поисковой системой наряду с Web Index.
Application Indexer (Индексатор приложений)
Система, отвечающая за сканирование, рендеринг и извлечение данных из нативных приложений для построения Application Index.
Environment Instance (Экземпляр среды)
Конкретное состояние пользовательского интерфейса внутри нативного приложения, характеризующееся уникальным набором функций. Это может быть определенный экран, меню, уровень в игре, 3D-тур или последовательность действий.
Extractor (Экстрактор)
Компонент виртуальной машины (например, Text Extractor, Image Extractor), предназначенный для извлечения определенных типов данных из процесса рендеринга приложения.
Invisible Textual Data (Невидимые текстовые данные)
Текстовые данные, описывающие особенности environment instance, которые передаются в процесс рендеринга приложения, но помечены так, чтобы не отображаться на экране пользователя. Предназначены специально для индексации.
Native Application (Нативное приложение)
Приложение, разработанное специально для определенной операционной системы (например, iOS или Android), работающее независимо от браузера.
Uniform Resource Identifier (URI)
Идентификатор, который ссылается на конкретный environment instance внутри приложения (глубокая ссылка). Используется для навигации к контенту как при индексации, так и при переходе пользователя из результатов поиска.
Virtual Machine (Виртуальная машина)
Программная эмуляция операционной системы устройства. Используется для запуска и анализа нативного приложения в контролируемой среде для извлечения данных.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод индексации контента нативных приложений с использованием виртуальной машины и извлечением скрытого текста.

  1. Система определяет набор environment instances для нативного приложения. Это делается путем получения набора URI от издателя приложения.
  2. Для каждого environment instance система определяет описывающие его текстовые данные, которые не видны пользователю при рендеринге. Процесс определения этих данных включает:
    • Запуск виртуальной машины (VM), эмулирующей ОС устройства.
    • Запуск нативного приложения внутри VM.
    • Доступ к URI, соответствующему данному environment instance.
    • Генерация (рендеринг) environment instance в VM.
    • Извлечение текстовых данных, переданных процессу рендеринга, но идентифицированных как invisible textual data (т.е. не предназначенных для отображения).
  3. На основе извлеченных текстовых данных генерируются данные, описывающие контент.
  4. Эти данные индексируются в индексе, доступном для поиска поисковой системой.

Ядром изобретения является комбинация использования VM для рендеринга глубоких ссылок (URI) и специфического механизма извлечения текста, который был намеренно скрыт от пользователя, но предоставлен для индексации.

Claim 2 (Зависимый от 1): Описывает альтернативный вариант, где издатель предоставляет URI и сами текстовые данные, описывающие environment instance. Это может позволить системе получить данные без необходимости их извлечения через VM.

Claim 3 (Зависимый от 1): Уточняет техническую реализацию извлечения скрытого текста в VM.

Генерация environment instance включает создание первого графического представления (OpenGL surface view). Извлечение текста включает создание текстового объекта (text view object), содержащего текстовые данные, который накладывается поверх графического представления, и последующее извлечение данных из этого текстового объекта. Это подтверждает механизм "наложения" скрытого текста на графический контент для целей индексации.

Claim 4, 5 и 6 (Зависимые): Описывают функциональность результата поиска (Deep Linking).

Система генерирует результат поиска на основе индексированных данных (Claim 4). Результат поиска включает URI и изображение environment instance. Выбор результата пользователем приводит к запуску приложения и навигации к соответствующему контенту (Claim 5), либо к предложению установить приложение, если оно не установлено (Claim 6).

Где и как применяется

Изобретение затрагивает ключевые этапы поисковой архитектуры, обеспечивая возможность поиска внутри приложений.

CRAWLING – Сканирование и Сбор данных
Это основной этап применения патента. Application Indexer выполняет функцию краулера для нативных приложений. Вместо загрузки HTML используется Virtual Machine для запуска приложения и эмуляции взаимодействия с ним. Сбор данных происходит либо путем перехода по предоставленным издателем URI, либо путем автоматизированного исследования структуры приложения (automated process that explores various menus).

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит извлечение ключевой информации из отрендеренных environment instances. Ключевым процессом является извлечение invisible textual data с помощью Extractors. Также могут извлекаться видимый текст, изображения, видео и ссылки. Данные сохраняются в специализированном Application Index.

METASEARCH – Метапоиск и Смешивание
Поисковая система одновременно обращается к Web Index и Application Index. Результаты из обоих индексов (веб-страницы и глубокие ссылки на environment instances) смешиваются и предоставляются на единой странице результатов поиска (SERP).

Входные данные:

  • Нативное приложение (установочный файл).
  • Набор URI, предоставленный издателем (опционально).
  • Текстовые данные (видимые и невидимые), встроенные в приложение разработчиком.

Выходные данные:

  • Индексные данные (Index Data) для каждого environment instance, включающие извлеченный текст, URI (deep link), и, возможно, изображения или видео (скриншоты).
  • Application Index.

На что влияет

  • Типы контента: В первую очередь влияет на контент, доступный только через нативные приложения. Особенно актуально для графически насыщенных приложений, где мало видимого текста: игры (уровни, предметы), 3D-туры (локации), мультимедийные каталоги (товары, видео).
  • Специфические запросы: Позволяет приложениям ранжироваться по информационным и транзакционным запросам, на которые ранее могли отвечать только веб-страницы (например, запрос о товаре может вести сразу на карточку товара в приложении магазина).
  • Ниши: E-commerce, Travel, Gaming, Media – любые ниши, где нативные приложения являются основным каналом взаимодействия с пользователем.

Когда применяется

Алгоритм индексации применяется при обнаружении нового приложения или обновлении существующего.

  • Условия работы: Приложение должно быть доступно для запуска в эмулируемой среде. Для индексации конкретных environment instances они должны быть достижимы либо через автоматическое исследование, либо через предоставленные URI.
  • Триггеры активации: Разработчик должен внедрить механизм предоставления данных для индексации – либо через встраивание invisible textual data, либо через предоставление списка URI с соответствующими описаниями.

Пошаговый алгоритм

Процесс индексации нативного приложения (на примере использования VM):

  1. Инициализация VM: Application Indexer запускает виртуальную машину, эмулирующую целевую операционную систему устройства.
  2. Установка и запуск приложения: Нативное приложение устанавливается и запускается внутри виртуальной машины.
  3. Определение Environment Instances: Система определяет набор состояний для индексации.
    • Вариант А (Publisher-provided URIs): Система получает список URI от издателя и последовательно обращается к ним (основа Claim 1).
    • Вариант Б (Automated Exploration): Система автоматически исследует приложение, переходя по меню и ссылкам.
  4. Рендеринг Environment Instance: Виртуальная машина генерирует (рендерит) целевой environment instance.
  5. Извлечение данных (Extraction): Активируются экстракторы для сбора данных из процесса рендеринга:
    • Извлечение скрытого текста: Система перехватывает текстовые данные (например, из TextView объектов), которые были помечены как невидимые для пользователя.
    • Извлечение видимых данных: Система также может извлекать видимый текст, изображения или записывать короткие видеофрагменты взаимодействия.
  6. Генерация индексных данных: Извлеченные данные обрабатываются для формирования описания environment instance.
  7. Индексация: Сформированные данные, связанные с соответствующим URI (deep link) и идентификатором приложения, сохраняются в Application Index.

Какие данные и как использует

Данные на входе

Патент фокусируется на следующих типах данных, извлекаемых из приложения:

  • Контентные факторы (Скрытые): Invisible textual data. Это ключевой элемент патента. Текст, предоставляемый разработчиком для описания графического или интерактивного контента, который не отображается пользователю (например, ключевые слова, сниппеты).
  • Контентные факторы (Видимые): Упоминается возможность использования и видимого текста (rendered textual data), который отображается в интерфейсе.
  • Мультимедиа факторы: Image data и Video data. Система может извлекать изображения (скриншоты) или видеофрагменты environment instance для использования в результатах поиска.
  • Технические факторы: Uniform Resource Identifiers (URIs). Глубокие ссылки, используемые для доступа к конкретным environment instances.
  • Структурные факторы: В контексте автоматического исследования система анализирует структуру навигации приложения. Упоминается возможность создания карты приложения (native application map).

Какие метрики используются и как они считаются

Патент не описывает метрики ранжирования, а фокусируется на процессе индексации. Он описывает, какие данные собираются, но не как они взвешиваются поисковой системой.

Ключевые механизмы обработки данных:

  • Эмуляция и Рендеринг: Использование виртуальной машины для выполнения кода приложения.
  • Извлечение данных из объектов рендеринга: Технический метод доступа к данным внутри объектов интерфейса (например, TextView, ImageView) во время работы приложения в VM.
  • Обработка скрытого текста: Механизм отделения текста, предназначенного для индексации, от текста, предназначенного для отображения пользователю, на основе атрибутов видимости.

Выводы

  1. Индексация контента приложений – это реальность: Патент подтверждает, что Google разработал сложную инфраструктуру (виртуальные машины, специализированные экстракторы) для сканирования и индексации контента непосредственно внутри нативных приложений, аналогично тому, как индексируется веб.
  2. Критичность "Скрытого текста" для App SEO: Ключевой вывод – Google полагается на invisible textual data для понимания контента, особенно в графических приложениях. В отличие от веб-SEO, где скрытый текст часто считается манипуляцией, в контексте этого патента это основной легитимный механизм предоставления информации поисковой системе.
  3. Deep Linking (URI) как основа: Uniform Resource Identifiers являются основой для индексации конкретных состояний приложения. Наличие проработанной структуры URI внутри приложения необходимо для того, чтобы контент был проиндексирован и доступен из поиска.
  4. Техническая реализация имеет значение: Способ реализации интерфейса влияет на индексацию. Патент явно упоминает извлечение данных из стандартных объектов (TextView) и рендеринг на графических поверхностях (OpenGL surface view). Использование стандартных компонентов облегчает работу экстракторов.
  5. Интеграция App и Web в поиске: Система предназначена для смешивания результатов из Web Index и Application Index, что позволяет пользователям бесшовно переходить из поиска непосредственно в релевантный контент приложения. Это стирает границы между вебом и приложениями в контексте поиска информации.

Практика

Best practices (это мы делаем)

Для SEO/ASO специалистов, работающих с мобильными приложениями, этот патент диктует необходимость тесного взаимодействия с командой разработки для реализации App Indexing.

  • Внедрение App Indexing (Firebase): Необходимо реализовать поддержку индексации контента приложения. Это стратегический приоритет для обеспечения видимости в органическом поиске.
  • Оптимизация "Скрытого контента" для индексации: Для ключевых экранов (environment instances), особенно тех, где мало видимого текста, необходимо предоставлять системе индексации релевантные описательные данные. Согласно патенту, это реализуется через invisible textual data (на практике – через API индексации или атрибуты видимости для текстовых полей).
  • Разработка структуры глубоких ссылок (URI): Спроектировать логичную и масштабируемую схему URI для всех важных environment instances. Каждый уникальный фрагмент контента должен иметь свой URI.
  • Предоставление качественных метаданных: Убедиться, что данные, передаваемые для индексации (включая скрытый текст), точно описывают контент, содержат релевантные ключевые слова и привлекательные сниппеты. Патент упоминает, что издатель может предопределить сниппет для использования в поиске.
  • Использование стандартных компонентов интерфейса: Поощрять разработчиков использовать стандартные объекты (такие как TextView и ImageView), так как система индексации оптимизирована для извлечения данных из них.
  • Обеспечение стабильности приложения: Поскольку индексация включает запуск приложения в Virtual Machine, приложение должно работать стабильно. Ошибки и сбои могут помешать эффективной индексации контента.

Worst practices (это делать не надо)

  • Игнорирование App Indexing: Рассматривать приложение как изолированную среду, недоступную для поиска. Это приводит к потере значительного объема органического трафика.
  • Манипуляция скрытым текстом (Клоакинг): Предоставление в invisible textual data информации, которая не соответствует реальному контенту environment instance, с целью манипуляции ранжированием. Хотя патент описывает этот механизм как легитимный, злоупотребление им может привести к санкциям (система может верифицировать данные).
  • Отсутствие глубоких ссылок: Разработка приложения без структуры URI, что делает невозможным индексацию и навигацию к конкретному контенту.
  • Использование нестандартных графических движков без поддержки индексации: Полностью полагаться на кастомные графические решения, которые не предоставляют текстовые данные стандартным экстракторам ОС, и не компенсировать это предоставлением данных для индексации.

Стратегическое значение

Этот патент имеет фундаментальное стратегическое значение для мобильного поиска. Он демонстрирует техническое решение Google для преодоления разрыва между вебом и нативными приложениями. Стратегия SEO должна учитывать, что контент приложения является таким же объектом поиска, как и веб-страница. Долгосрочная стратегия требует интеграции процессов SEO и ASO, а также включения требований к индексации на самых ранних этапах проектирования и разработки приложений.

Практические примеры

Сценарий: Индексация товара в E-commerce приложении

  1. Задача: Обеспечить ранжирование карточки товара "Кроссовки Nike Air Max 2025" из мобильного приложения в поиске Google.
  2. Действия (Разработка и SEO):
    • Создается URI для товара: android-app://com.example.store/products/nike-air-max-2025.
    • На экране карточки товара (environment instance) разработчик размещает видимый текст (цена, название).
    • Для улучшения индексации, согласно патенту, добавляются invisible textual data (или данные передаются через API индексации). Эти данные содержат:
      • Keywords: Nike Air Max 2025, мужские кроссовки для бега, купить Air Max.
      • Snippet: Обзор новейших кроссовок Nike Air Max 2025. Доступные цвета и размеры. Бесплатная доставка в приложении Example Store.
  3. Процесс индексации: Application Indexer Google запускает приложение в VM, переходит по URI, рендерит карточку товара и извлекает видимые и невидимые текстовые данные.
  4. Ожидаемый результат: При поиске "купить Nike Air Max 2025" пользователь видит в SERP результат поиска с глубокой ссылкой. При клике открывается приложение Example Store сразу на карточке этого товара (или предлагается установка).

Вопросы и ответы

Что такое "Environment Instance" в контексте этого патента?

Это конкретный экран, состояние или функция внутри мобильного приложения. Например, это может быть карточка товара в магазине, страница профиля пользователя, конкретный уровень в игре или даже интерактивный 3D-тур. Каждый Environment Instance обычно имеет уникальный URI (глубокую ссылку), позволяющий системе индексировать его отдельно.

Патент описывает использование "скрытого текста" (invisible textual data). Разве это не запрещенный прием в SEO?

В традиционном веб-SEO использование скрытого текста часто считается манипуляцией. Однако в контексте индексации нативных приложений, как описано в этом патенте, это легитимный и основной механизм. Поскольку многие приложения (например, игры) графически насыщены и не содержат достаточно видимого текста, Google предлагает этот механизм как способ для разработчиков описать контент для поисковой системы.

Как именно система извлекает этот скрытый текст?

Система запускает приложение в виртуальной машине (Virtual Machine), эмулирующей ОС устройства. Когда приложение рендерит экран, оно передает данные в процесс рендеринга. Система индексации использует экстракторы (Extractors) для перехвата этих данных непосредственно из объектов интерфейса (например, TextView в Android), даже если эти объекты помечены как невидимые для пользователя.

Должны ли мы сами предоставлять Google список URI для индексации, или система найдет их автоматически?

Патент описывает оба варианта. Вы можете предоставить набор URI (set of uniform resource identifiers) для индексации (Claim 1), что гарантирует сканирование нужных разделов. Также система может использовать автоматизированный процесс исследования (automated exploration) внутри виртуальной машины. Рекомендуется использовать первый вариант для контроля над индексацией.

Как этот патент связан с Firebase App Indexing?

Этот патент описывает базовую технологию и инфраструктуру, которую Google разработал для индексации приложений. Firebase App Indexing является практической реализацией и инструментом (API), который разработчики используют для предоставления данных (URI и описательного текста) системе, описанной в патенте.

Что произойдет, если мы предоставим неверные данные в скрытом тексте?

Если данные в invisible textual data не соответствуют реальному контенту экрана, это может быть расценено как клоакинг. Патент упоминает возможность верификации данных (Verifier) либо с помощью виртуальной машины (сравнивая скрытый текст с видимыми элементами или другими сигналами), либо с помощью асессоров (human reviewers). Предоставление неточных данных рискованно.

Может ли система индексировать игры, созданные на Unity или других кроссплатформенных движках?

Патент не ограничивает типы приложений, но описывает механизм извлечения на примере стандартных компонентов ОС (например, TextView, OpenGL surface view). Если кроссплатформенный движок использует стандартные нативные компоненты для рендеринга или предоставляет данные через стандартные API индексации, система сможет их обработать. В противном случае индексация может быть затруднена.

Какие данные, кроме текста, может извлекать система?

Помимо видимого и невидимого текста, система может извлекать изображения (Image Extractor) и видео (Video Extractor). Это позволяет Google генерировать скриншоты или даже короткие видеопревью контента приложения для отображения непосредственно в результатах поиска, делая сниппет более привлекательным.

Что произойдет, если пользователь нажмет на результат поиска, но приложение у него не установлено?

Патент (Claim 6) предусматривает это. Если приложение не установлено на устройстве пользователя, выбор результата поиска приведет к предложению установить приложение. Обычно пользователя направляют на страницу приложения в соответствующем магазине (Google Play или App Store).

Влияет ли этот патент на ранжирование веб-сайтов?

Напрямую нет. Патент описывает индексацию контента для Application Index. Однако он влияет на общую видимость в мобильной выдаче. Если контент приложения будет признан высоко релевантным и займет высокую позицию в виде Deep Link, это может уменьшить видимость и трафик соответствующих веб-страниц на мобильных устройствах.

Похожие патенты

Как Google сканирует, индексирует и ранжирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует виртуальные машины для эмуляции мобильных операционных систем (например, Android). В этой среде запускаются нативные приложения, и система извлекает текст, изображения и структуру непосредственно из процесса рендеринга контента. Это позволяет индексировать внутренние страницы приложений и показывать их в результатах поиска вместе с веб-страницами, реализуя механизм Deep Linking.
  • US9002821B2
  • 2015-04-07
  • Индексация

  • Краулинг

  • SERP

Как Google индексирует контент внутри мобильных приложений и формирует сниппеты для App Deep Linking
Google использует виртуальную машину для запуска и рендеринга нативных мобильных приложений с целью извлечения контента, отображаемого на экранах (Application Pages). Система также анализирует установочный пакет приложения (Application Package File) для извлечения иконки и отображаемого имени. Эти данные объединяются для создания информативных результатов поиска (Deep Links), ведущих непосредственно на конкретный контент внутри приложения.
  • US9881095B2
  • 2018-01-30
  • Индексация

  • SERP

Как Google индексирует контент внутри мобильных приложений для показа в результатах поиска (App Indexing)
Google использует механизм для индексации контента, который пользователи просматривают в нативных мобильных приложениях. Система получает данные о просмотренном контенте и deep links напрямую от приложения на устройстве. Эта информация сохраняется в индексе (персональном или публичном) и используется для генерации результатов поиска, позволяя пользователям переходить к контенту внутри приложений напрямую из поисковой выдачи.
  • US10120949B2
  • 2018-11-06
  • Индексация

  • SERP

  • Персонализация

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google определяет момент полной загрузки мобильного приложения для его сканирования и индексации
Google использует систему для эффективного сканирования контента мобильных приложений (App Indexing). Вместо фиксированных таймаутов система отслеживает жизненный цикл активности, потребление памяти и сетевые запросы приложения в эмуляторе. Когда эти показатели стабилизируются, Google определяет, что приложение загружено, и начинает сканирование контента.
  • US9348671B1
  • 2016-05-24
  • Индексация

  • Краулинг

Популярные патенты

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение (Learning to Rank) для имитации оценок асессоров и улучшения ранжирования
Google использует технологию Learning to Rank для обучения статистических моделей, которые имитируют оценки человеческих асессоров. Модели анализируют объективные сигналы (статические и поведенческие) для пары запрос/документ и предсказывают, насколько релевантным этот документ сочтет человек. Эти прогнозы затем используются для ранжирования результатов поиска.
  • US8195654B1
  • 2012-06-05
  • Поведенческие сигналы

  • SERP

Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
  • US9098551B1
  • 2015-08-04
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов
Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.
  • US8001118B2
  • 2011-08-16
  • Поведенческие сигналы

  • SERP

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google вычисляет оценку качества сайта на основе соотношения брендового интереса и общего поискового трафика
Google использует поведенческие данные для расчета оценки качества сайта (Site Quality Score). Метрика основана на соотношении количества уникальных запросов, направленных конкретно на сайт (брендовый/навигационный интерес), к общему количеству уникальных запросов, которые привели пользователей на этот сайт. Высокий показатель этого соотношения свидетельствует о высоком качестве и авторитетности сайта.
  • US9031929B1
  • 2015-05-12
  • Поведенческие сигналы

  • EEAT и качество

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

seohardcore