SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google определяет момент полной загрузки нативного приложения для его сканирования и индексации (App Indexing)

MONITORING APPLICATION LOADING (Мониторинг загрузки приложения)
  • US9513961B1
  • Google LLC
  • 2014-04-02
  • 2016-12-06
  • Индексация
  • Краулинг
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для точного определения момента, когда нативное мобильное приложение полностью загрузило и отобразило контент. Система последовательно отслеживает завершение всех внешних сетевых запросов и состояние бездействия (idle) внутренних потоков приложения. Это гарантирует, что сканирование контента (App Indexing) начинается только тогда, когда экран приложения полностью сформирован.

Описание

Какую проблему решает

Патент решает техническую проблему, возникающую при индексации контента нативных приложений (Native Applications). Для корректного сканирования необходимо точно определить момент, когда приложение полностью загружено и отобразило финальный контент (sufficiently instantiated). Если сканирование начнется слишком рано, контент, загружаемый динамически (например, через API), может быть пропущен. Использование фиксированных тайм-аутов неэффективно, так как время загрузки приложений варьируется.

Что запатентовано

Запатентована система для автоматического и независимого от конкретного приложения определения его готовности к сканированию. Система использует двухэтапный подход: сначала отслеживается выполнение всех внешних запросов контента, инициированных приложением, а затем проверяется состояние бездействия (idle) ключевых внутренних потоков приложения (например, UI worker threads). Только при выполнении обоих условий инициируется сканирование.

Как это работает

Система работает в рамках инфраструктуры индексации приложений (App Indexing):

  • Эмуляция: Система запускает экземпляр приложения в эмуляторе операционной системы (OS Emulator), используя Deep Link для перехода к нужному экрану.
  • Мониторинг запросов: Компонент Request Monitor отслеживает все запросы к внешним серверам. Система ждет их выполнения (успех или тайм-аут).
  • Мониторинг потоков: После завершения сетевой активности компонент Thread Monitor проверяет состояние внутренних потоков приложения.
  • Определение готовности: Если потоки бездействуют (низкая утилизация CPU, нет активных IPC calls), система генерирует Load Signal.
  • Сканирование: Краулер (Data Extractor) получает сигнал и извлекает контент из финального состояния приложения.

Актуальность для SEO

Средняя. Патент описывает инфраструктуру для App Indexing. Хотя публичное отображение контента приложений в поиске Google было ограничено, Google продолжает индексировать контент приложений для внутренних сервисов (например, Google Assistant). Кроме того, описанный механизм определения готовности динамического контента остается фундаментально актуальным для любых систем рендеринга и индексации.

Важность для SEO

Влияние на традиционное веб-SEO низкое (2/10). Патент является инфраструктурным и не описывает факторы ранжирования или механизмы работы с веб-сайтами. Он полностью сосредоточен на индексации нативных мобильных приложений. Для специалистов по App SEO/ASO и разработчиков приложений патент важен, так как он объясняет, как производительность приложения и скорость загрузки напрямую влияют на способность Google успешно проиндексировать его внутренний контент.

Детальный разбор

Термины и определения

Deep Link (Глубинная ссылка)
Инструкция (например, URI), указывающая на конкретный экран (Environment Instance) внутри нативного приложения. Используется поисковой системой для запуска приложения в нужном состоянии для индексации.
Environment Instance (Экземпляр среды)
Конкретный экран или состояние отображения контента внутри нативного приложения. Специфичен для приложения и ОС, в отличие от веб-страницы в браузере.
Idle State (Состояние бездействия)
Состояние потока приложения, при котором он не выполняет активной работы (например, низкая утилизация процессора, пустая очередь сообщений).
IPC (Inter-process communication) Calls (Вызовы межпроцессного взаимодействия)
Механизмы обмена данными между потоками или процессами. Отслеживание их завершения используется для определения состояния бездействия.
Load Detector (Детектор загрузки)
Компонент, который анализирует данные от мониторов запросов и потоков и определяет, достаточно ли загружено приложение для сканирования.
Load Signal (Сигнал загрузки)
Сигнал, генерируемый Load Detector, указывающий на то, что приложение готово к сканированию.
Native Application (Нативное приложение)
Приложение, разработанное специально для конкретной операционной системы (например, Android, iOS) и работающее независимо от веб-браузера.
OS Emulator (Эмулятор ОС)
Среда, в которой запускается нативное приложение для его анализа и индексации в контролируемых условиях (на серверах Google).
Request Monitor (Монитор запросов)
Компонент, отслеживающий запросы контента, отправляемые приложением к внешним сервисам.
Thread Monitor (Монитор потоков)
Компонент, отслеживающий состояние внутренних потоков выполнения приложения.
UI Worker Threads (Рабочие потоки пользовательского интерфейса)
Потоки приложения, ответственные за обработку контента и его отображение в пользовательском интерфейсе. Их состояние критично для определения готовности контента.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения готовности приложения к сканированию, подчеркивая последовательность действий.

  1. Система запускает экземпляр Native Application на компьютере (в эмуляторе).
  2. Система отслеживает запросы контента к внешним серверам.
  3. Определяется, что каждый отслеживаемый запрос был выполнен (fulfilled).
  4. В ответ на выполнение всех запросов (и только после этого) система проверяет состояние набора потоков приложения.
  5. Если определено, что каждый поток бездействует (idle), генерируется Load Signal, указывающий на готовность к сканированию.
  6. В ответ на Load Signal система сканирует контент приложения.

Claim 2 (Зависимый от 1): Вводит опциональную задержку.

После завершения всех запросов система инициирует таймер (timer period). Проверка состояния потоков выполняется только после истечения этого таймера. Это дает приложению время на обработку только что полученных данных.

Claim 8 (Зависимый от 1): Определяет критерии выполнения запроса.

Запрос считается выполненным, если был получен контент ИЛИ если истекло время ожидания запроса (timed out). Это позволяет проводить индексацию по принципу "best efforts".

Claim 9 (Зависимый от 1): Уточняет метод определения бездействия через IPC.

Определение состояния бездействия включает мониторинг IPC calls. Если хотя бы один IPC-вызов не завершен, набор потоков считается активным (НЕ бездействующим).

Claim 10 и 11 (Зависимые от 1): Уточняют метод определения бездействия через UI.

Определение состояния бездействия включает проверку UI worker threads (Claim 10). Дополнительно может проверяться, пуста ли очередь сообщений (message queue) для этих потоков (Claim 11).

Где и как применяется

Изобретение является частью инфраструктуры сбора данных о нативных приложениях и применяется на начальных этапах поисковой архитектуры.

CRAWLING – Сканирование и Сбор данных
Это основная фаза применения патента. Описанная система (OS Emulator, Request Monitor, Thread Monitor, Load Detector) используется для запуска приложения по Deep Link и определения оптимального момента для начала сбора данных. Это позволяет системе адаптироваться к скорости загрузки конкретного приложения и гарантировать полноту сканирования.

INDEXING – Индексирование и извлечение признаков
Как только Load Signal сгенерирован, компонент Data Extractor (краулер) извлекает контент из текущего состояния приложения. Извлеченные данные передаются индексатору (Indexer) для сохранения в индексе приложений (Application Index).

Входные данные:

  • Нативное приложение (установочный файл).
  • Deep Link, указывающий на конкретный экран.
  • Системные данные из эмулятора: статус сетевых запросов, активность потоков (CPU utilization, IPC calls).

Выходные данные:

  • Load Signal (внутренний сигнал готовности).
  • Извлеченный контент финального состояния экрана приложения.

На что влияет

  • Конкретные типы контента: Патент влияет исключительно на индексацию контента внутри Native Applications (мобильных приложений для iOS/Android). Он не применяется к веб-сайтам, PWA или стандартным веб-ресурсам.
  • Специфические запросы: Влияет на возможность показа контента из приложений в ответ на любые типы запросов в рамках технологии App Indexing.

Когда применяется

  • Условия работы алгоритма: Алгоритм применяется в процессе сканирования и индексации контента нативного приложения поисковой системой.
  • Триггеры активации: Запуск процесса происходит, когда система обнаруживает новый Deep Link или решает обновить существующий контент в Application Index.

Пошаговый алгоритм

Процесс определения готовности приложения к сканированию.

  1. Инициализация: OS Emulator запускает экземпляр нативного приложения по заданному Deep Link. Активируются мониторы.
  2. Мониторинг сетевой активности: Request Monitor отслеживает все запросы контента к внешним сервисам.
  3. Определение завершения запросов: Система ожидает, пока все запросы не будут выполнены (получен контент или истек таймаут). Если есть незавершенные запросы, ожидание продолжается.
  4. (Опционально) Пауза для обработки: После завершения всех запросов система может выдержать короткую паузу (timer period).
  5. Мониторинг вычислительной активности: Thread Monitor начинает проверку статуса ключевых потоков (например, UI worker threads).
  6. Проверка условий бездействия: Система проверяет условия для определения состояния idle:
    • Завершены ли все отслеживаемые IPC calls?
    • Находятся ли UI worker threads ниже порогового уровня утилизации процессора?
    • Пуста ли очередь сообщений (message queue)?
  7. Определение состояния готовности: Если все проверки пройдены (сетевая активность завершена И потоки бездействуют), Load Detector определяет, что приложение готово.
  8. Генерация сигнала и сканирование: Генерируется Load Signal. Data Extractor приступает к сканированию контента.

Какие данные и как использует

Патент описывает инфраструктурный процесс и не использует стандартные SEO-факторы (контентные, ссылочные, поведенческие). Он использует исключительно системные данные о состоянии приложения.

Данные на входе

  • Технические факторы (Состояние сети): Статус исходящих запросов (ожидание, выполнено, ошибка, таймаут). Время отправки и получения ответа. Содержимое ответов.
  • Технические факторы (Состояние приложения):
    • Активность потоков (Threads status).
    • Утилизация процессора (Processor utilization) для отслеживаемых потоков.
    • Статус вызовов межпроцессного взаимодействия (IPC calls).
    • Состояние очереди сообщений (Message queue) для потоков UI.

Какие метрики используются и как они считаются

  • Request Fulfillment Status (Статус выполнения запроса): Бинарная метрика. Считается выполненным, если получен контент или произошел таймаут (Request Timeout).
  • IPC Call Fulfillment Status: Бинарная метрика. Вызов считается выполненным, когда получены ожидаемые возвращаемые значения.
  • Thread Idle Status (Статус бездействия потока): Определяется на основе:
    • Minimum Utilization Threshold: Пороговое значение утилизации процессора. Активность ниже порога интерпретируется как бездействие.
    • Message Queue Status: Пустая очередь является условием для определения состояния idle.
  • Overall Load Status (Общий статус загрузки): Финальная метрика готовности. Рассчитывается как логическое И: (Все запросы выполнены) И (Все ключевые потоки бездействуют).

Выводы

  1. Инфраструктурный фокус на App Indexing: Патент описывает исключительно инфраструктуру для сканирования нативных приложений. Он не дает практических выводов для традиционного веб-SEO.
  2. Динамическое определение загрузки: Google не полагается на фиксированное время ожидания. Используется динамический подход, который адаптируется к скорости работы конкретного приложения и сети, что повышает эффективность сканирования.
  3. Двухэтапная проверка готовности: Готовность определяется последовательной комбинацией двух групп сигналов: (1) завершение сетевой активности (внешние запросы) и (2) завершение внутренней обработки данных (бездействие потоков).
  4. Критерии бездействия (Idle State): Состояние готовности определяется через конкретные технические метрики: низкая утилизация CPU, отсутствие незавершенных IPC calls и пустые очереди сообщений UI-потоков.
  5. Устойчивость к ошибкам ("Best Efforts"): Механизм предусматривает обработку сетевых ошибок через таймауты (request timeout). Если сервер не отвечает, система может попытаться проиндексировать то, что успело загрузиться.
  6. Важность производительности для индексации: Производительность приложения (скорость загрузки и эффективность обработки) напрямую влияет на способность Google корректно его проиндексировать.

Практика

ВАЖНО: Патент является инфраструктурным и имеет практическое применение только для индексации нативных мобильных приложений (App Indexing). Он не относится к традиционному веб-SEO.

Best practices (это мы делаем)

Рекомендации для разработчиков приложений и специалистов по App SEO:

  • Оптимизация скорости загрузки данных: Контент, доступный по Deep Links, должен загружаться максимально быстро. Оптимизируйте серверные ответы (API), так как медленная загрузка увеличивает время индексации и риск ошибок.
  • Эффективное управление потоками UI: Убедитесь, что после загрузки и рендеринга основного контента UI worker threads переходят в состояние бездействия (idle). Избегайте длительных вычислений или сложной фоновой работы в главных потоках.
  • Стабильность Deep Links и API: Контент, запрашиваемый приложением, должен быть надежно доступен. Сетевые ошибки или недоступность API могут помешать успешной индексации.
  • Тестирование в эмуляторах: Тестируйте загрузку приложения по Deep Links в эмуляторах (подобных OS Emulator, который использует Google), чтобы оценить скорость загрузки и поведение потоков.

Worst practices (это делать не надо)

  • Постоянная высокая активность в UI-потоках: Сложные зацикленные анимации, постоянные обновления интерфейса или другие задачи, вызывающие высокую утилизацию CPU в UI worker threads после загрузки контента. Это не позволит Thread Monitor зафиксировать состояние idle.
  • Бесконечные или длительные сетевые соединения: Наличие постоянно активных сетевых запросов на экране, который должен быть проиндексирован, может помешать Request Monitor определить, что загрузка завершена.
  • Игнорирование ошибок сети: Если запросы часто завершаются ошибками или таймаутами, система может индексировать пустые или неполные экраны приложений (индексация "best efforts").

Стратегическое значение

Патент демонстрирует техническую сложность индексации динамического контента. Он подчеркивает, что Google использует сложные механизмы, основанные на мониторинге поведения приложения, для определения момента готовности контента. Стратегически это означает, что производительность (скорость загрузки данных и эффективность рендеринга) является необходимым условием для успешной индексации контента нативных приложений.

Практические примеры

Сценарий: Индексация рецепта в кулинарном приложении

Цель: Убедиться, что текст рецепта корректно индексируется при доступе через Deep Link.

Хорошая практика:

  1. Запуск: Google OS Emulator открывает Deep Link (например, app://recipes/123).
  2. Действия приложения: Приложение немедленно отправляет запрос к API для получения данных рецепта.
  3. Получение данных: API быстро отвечает. Request Monitor фиксирует завершение запроса.
  4. Обработка: UI worker threads отрисовывают текст и изображение, после чего переходят в режим ожидания (idle). Очередь сообщений пуста.
  5. Детекция Google: Thread Monitor фиксирует простой потоков.
  6. Результат: Генерируется Load Signal. Data Extractor сканирует полностью загруженный рецепт.

Плохая практика:

  • Действия приложения: Приложение при запуске начинает сложную фоновую синхронизацию всей базы данных пользователя, загружая CPU.
  • Результат: Даже после получения данных рецепта по API, Thread Monitor видит высокую активность потоков. Load Signal не генерируется до завершения синхронизации (или до истечения глобального тайм-аута), что замедляет индексацию или делает ее невозможной.

Вопросы и ответы

Влияет ли этот патент на ранжирование или индексацию моего веб-сайта?

Нет. Патент четко определяет область применения как Native Applications — приложения, работающие независимо от браузера (например, Android или iOS приложения). Он не распространяется на веб-сайты или веб-приложения (SPA/PWA), хотя общие принципы определения готовности динамического контента могут быть схожими.

Что именно означает, что поток приложения находится в состоянии бездействия (Idle State)?

Состояние бездействия определяется по нескольким техническим критериям. Согласно патенту, это включает низкую утилизацию процессора потоком (ниже определенного порога), завершение всех вызовов межпроцессного взаимодействия (IPC calls) и отсутствие сообщений в очереди обработки (message queue) для потоков пользовательского интерфейса (UI worker threads).

Почему недостаточно просто дождаться завершения всех сетевых запросов?

Завершение сетевых запросов означает лишь то, что данные были получены приложением. Приложению еще требуется время на обработку этих данных, их рендеринг и обновление пользовательского интерфейса. Именно поэтому система дополнительно проверяет активность потоков (Thread Monitor), чтобы убедиться, что обработка завершена и отображается финальное состояние контента.

Что произойдет, если мое приложение никогда не переходит в состояние простоя (idle)?

Если потоки приложения постоянно активны (например, из-за постоянной анимации, фоновой синхронизации или ошибок в коде), Thread Monitor не сможет определить момент завершения загрузки. Это может привести к тому, что Load Signal не будет сгенерирован, и контент приложения не будет просканирован или будет просканирован не полностью.

Как этот патент влияет на мою стратегию App Indexing?

Он подчеркивает важность технической оптимизации и производительности приложения. SEO-специалист должен донести до разработчиков, что быстрая загрузка контента по глубоким ссылкам и достижение четкого состояния простоя после рендеринга критичны для обеспечения индексируемости контента приложения.

Что такое "best efforts" индексация, упоминаемая в патенте?

Это подход, при котором система пытается проиндексировать контент, даже если не все условия выполнены идеально. Это реализуется через таймауты для сетевых запросов. Если внешний сервер не отвечает в течение определенного времени, запрос считается выполненным (по тайм-ауту), и система переходит к следующему этапу, пытаясь проиндексировать то, что успело загрузиться.

Какие потоки отслеживает Google?

Патент указывает, что особое внимание уделяется UI worker threads (рабочим потокам пользовательского интерфейса), поскольку они напрямую отвечают за обработку и отображение контента, который необходимо проиндексировать. Фоновые потоки, не связанные с UI, могут игнорироваться.

Зачем нужна опциональная задержка после выполнения сетевых запросов (Claim 2)?

Эта задержка (Timer Period) дает приложению время на обработку только что полученных данных. Сразу после получения ответа от сервера приложению может потребоваться время на парсинг данных и обновление UI. Проверка состояния потоков сразу после сетевого ответа может быть преждевременной.

Влияет ли этот механизм на ранжирование приложения в поиске?

Напрямую нет, так как патент не описывает факторы ранжирования. Он описывает только инфраструктурный процесс определения готовности к индексации. Однако, если из-за проблем с загрузкой контент не индексируется, приложение не сможет ранжироваться по соответствующим запросам в рамках App Indexing.

Где выполняется этот процесс — на устройстве пользователя или на серверах Google?

На серверах Google. Патент описывает использование OS Emulator, в котором Google запускает приложение для анализа и сканирования в контролируемой среде. Этот процесс не происходит на реальных устройствах пользователей.

Похожие патенты

Как Google определяет момент полной загрузки мобильного приложения для его сканирования и индексации
Google использует систему для эффективного сканирования контента мобильных приложений (App Indexing). Вместо фиксированных таймаутов система отслеживает жизненный цикл активности, потребление памяти и сетевые запросы приложения в эмуляторе. Когда эти показатели стабилизируются, Google определяет, что приложение загружено, и начинает сканирование контента.
  • US9348671B1
  • 2016-05-24
  • Индексация

  • Краулинг

Как Google автоматически обнаруживает и индексирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует систему для индексации контента нативных мобильных приложений. Для приложений, связанных с веб-сайтами, система проверяет аффилиацию и использует существующие веб-URL для доступа к контенту приложения. Для приложений с кастомными URI система эмулирует работу приложения и итеративно обнаруживает внутренние ссылки. Это позволяет контенту из приложений появляться в результатах поиска в виде глубоких ссылок.
  • US10073911B2
  • 2018-09-11
  • Индексация

  • Краулинг

  • Ссылки

Как Google индексирует контент внутри мобильных приложений и формирует сниппеты для App Deep Linking
Google использует виртуальную машину для запуска и рендеринга нативных мобильных приложений с целью извлечения контента, отображаемого на экранах (Application Pages). Система также анализирует установочный пакет приложения (Application Package File) для извлечения иконки и отображаемого имени. Эти данные объединяются для создания информативных результатов поиска (Deep Links), ведущих непосредственно на конкретный контент внутри приложения.
  • US9881095B2
  • 2018-01-30
  • Индексация

  • SERP

Как Google сканирует, индексирует и ранжирует контент внутри мобильных приложений для показа в поиске (App Indexing)
Google использует виртуальные машины для эмуляции мобильных операционных систем (например, Android). В этой среде запускаются нативные приложения, и система извлекает текст, изображения и структуру непосредственно из процесса рендеринга контента. Это позволяет индексировать внутренние страницы приложений и показывать их в результатах поиска вместе с веб-страницами, реализуя механизм Deep Linking.
  • US9002821B2
  • 2015-04-07
  • Индексация

  • Краулинг

  • SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений
Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.
  • US9645980B1
  • 2017-05-09
  • Индексация

  • Ссылки

  • Техническое SEO

Популярные патенты

Как Google рассчитывает тематический авторитет сайта для кастомизации поиска с помощью Topic-Sensitive PageRank
Патент Google, описывающий механизм кастомизации результатов поиска, инициированного со стороннего сайта (например, Google Custom Search). Система использует «профиль сайта» для повышения результатов, соответствующих его тематике. Ключевая ценность патента — детальное описание расчета тематической авторитетности (Topic Boosts) путем анализа ссылок с эталонных сайтов (Start Sites), что является реализацией Topic-Sensitive PageRank.
  • US7565630B1
  • 2009-07-21
  • Персонализация

  • SERP

  • Ссылки

Как Google персонализирует мобильную выдачу, повышая в ранжировании приложения, которые пользователь часто использует (Affinity Score)
Google рассчитывает «Affinity Score» для мобильных приложений на основе того, как часто и долго пользователь их использует (относительное вовлечение). При поиске с мобильного устройства система повышает в ранжировании результаты (deep links), ведущие в приложения с высоким Affinity Score, делая выдачу более персонализированной.
  • US10248698B2
  • 2019-04-02
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google переносит поведенческие сигналы через ссылки для повышения в ранжировании первоисточников контента
Google использует механизм для корректного учета поведенческих сигналов (например, времени пребывания). Если пользователь кликает на результат в выдаче, а затем переходит по ссылке на другую страницу, система может перенести позитивные сигналы с исходной страницы на целевую. Это позволяет повышать в рейтинге первоисточники информации, а не страницы-посредники.
  • US8959093B1
  • 2015-02-17
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует исторические паттерны CTR для предсказания сезонных и циклических изменений интента пользователя
Google анализирует исторические данные о кликах (CTR) для выявления предсказуемых изменений в интересах пользователей по неоднозначным запросам. Если интент меняется в зависимости от сезона, дня недели или времени суток, система корректирует ранжирование, чтобы соответствовать доминирующему в данный момент интенту. Например, по запросу "turkey" в ноябре приоритет получат рецепты, а не информация о стране.
  • US8909655B1
  • 2014-12-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google генерирует "Свежие связанные запросы" на основе анализа трендов и новостного контента
Google анализирует недавние поисковые логи, чтобы выявить запросы, демонстрирующие резкий рост популярности или отклонение от ожидаемой частоты. Эти "свежие" запросы проходят обязательную валидацию: они должны возвращать достаточное количество новостных результатов и иметь хорошие показатели вовлеченности (CTR). Это позволяет Google динамически обновлять блок "Связанные поиски", отражая актуальные события и тренды.
  • US8412699B1
  • 2013-04-02
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google определяет авторитетные сайты для конкретных тем, анализируя «гибридные запросы» пользователей
Google анализирует «гибридные запросы» (например, «back pain WebMD»), чтобы понять, какие сайты пользователи считают лучшими источниками информации по конкретным темам. Система создает карты соответствия между темами и авторитетными ресурсами. Эти данные используются для повышения релевантности авторитетных сайтов в выдаче по информационным запросам и для улучшения поисковых подсказок.
  • US9244972B1
  • 2016-01-26
  • EEAT и качество

  • Семантика и интент

  • SERP

Как Google итеративно распознает сущности на страницах и рассчитывает их важность с помощью PageRank
Google использует итеративный процесс для распознавания и устранения неоднозначности сущностей (людей, мест, понятий) в документах. Система начинает с известных фактов, находит упоминающие сущность документы, анализирует сопутствующие термины для уточнения модели распознавания и автоматически обнаруживает новые признаки. Патент также описывает расчет важности сущности путем суммирования PageRank ссылающихся документов, взвешенного на вероятность ссылки.
  • US8122026B1
  • 2012-02-21
  • Семантика и интент

  • Ссылки

  • Knowledge Graph

Как Google рассчитывает тематическую репутацию для выявления и наделения полномочиями экспертов-кураторов
Google описывает систему для тематических сообществ, где пользователи зарабатывают репутацию (Topical Reputation Score) на основе качества контента, которым они делятся в рамках конкретных тем. Достигнув порогового значения, пользователь «разблокирует» тему, получая права куратора и возможность управлять контентом других. Система использует механизм «Impact Scores» для оценки влияния действий кураторов на репутацию участников.
  • US9436709B1
  • 2016-09-06
  • EEAT и качество

  • Поведенческие сигналы

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

seohardcore