SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google позволяет вебмастерам обновлять структурированные данные в индексе по требованию, минуя стандартное сканирование

USER SUBMISSION OF SEARCH RELATED STRUCTURED DATA (Пользовательская отправка структурированных данных, связанных с поиском)
  • US20150112961A1
  • Google LLC
  • 2012-09-18
  • 2015-04-23
  • Индексация
  • Техническое SEO
  • Краулинг
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм, позволяющий авторизованным владельцам сайтов напрямую отправлять структурированные данные (например, цены, наличие товара) в поисковый индекс. Этот процесс происходит по требованию ("unscheduled update sequence"), значительно быстрее стандартного сканирования, и позволяет передавать приватные данные, недоступные публично на сайте.

Описание

Какую проблему решает

Патент решает две основные проблемы:

  • Задержки обновления данных: Зависимость от стандартного графика сканирования (scheduled crawling) приводит к тому, что актуальные структурированные данные (например, цены, наличие товара) попадают в индекс с опозданием.
  • Ограничение публичными данными: Стандартное сканирование не позволяет поисковой системе получить структурированные данные, которые владелец сайта не хочет или не может разместить на общедоступной веб-странице.

Что запатентовано

Запатентована система и метод, позволяющие авторизованному пользователю (verified user или authorized user) отправлять структурированные данные (search related structured data) для определенного URL напрямую в базу данных поисковой системы. Ключевая особенность — инициирование обновления записи URL во время «ранее незапланированной последовательности обновлений» (previously unscheduled update sequence), то есть по требованию (on-demand), минуя стандартный краулинг.

Как это работает

Система (Structured Data Association Engine) обрабатывает запросы от аутентифицированных пользователей двумя основными способами:

  • Прямая отправка (Push Model): Пользователь отправляет запрос (например, через HTTP POST или API), содержащий сами структурированные данные и целевой URL. Система принимает эти данные без сканирования страницы.
  • Целевое извлечение (Pull Model): Пользователь предоставляет private URL access key. Система использует этот ключ для доступа к специальной версии URL (например, добавляя ключ как параметр запроса), чтобы извлечь структурированные данные, которые могут быть недоступны при обычном сканировании.

Полученные данные дополняют (supplements) или заменяют (supplants) данные, полученные при стандартном сканировании (web crawl data). Данные также могут быть помечены ключом доступа (Access Key) для ограничения их использования в поиске.

Актуальность для SEO

Высокая. Механизмы обновления индекса по требованию критически важны в 2025 году, особенно для E-commerce и time-sensitive контента. Описанные в патенте принципы лежат в основе современных инструментов, таких как Google Indexing API (для быстрого обновления структурированных данных типа Jobs) и Google Merchant Center (прямая загрузка данных о товарах через фиды или Content API).

Важность для SEO

Патент имеет высокое значение (75/100) для технического и Enterprise SEO. Он описывает инфраструктуру, позволяющую вебмастерам активно управлять актуальностью своих структурированных данных в индексе Google, не дожидаясь краулера. Это напрямую влияет на видимость товаров, актуальность цен и отображение расширенных сниппетов (Rich Snippets), что является критическим фактором успеха в конкурентных нишах.

Детальный разбор

Термины и определения

Search related structured data (Структурированные данные, связанные с поиском)
Данные, относящиеся к документу, организованные в набор объектов с атрибутами. Упоминаемые форматы: PageMap, Microformats, RDFa, Microdata, meta tags.
Verified User / Authorized User (Верифицированный / Авторизованный пользователь)
Пользователь, подтвердивший право вносить изменения, связанные с URL (например, владелец сайта). Требуется аутентификация.
Previously unscheduled update sequence (Ранее незапланированная последовательность обновлений)
Обновление индекса по требованию пользователя, происходящее вне стандартного графика сканирования (scheduled crawling). Обеспечивает быстрое обновление.
Web crawl data (Данные веб-сканирования)
Данные, полученные поисковой системой путем стандартного сканирования общедоступного URL.
Private URL access key (Приватный ключ доступа к URL)
Ключ, предоставляемый пользователем системе. Используется для доступа к специальной версии URL, содержащей структурированные данные, которые могут быть невидимы без ключа (Метод Pull).
Access Key (Ключ доступа - на уровне базы данных)
Метка, ассоциируемая со структурированными данными в базе данных. Доступ к этим данным возможен только при предъявлении соответствующего ключа (например, для Custom Search Engine).
Indexing quota (Квота на индексирование)
Ограничение на количество или частоту отправок структурированных данных для URL, домена или пользователя.
Structured Data Association Engine
Компонент системы, отвечающий за прием, обработку и сохранение пользовательских структурированных данных.

Ключевые утверждения (Анализ Claims)

Патент содержит два ключевых независимых пункта (Claim 1 и Claim 10), описывающих разные аспекты механизма.

Claim 1 (Независимый пункт): Описывает метод прямой загрузки (Push).

  1. Система получает пользовательский запрос на ассоциацию структурированных данных с URL.
  2. Система получает эти данные от пользователя, причем данные принимаются без доступа к документу, на который указывает URL (т.е. без сканирования страницы).
  3. Система ассоциирует эти данные с записью URL в поисковой базе данных.
  4. Условие: по крайней мере часть данных дополняет (supplements) данные, полученные путем стандартного сканирования URL (web crawl data).

Claim 10 (Независимый пункт): Описывает метод обновления по требованию с авторизацией.

  1. Система получает от пользователя инструкцию по обновлению (update instruction), идентифицирующую URL и предоставляющую доступ к данным.
  2. Система получает данные аутентификации пользователя, подтверждающие его авторизацию.
  3. На основании авторизации система модифицирует соответствующую запись в базе данных.
  4. Условие: инструкция инициирует модификацию во время previously unscheduled update sequence (т.е. обновление по требованию).

Claim 6 и 13 (Зависимые): Уточняют возможность передачи приватных данных.

По крайней мере часть предоставленных пользователем структурированных данных недоступна (inaccessible) через стандартное сканирование URL.

Claim 16 и 17 (Зависимые от 10): Детализируют механизм извлечения (Pull).

URL может быть общедоступным URL, дополненным private access key. Данные, полученные через сканирование этого специального URL (с ключом), недоступны при сканировании общедоступного URL (без ключа).

Где и как применяется

Изобретение затрагивает этапы сбора данных и индексирования, предоставляя альтернативный конвейер данных.

CRAWLING – Сканирование и Сбор данных
Механизм позволяет обойти стандартное сканирование (при прямой загрузке - Push) или инициировать специализированное сканирование (при использовании private URL access key - Pull). Structured Data Association Engine выступает в роли приемника данных или специализированного краулера.

INDEXING – Индексирование и извлечение признаков
Основной этап применения. Structured Data Association Engine обрабатывает полученные данные и обновляет Content Database (поисковый индекс). На этом этапе происходит слияние: пользовательские данные могут дополнять (supplement) или заменять (supplant) существующие web crawl data. Также данным могут быть присвоены Access Keys для ограничения доступа.

RANKING / RERANKING – Ранжирование / Переранжирование
Поисковая система (Search Engine) использует эти обновленные структурированные данные для идентификации результатов, сортировки, фильтрации и формирования отображения результатов (например, Rich Snippets).

Входные данные:

  • Запрос на обновление (Update instruction).
  • Идентификатор URL.
  • Данные аутентификации пользователя.
  • Структурированные данные (при методе Push) ИЛИ Private URL access key (при методе Pull).

Выходные данные:

  • Обновленная запись URL в Content Database с актуальными структурированными данными.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние в E-commerce (цены, наличие), а также для сайтов с вакансиями (Jobs), событиями (Events) и рецептами. Влияет на ниши, где актуальность структурированных данных критична.
  • Специфические типы данных: В патенте упоминаются атрибуты total number of reviews (общее количество отзывов) и total number of downloads (общее количество загрузок) как примеры данных, которые могут быть отправлены этим методом, даже если они отсутствуют на странице.
  • Специализированный поиск: Влияет на Custom Search Engines (CSE), позволяя использовать приватные структурированные данные для улучшения поиска.

Когда применяется

  • Триггеры активации: Механизм активируется по явному запросу (user generated request или update instruction) от авторизованного пользователя.
  • Временные рамки: Применяется по требованию (unscheduled update sequence). Ассоциация происходит в течение предопределенного периода времени (predefined time period); в патенте приведен пример «менее 6 часов».
  • Условия и пороги: Применение ограничено квотами (indexing quota). Если квота превышена, запрос может быть отклонен или обработан с задержкой (например, первые запросы обрабатываются быстро, последующие медленнее).

Пошаговый алгоритм

Патент описывает два варианта реализации.

Вариант А: Прямая отправка данных (Push Model / Direct Submission)

  1. Аутентификация и Запрос: Авторизованный пользователь инициирует запрос на ассоциацию структурированных данных с URL.
  2. Передача данных: Пользователь отправляет структурированные данные (например, через HTTP POST) в Structured Data Association Engine. Система получает данные без сканирования целевого URL.
  3. Проверка квот: Система проверяет соблюдение indexing quota.
  4. Обработка и Ассоциация: Система обрабатывает данные и ассоциирует их с записью URL в Content Database в рамках unscheduled update sequence.
  5. Слияние данных: Новые данные сливаются с существующими web crawl data (дополнение или замена).
  6. (Опционально) Установка приватности: Если указан Access Key, данные помечаются для ограниченного доступа.

Вариант Б: Целевое извлечение (Pull Model / Private Key Crawl)

  1. Аутентификация и Запрос: Авторизованный пользователь отправляет update instruction и предоставляет private URL access key.
  2. Проверка квот: Система проверяет соблюдение indexing quota.
  3. Специализированное сканирование: Structured Data Association Engine обращается к целевому URL, используя предоставленный ключ (например, как параметр запроса).
  4. Получение данных: Сервер целевого URL, распознав ключ, отдает контент со структурированными данными (возможно, скрытыми от публичного доступа).
  5. Извлечение и Ассоциация: Система извлекает данные и ассоциирует их с записью URL в Content Database в рамках unscheduled update sequence.
  6. Слияние и Приватность: Данные сливаются с web crawl data и могут быть помечены Access Key.

Какие данные и как использует

Данные на входе

Патент фокусируется на механизме передачи данных.

  • Структурные факторы (Основной ввод): Система принимает search related structured data. Упоминаемые форматы: PageMap (основной пример в патенте), meta tags, Microformats, RDFa, Microdata. Примеры атрибутов: title, review, publication date.
  • Пользовательские факторы (Аутентификация): Данные для верификации пользователя (user authentication data), например, токен аутентификации.
  • Технические данные (Ключи доступа):
    • Private URL access key: Для доступа к специальной версии URL (Метод Pull).
    • Access Key: Для маркировки данных в индексе как приватных.

Какие метрики используются и как они считаются

Патент не описывает метрики ранжирования, но упоминает операционные метрики:

  • Indexing quota (Квота на индексирование): Предопределенное количество отправок за период времени. Система отслеживает использование квот для управления нагрузкой.
  • Predefined time period (Предопределенный период времени): Гарантированное время обработки запроса (например, менее 6 часов).
  • Уникальные атрибуты (Unique attribute type): Примеры данных, которые могут быть переданы этим методом и отсутствовать в web crawl data:
    • total number of reviews (общее количество отзывов).
    • total number of downloads (общее количество загрузок).

Выводы

  1. Индексирование по требованию (On-Demand Indexing): Google имеет инфраструктуру для приема структурированных данных напрямую от вебмастеров, позволяя обновлять индекс по требованию (unscheduled update sequence), минуя стандартное сканирование.
  2. Приоритет скорости: Система спроектирована для быстрого обновления критически важных данных в течение предопределенного периода времени (например, часов, а не дней).
  3. Поддержка приватных данных: Патент явно предусматривает индексацию структурированных данных, которые недоступны при публичном сканировании URL.
  4. Два механизма передачи (Push и Pull): Данные могут быть загружены напрямую (Push) или извлечены системой с использованием private URL access key (Pull).
  5. Контроль доступа в индексе: Индексированные данные могут быть защищены ключом (Access Key) на уровне базы данных, ограничивая их использование авторизованными системами (например, Custom Search Engines).
  6. Авторизация и Квоты: Доступ к механизму имеют только авторизованные пользователи (verified user), и его использование ограничено квотами (indexing quota).
  7. Слияние данных: Отправленные пользователем данные сливаются с web crawl data, при этом они могут как дополнять, так и заменять данные сканирования.

Практика

Best practices (это мы делаем)

  • Внедрение механизмов прямой отправки: Для контента, где актуальность структурированных данных критична (E-commerce, Jobs, Events), необходимо использовать доступные реализации этого патента: Google Merchant Center Feeds/Content API (для товаров) и Google Indexing API (для вакансий и трансляций). Это гарантирует быструю доставку актуальных данных в индекс.
  • Автоматизация подачи данных: Настроить интеграцию CMS/PIM систем для автоматической отправки обновлений при изменении информации на сайте (например, изменение цены или статуса наличия).
  • Поддержание точности данных: Поскольку отправленные данные могут заменять (supplant) данные сканирования, критически важно обеспечить их абсолютную точность перед отправкой.
  • Мониторинг квот и ошибок: Отслеживать использование indexing quota и обрабатывать ответы API, чтобы гарантировать доставку данных и своевременно реагировать на проблемы с лимитами или аутентификацией.
  • Использование приватных атрибутов для CSE (если применимо): Если используется Google Custom Search Engine, применять механизм отправки приватных структурированных данных (с Access Key) для добавления атрибутов, полезных для внутренней фильтрации (например, внутренняя классификация, рейтинг поставщика), которые не должны быть видны публично.

Worst practices (это делать не надо)

  • Полагаться только на стандартный краулинг: Игнорировать возможности прямой отправки для time-sensitive информации. Это приводит к неактуальной информации в SERP (неверные цены, недоступные товары) и потере трафика.
  • Отправка противоречивых данных: Отправлять через API данные, которые противоречат публичному контенту на странице. Хотя система технически позволяет это (Claim 1), это может подорвать доверие поисковой системы.
  • Игнорирование стандартной разметки на сайте: Отказываться от размещения Schema.org на веб-страницах, полагаясь исключительно на прямую отправку. Прямая отправка предназначена для дополнения и быстрого обновления, а не полной замены.
  • Спам обновлениями: Злоупотреблять механизмом для незначительных изменений, что может привести к исчерпанию indexing quota.

Стратегическое значение

Патент подтверждает стратегический сдвиг Google от модели чистого сканирования к гибридной модели, включающей прямой прием данных от доверенных источников. Это повышает актуальность индекса и снижает нагрузку на краулинг. Для SEO это означает необходимость перехода от пассивной оптимизации к активному управлению данными в индексе через API и инструменты, реализуя концепцию Real-Time SEO для структурированных данных.

Практические примеры

Сценарий 1: Быстрое обновление наличия товара (E-commerce)

  1. Ситуация: На сайте интернет-магазина закончился товар. Стандартный краулер может не увидеть это изменение несколько дней.
  2. Действие (на основе патента - Push): Авторизованная система магазина генерирует обновленные структурированные данные (статус наличия) и отправляет их напрямую в Google (на практике – через Merchant Center Feed или Content API).
  3. Результат: Запись URL в индексе обновляется в течение короткого времени (unscheduled update sequence). Информация в Google Shopping и расширенных сниппетах актуализируется, предотвращая негативный опыт пользователей.

Сценарий 2: Индексация приватных данных для корпоративного поиска (CSE)

  1. Ситуация: Компания использует Google CSE для поиска по каталогу. Необходимо добавить фильтр по атрибуту «Маржинальность», который не должен быть виден публично.
  2. Действие (на основе патента - Push с Access Key): Компания настраивает отправку структурированных данных. Атрибут «Маржинальность» отправляется с указанием Access Key.
  3. Результат: Атрибут индексируется, но доступ к нему ограничен. Корпоративная поисковая система (CSE), настроенная на использование этого Access Key, может применять фильтр по маржинальности. Публичный поиск Google не имеет доступа к этому атрибуту.

Вопросы и ответы

Заменяет ли этот механизм стандартное сканирование (crawling)?

Нет, он его дополняет. Патент указывает, что отправленные данные supplements web crawl data (дополняют данные веб-сканирования). Основная цель – обеспечить быстрое обновление именно структурированных данных по требованию или предоставить данные, недоступные при обычном сканировании. Сканирование остального контента страницы происходит в обычном режиме.

Как быстро обновляются данные при использовании этого метода?

Обновление происходит значительно быстрее, чем при стандартном сканировании, в рамках «незапланированной последовательности обновления». Патент упоминает predefined time period (предопределенный период времени) и приводит пример «менее шести часов». На практике современные API могут отрабатывать за минуты или часы.

Что такое «Private URL access key» и как он работает (Pull Model)?

Это секретный ключ, который вебмастер предоставляет Google. Система использует этот ключ при обращении к URL (например, добавляя его как GET-параметр: ?key=secret). Сервер вебмастера, распознав ключ, отдает специальную версию страницы с дополнительными структурированными данными, которые скрыты от обычных пользователей и стандартного Googlebot.

Чем отличается «Private URL access key» от «Access Key»?

Private URL access key используется для получения данных с сайта вебмастера во время специализированного сканирования (Pull Model). Access Key используется для защиты данных уже внутри базы данных Google, чтобы ограничить доступ к ним (например, только для вашего Custom Search Engine).

Может ли кто угодно отправить структурированные данные для моего сайта?

Нет. Патент требует обязательной аутентификации. Отправлять данные может только verified user или authorized user (верифицированный или авторизованный пользователь), подтвердивший свои права на управление URL. На практике это реализуется через подтверждение прав в GSC или использование авторизованных API-ключей.

Можно ли отправить структурированные данные, которых нет на сайте?

Да, это одна из ключевых возможностей. Патент явно предусматривает отправку данных, которые недоступны при обычном сканировании (inaccessible through crawling). Это могут быть дополнительные атрибуты, которые вы не хотите показывать пользователям, но хотите предоставить поисковой системе (например, общее количество загрузок).

Как этот патент связан с Google Indexing API или Merchant Center?

Этот патент описывает базовую технологию и инфраструктуру, которая лежит в основе этих инструментов. Merchant Center реализует концепцию прямой загрузки (Push Model) структурированных данных о товарах. Indexing API реализует концепцию обновления по требованию (unscheduled update sequence) для определенных типов контента.

Что такое квоты на индексирование (Indexing quota) в контексте этого патента?

Это ограничения на частоту использования механизма обновления по требованию. Система ограничивает количество запросов за определенный период для предотвращения перегрузки. При превышении квоты запросы могут быть отклонены или обработаны с задержкой, что требует от SEO-специалистов мониторинга лимитов.

Что произойдет, если данные, отправленные напрямую, конфликтуют с данными на странице?

Патент указывает, что предоставленные пользователем данные могут как дополнять (supplement), так и заменять (supplant) данные, полученные при сканировании. В случае конфликта приоритет, вероятно, отдается данным, отправленным напрямую аутентифицированным пользователем, так как они считаются более актуальными.

Для каких типов сайтов этот механизм наиболее важен?

Он критически важен для сайтов с высокой частотой обновления данных, влияющих на принятие решений пользователем. Это E-commerce (цены, наличие), сайты вакансий, агрегаторы событий и билетов. Для них задержка в обновлении индекса может приводить к прямым финансовым потерям.

Похожие патенты

Как Google позволяет использовать приватные структурированные данные для управления ранжированием в кастомном поиске
Патент описывает механизм, позволяющий владельцам сайтов загружать приватные структурированные данные, недоступные при обычном сканировании. Доступ к этим данным защищен ключом (API key). Авторизованные системы (например, Google Custom Search Engine или вертикальные поиски) могут использовать эти данные для фильтрации, сортировки и изменения ранжирования результатов поиска, не раскрывая их публично.
  • US20150113019A1
  • 2015-04-23
  • SERP

Как Google автоматизирует извлечение структурированных данных с веб-страниц для создания списков ключевых слов
Патент Google описывает инструмент для автоматического извлечения данных со структурированных веб-страниц. Пользователь выбирает два примера элемента (например, названия товаров), а инструмент анализирует структуру документа (DOM-дерево), находит шаблон и автоматически извлекает все остальные элементы, соответствующие этому шаблону. Это используется для быстрого сбора ключевых слов для рекламных кампаний.
  • US8341176B1
  • 2012-12-25
  • Структура сайта

Как Google использует данные веб-поиска для распознавания сущностей в специализированных вертикалях (на примере поиска медиаконтента)
Google использует двухэтапный процесс для ответа на описательные запросы в специализированных поисках (например, поиск фильмов по сюжету). Сначала система ищет информацию в основном веб-индексе, анализирует топовые результаты для выявления релевантных сущностей (названий фильмов), а затем использует эти сущности для поиска в специализированной базе данных.
  • US9063984B1
  • 2015-06-23
  • Семантика и интент

  • Мультимедиа

  • Индексация

Как Google использует метаданные XML Sitemap (lastmod, changefreq, priority) для планирования и приоритизации сканирования
Патент Google, описывающий фундаментальные механизмы протокола Sitemaps. Планировщик сканирования использует метаданные, предоставленные веб-сайтами: lastmod для предотвращения сканирования неизмененного контента, changefreq для прогнозирования обновлений и priority в качестве повышающего коэффициента (boost factor) в очереди сканирования, оптимизируя краулинговый бюджет.
  • US7769742B1
  • 2010-08-03
  • Краулинг

  • Техническое SEO

  • Свежесть контента

Как Google извлекает цены и изображения товаров с веб-страниц для Google Shopping
Этот патент описывает, как Google автоматически идентифицирует страницы электронной коммерции и извлекает структурированные данные о товарах (такие как цена и изображение) из неструктурированного HTML. Система использует анализ близости элементов, структуру HTML и сигналы форматирования для поиска правильных атрибутов, что формирует основу для поисковых систем по товарам, таких как Google Shopping.
  • US7836038B2
  • 2010-11-16
  • Google Shopping

  • SERP

  • Индексация

Популярные патенты

Как Google интерпретирует последовательные запросы для автоматического уточнения поискового намерения пользователя
Google использует механизм для понимания контекста сессии, анализируя последовательные запросы (например, Q1: [рестораны в Москве], затем Q2: [итальянские]). Система автоматически объединяет их в уточненный запрос (Q3: [итальянские рестораны в Москве]), основываясь на исторических данных о том, как пользователи обычно уточняют запросы. Это позволяет системе лучше понимать намерение пользователя в диалоговом режиме.
  • US9116952B1
  • 2015-08-25
  • Семантика и интент

  • Поведенческие сигналы

Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
  • US9858295B2
  • 2018-01-02
  • Мультимедиа

  • Поведенческие сигналы

  • SERP

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует организационные структуры (папки, ярлыки) как ссылки для расчета PageRank и ранжирования документов
Google может анализировать, как документы организованы пользователями (например, в папках, через ярлыки или закладки), и использовать эти организационные структуры для расчета рейтинга документа. Документы, концептуально сгруппированные вместе, передают друг другу ранжирующий вес (аналогично PageRank), причем более тесные связи (например, в одной папке) передают больше веса, чем более слабые связи (например, в соседних папках).
  • US8090736B1
  • 2012-01-03
  • Ссылки

  • SERP

  • Структура сайта

Как Google автоматически генерирует блоки "Связанные ссылки" и "Похожие запросы", анализируя контент страницы при загрузке
Патент описывает систему для динамической генерации виджетов связанных ссылок. При загрузке страницы система извлекает текст (заголовок, контент, запрос из реферера), определяет наиболее важные ключевые слова с помощью глобального репозитория (Keyword Repository), выполняет поиск по этим словам (часто в пределах того же домена) и отображает топовые результаты для улучшения навигации.
  • US9129009B2
  • 2015-09-08
  • Ссылки

  • Семантика и интент

  • Техническое SEO

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google определяет скрытый локальный интент в запросах для повышения релевантности местных результатов
Google использует механизм для определения того, подразумевает ли запрос (например, «ресторан») поиск локальной информации, даже если местоположение не указано. Система анализирует агрегированное поведение пользователей для расчета «степени неявной локальной релевантности» запроса. Если этот показатель высок, Google повышает в ранжировании результаты, соответствующие местоположению пользователя.
  • US8200694B1
  • 2012-06-12
  • Local SEO

  • Поведенческие сигналы

  • Семантика и интент

Как Google рассчитывает тематическую популярность (Topical Authority) документов на основе поведения пользователей
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). Эта метрика используется как сигнал ранжирования, когда тема запроса пользователя соответствует теме документа.
  • US8595225B1
  • 2013-11-26
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google определяет язык поискового запроса, используя язык интерфейса, статистику слов и поведение пользователей
Google использует вероятностную модель для точной идентификации языка поискового запроса. Система комбинирует три ключевых фактора: статистику частотности слов в разных языках, язык интерфейса пользователя (например, Google.fr) и исторические данные о том, на какие результаты пользователи кликали ранее. Это позволяет корректно обрабатывать многоязычные и неоднозначные запросы для применения правильных синонимов и стемминга.
  • US8442965B2
  • 2013-05-14
  • Мультиязычность

  • Поведенческие сигналы

seohardcore