Как Google использует прямые фиды данных от издателей для создания обогащенных результатов поиска (Rich Results) в реальном времени

ENRICHING SEARCH RESULTS (Обогащение результатов поиска)

US9208230B2
Google LLC
2011-05-27
2015-12-08

Google использует систему, позволяющую «зарегистрированным издателям» предоставлять структурированные данные (например, цены, расписания, статус рейсов) отдельно от основного контента. Эта информация обновляется значительно чаще, чем стандартный веб-индекс, и используется для создания обогащенных результатов (Rich Results) с актуальными, «живыми» данными прямо в выдаче, минуя задержки стандартного сканирования.

Какую проблему решает

Патент решает проблему задержек (latency) при стандартном сканировании и индексировании. Информация, которая меняется очень быстро (например, спортивные результаты, статус авиарейсов, наличие товаров), часто устаревает в индексе поисковой системы. Изобретение создает отдельный, более быстрый канал для получения и обновления этих данных, гарантируя свежесть и актуальность информации, отображаемой непосредственно в результатах поиска (SERP).

Что запатентовано

Запатентована система, позволяющая поисковой системе идентифицировать зарегистрированных издателей (registered publishers) и получать от них обогащающую информацию (enrichment information) через отдельный канал (например, фид данных или API). Эта информация обрабатывается значительно чаще, чем основной контент сайта, и ассоциируется с соответствующими ресурсами (URL). При формировании выдачи система дополняет стандартные сниппеты этой актуальной, структурированной информацией.

Как это работает

Система работает следующим образом:

Регистрация: Издатели регистрируются в системе (например, через метаданные на сайте, фиды или микроразметку) и предоставляют способ доступа к обогащающей информации (например, URL фида).
Сбор данных: Специализированный модуль (Enrichment Engine) получает данные из указанного источника. Этот процесс происходит значительно чаще, чем стандартное сканирование сайта.
Хранение и Ассоциация: Полученные данные сохраняются (например, в Enrichment Information Database) и связываются с конкретными URL издателя.
Обработка запроса: Когда пользователь вводит запрос, система определяет релевантные ресурсы.
Обогащение: Если релевантный ресурс имеет связанную обогащающую информацию, система формирует обогащенный результат поиска (enriched search result). Патент также описывает обновление этой информации непосредственно перед показом для обеспечения «живых» данных (live enrichment information).

Актуальность для SEO

Критически высокая. Этот патент описывает инфраструктурную основу для современных Rich Results (обогащенных результатов) и интеграции специализированных данных (спорт, погода, товары, мероприятия) в поиск Google. Механизмы предоставления структурированных данных через микроразметку (Schema.org), фиды (например, Google Merchant Center) и API являются прямым применением описанных здесь концепций.

Важность для SEO

Патент имеет критическое значение (95/100) для современной SEO-стратегии. Он подчеркивает необходимость не только оптимизировать контент для стандартного сканирования, но и активно предоставлять поисковой системе структурированные, актуальные данные через соответствующие каналы. Владение этими механизмами напрямую влияет на вид сниппета в выдаче (Rich Results), его привлекательность (CTR) и способность предоставлять пользователю актуальную информацию напрямую в SERP.

Термины и определения

Data Model (Модель данных): Структура или формат, предоставляемый поисковой системой издателям, согласно которому должна быть организована обогащающая информация (например, Schema.org). Определяет, как указать таблицы, изображения или конкретные данные.
Enriched Search Result (Обогащенный результат поиска): Результат поиска, который помимо стандартного заголовка и сниппета содержит дополнительную обогащающую информацию. Современный термин – Rich Result.
Enrichment Engine (Модуль обогащения): Компонент поисковой системы, отвечающий за получение, обработку и хранение обогащающей информации от зарегистрированных издателей.
Enrichment Information (Обогащающая информация): Дополнительные структурированные данные, предоставляемые издателем для улучшения сниппета. Примеры: спортивные результаты, расписания, статус рейсов, цены, наличие товара.
Live Enrichment Information (Живая обогащающая информация): Обогащающая информация, которая обновляется в реальном времени или с очень высокой частотой, в том числе непосредственно перед показом результата пользователю (refreshed enrichment information).
Query Matching Engine (Модуль сопоставления запросов): Компонент, который определяет, релевантен ли запрос сохраненной Enrichment Information. Может работать параллельно с основным поисковым движком.
Registered Publisher (Зарегистрированный издатель): Издатель (владелец сайта), который зарегистрирован в поисковой системе для предоставления обогащающей информации. Регистрация может происходить через метаданные, фиды, микроразметку или проактивно со стороны поисковой системы.
Resource Locator (Указатель ресурса): Идентификатор (например, URL фида или API), предоставленный издателем, который поисковая система использует для получения обогащающей информации.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обогащения результатов поиска.

Система идентифицирует зарегистрированных издателей.
Для каждого из них система получает обогащающую информацию и ассоциирует ее с соответствующими ресурсами (страницами) издателя в индексе.
Система получает запрос от пользователя.
Используя индекс, система идентифицирует набор релевантных ресурсов.
Система определяет, что первый релевантный ресурс от зарегистрированного издателя имеет связанную обогащающую информацию в индексе.
Система предоставляет страницу результатов поиска, включающую обогащенный результат поиска для этого ресурса.
Система предоставляет обновленную (refreshed) обогащающую информацию для отображения, причем эта информация характеризуется как живая обогащающая информация (live enrichment information).

Claim 7 (Зависимый): Определяет частоту обновления. Это ключевое утверждение для обеспечения свежести.

Система периодически переиндексирует ресурсы всех издателей с первой частотой (стандартный краулинг).
Система периодически повторно получает обогащающую информацию от зарегистрированных издателей со второй частотой, которая *выше* первой.

Claim 6 (Зависимый): Уточняет источник данных.

Получение обогащающей информации происходит из местоположения (например, URL фида), отличного от местоположения самого ресурса (URL страницы).

Claim 2 и 3 (Зависимые): Описывают альтернативный вариант обработки запроса (Параллельный поиск).

Система идентифицирует релевантную обогащающую информацию (responsive enrichment information) параллельно (Claim 3) с идентификацией релевантных ресурсов, а затем сопоставляет их (Claim 2).

Claim 4 (Зависимый): Описывает способ регистрации.

Регистрация может происходить путем индексации ресурса, который содержит запрос на регистрацию (registration information).

Где и как применяется

Изобретение затрагивает несколько этапов работы поисковой системы, создавая параллельную инфраструктуру для обработки данных.

CRAWLING – Сканирование и Сбор данных
На этом этапе работает Enrichment Engine. Он не сканирует веб-страницы стандартным образом, а получает структурированные данные из указанных издателями источников (Resource Locators – фиды, API). Этот сбор данных происходит значительно чаще, чем работа основного краулера (Googlebot), согласно Claim 7.

INDEXING – Индексирование и извлечение признаков
Полученная Enrichment Information обрабатывается, структурируется согласно Data Model и сохраняется в специализированной базе данных (Enrichment Information Database). Происходит ассоциация этих данных с соответствующими URL в основном индексе. Также Indexing Engine может обнаруживать запросы на регистрацию.

RANKING – Ранжирование
На этом этапе определяются ресурсы, релевантные запросу. В параллельной реализации (Claim 3) Query Matching Engine одновременно ищет релевантную Enrichment Information.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Основное применение патента происходит на этапе формирования SERP. Система сопоставляет топовые результаты из этапа RANKING со связанной Enrichment Information. Если данные есть, стандартный сниппет заменяется или дополняется Enriched Search Result. На этом этапе может происходить финальное обновление данных (refresh) для обеспечения Live Enrichment Information.

Входные данные:

Регистрационная информация издателя (домен, указатели ресурсов для данных).
Enrichment Information (структурированные данные из фидов/API/микроразметки).
Запрос пользователя.
Стандартные результаты поиска из индекса.

Выходные данные:

Страница результатов поиска (SERP) с одним или несколькими Enriched Search Results (Rich Results).

На что влияет

Конкретные типы контента: Наибольшее влияние оказывается на контент с быстро меняющимися атрибутами: товары (цена, наличие), мероприятия (дата, время, билеты), авиарейсы (статус), спортивные страницы (текущий счет, расписание).
Специфические запросы: Транзакционные и информационные запросы, где свежесть данных критична (например, "счет матча X", "статус рейса Y", "купить товар Z").
Конкретные ниши или тематики: E-commerce, Travel, Спорт, Финансы, Медиа.

Когда применяется

Алгоритм применяется при выполнении следующих условий:

Издатель зарегистрирован: Источник контента идентифицирован как Registered Publisher (например, использует валидную микроразметку или фид).
Наличие данных: Для данного издателя получена и сохранена Enrichment Information.
Релевантность ресурса: Ресурс издателя признан релевантным запросу пользователя.
Соответствие данных ресурсу: Сохраненная Enrichment Information ассоциирована именно с этим релевантным ресурсом.

Пошаговый алгоритм

Процесс А: Регистрация и сбор данных (Постоянный/Фоновый процесс)

Идентификация издателей: Система идентифицирует издателей (например, обнаруживая микроразметку или через регистрацию в Merchant Center).
Сохранение регистрации: Информация об издателе и указатели ресурсов (URL фидов или сами страницы с разметкой) сохраняются.
Первичное получение данных: Enrichment Engine получает обогащающую информацию из указанных источников.
Обработка и ассоциация: Данные интерпретируются согласно Data Model (Schema.org), сохраняются и ассоциируются с конкретными URL.
Периодическое обновление: Система повторно получает данные со второй частотой (высокой), которая значительно выше частоты стандартного сканирования (первой частоты).

Процесс Б: Обработка запроса (Реальное время)

Патент описывает два варианта реализации.

Вариант 1 (Последовательный - FIG. 4):

Получение запроса.
Идентификация релевантных ресурсов: Стандартный поиск по индексу.
Проверка ассоциаций: Система проверяет, имеют ли найденные релевантные ресурсы связанную обогащающую информацию.
Обновление данных (Опционально): Система может выполнить обновление (refresh) обогащающей информации для обеспечения «живых» данных.
Формирование SERP: Предоставление результатов поиска. Для ресурсов, имеющих связанные данные, отображается Enriched Search Result.

Вариант 2 (Параллельный - FIG. 3):

Получение запроса.
Параллельный поиск: Одновременно выполняются два действия:
- Идентификация релевантных ресурсов (стандартный поиск).
- Идентификация релевантной обогащающей информации (поиск по базе данных обогащения с помощью Query Matching Engine).
Сопоставление: Система определяет, какие из найденных ресурсов соответствуют найденной обогащающей информации.
Обновление данных (Опционально): Выполняется обновление (refresh) данных.
Формирование SERP: Предоставление обогащенных результатов для совпавших пар.

Какие данные и как использует

Данные на входе

Патент фокусируется на инфраструктуре передачи данных, а не на факторах ранжирования. Используются следующие типы данных:

Технические факторы: Resource Locator (URL фида или конечная точка API). Используется для доступа к данным.
Структурные факторы (Content/Data): Enrichment Information. Это данные, предоставленные издателем в соответствии с Data Model (Schema.org). Это могут быть цены, даты, время, статусы, численные показатели, ссылки на билеты или обзоры.
Системные данные: Регистрационная информация издателя, включая предпочтения по отображению и частоту обновления данных.

Какие метрики используются и как они считаются

Ключевые метрики связаны с частотой и актуальностью:

First Frequency (Первая частота): Частота стандартного сканирования и переиндексации ресурсов.
Second Frequency (Вторая частота): Частота повторного получения обогащающей информации. Ключевое условие патента (Claim 7): Вторая частота > Первая частота.
Freshness (Свежесть): Data Model может включать указание периода времени, в течение которого информация остается свежей.
Live Data Metric: Система стремится предоставить Live Enrichment Information, что подразумевает минимальную задержку между генерацией данных у издателя и их отображением в SERP, вплоть до обновления непосредственно перед показом.

Приоритет свежести и структуры над стандартным индексом: Google инфраструктурно решает проблему устаревания быстро меняющихся данных. Система отдает приоритет данным, полученным через специализированные каналы (фиды, API, микроразметка), над данными, полученными при стандартном сканировании HTML.
Отдельный и быстрый канал для данных: Существует отдельный от Googlebot механизм (Enrichment Engine) для сбора структурированных данных. Он работает быстрее и чаще (Claim 7).
Необходимость активного участия издателей: Для получения обогащенных результатов издатели должны стать Registered Publishers и активно предоставлять данные в требуемом формате (Data Model, например, Schema.org).
Инфраструктура для Rich Results: Патент описывает базовую архитектуру, которая позволяет масштабировать отображение Rich Results для различных типов контента и ниш, от товаров до спортивных событий.
«Живые» данные в поиске: Подтверждается стремление Google интегрировать данные реального времени (Live Enrichment Information) в SERP, минуя необходимость полной переиндексации страницы.
Параллельная обработка для скорости: Система может искать стандартные результаты и обогащенные данные параллельно (Claim 3), что ускоряет формирование SERP.

Best practices (это мы делаем)

Комплексное внедрение структурированных данных (Schema.org): Используйте микроразметку для разметки всех релевантных сущностей. Это самый распространенный способ предоставить Enrichment Information в соответствии с Data Model Google.
Использование специализированных фидов: Для E-commerce критически важно использовать Google Merchant Center. Эти системы являются реализацией описанного механизма: вы становитесь Registered Publisher и предоставляете фид (Resource Locator) с данными о товарах (Enrichment Information).
Обеспечение актуальности данных (Фиды и API): Так как система обновляет эти данные чаще (Second Frequency), необходимо настроить автоматическое и частое обновление фидов или использовать API (например, Content API для Merchant Center, Indexing API для контента) для передачи данных в реальном времени. Это соответствует концепции Live Enrichment Information.
Валидация и Мониторинг: Регулярно проверяйте корректность внедрения структурированных данных с помощью валидаторов и отслеживайте статус Rich Results в Google Search Console, чтобы убедиться, что Enrichment Engine корректно получает ваши данные.

Worst practices (это делать не надо)

Игнорирование структурированных данных: Полагаться только на то, что Google извлечет информацию из HTML-текста. Это лишает сайт возможности получить Enriched Search Result.
Предоставление устаревших или неточных данных: Передача неверных цен, дат или статусов наличия в фидах или микроразметке. Это противоречит цели патента (обеспечение свежести) и может привести к санкциям или отключению Rich Results.
Нарушение Data Model (Ошибки в разметке): Внедрение микроразметки с ошибками. Enrichment Engine не сможет обработать такие данные.
Медленное обновление фидов: Обновление товарного фида раз в неделю, когда наличие меняется ежечасно. Это нивелирует преимущество высокой частоты обновления, описанной в патенте.

Стратегическое значение

Патент подтверждает стратегический вектор развития поиска в сторону структурированных данных и ответов в реальном времени. SEO-стратегия должна включать управление данными как активом. Важно не просто создавать контент, но и обеспечивать его машиночитаемость и своевременную доставку в поисковую систему через соответствующие каналы (фиды, API, разметка). Это смещает фокус с оптимизации страниц на оптимизацию данных и инфраструктуры их передачи.

Практические примеры

Сценарий 1: Интернет-магазин (E-commerce) и актуальность цен

Действие: Магазин регистрируется в Google Merchant Center (становится Registered Publisher) и загружает товарный фид (предоставляет Resource Locator). Фид содержит цены и наличие (Enrichment Information). Настроен ежечасный автоматический экспорт фида из CMS.
Механизм: Google (Enrichment Engine) регулярно забирает фид (Second Frequency). Данные ассоциируются с URL карточек товаров.
Результат: При поиске товара в SERP отображается Enriched Search Result (Rich Result), показывающий актуальную цену и статус наличия, даже если основная страница товара не переиндексировалась несколько дней.

Сценарий 2: Сайт с мероприятиями (Events) и быстрое обновление

Действие: Сайт внедряет микроразметку Schema.org/Event. При изменении статуса мероприятия (например, sold out) сайт использует Indexing API для уведомления Google.
Механизм: API позволяет достичь максимальной частоты обновления enrichment information (близкой к реальному времени). Enrichment Engine быстро обновляет данные.
Результат: При релевантном запросе в SERP отображается блок с мероприятиями с актуальным статусом (Live Enrichment Information), что повышает видимость сайта и улучшает пользовательский опыт.

Как этот патент связан с микроразметкой Schema.org?

Schema.org является наиболее распространенной реализацией Data Model, упомянутой в патенте. Внедряя валидную микроразметку, вы предоставляете Enrichment Information. Хотя патент часто описывает получение данных из отдельного источника (фида), механизм ассоциации данных с ресурсом и их использования для создания Rich Results остается тем же, независимо от того, получены ли данные из фида или извлечены из микроразметки на странице.

Что такое "Зарегистрированный издатель" (Registered Publisher) на практике сегодня?

Сегодня любой сайт, предоставляющий валидные структурированные данные (Schema.org), которые Google использует для Rich Results, функционирует как Registered Publisher. Также это пользователи Google Merchant Center, Manufacturer Center или участники специализированных программ интеграции данных (например, авиакомпании, спортивные лиги).

В чем ключевое преимущество этого механизма для Google?

Ключевое преимущество — возможность обновлять данные в выдаче значительно чаще, чем происходит стандартное сканирование веб-страниц (Claim 7). Это позволяет отображать в сниппетах максимально актуальную информацию (Live Enrichment Information), такую как цены, наличие товаров или результаты событий, даже если сама страница давно не переиндексировалась.

Влияет ли предоставление Enrichment Information на ранжирование?

Патент фокусируется на представлении результатов (отображение сниппета), а не на расчете Ranking Score. Предоставление этих данных напрямую не является фактором ранжирования. Однако Enriched Search Result значительно повышает привлекательность сниппета, что ведет к увеличению CTR, а это, в свою очередь, может косвенно положительно влиять на ранжирование.

Что важнее: микроразметка на сайте или отдельный фид данных?

Это зависит от типа данных и частоты их изменения. Для относительно статических данных (рецепты, статьи) микроразметки достаточно. Для данных, меняющихся часто (цены, наличие товаров, расписание), фиды или API предпочтительнее, так как они лучше поддерживают высокую частоту обновления (Second Frequency), описанную в патенте.

Что означает "Живая обогащающая информация" (Live Enrichment Information)?

Это означает, что система стремится минимизировать задержку отображения данных. Патент упоминает возможность обновления (refresh) информации непосредственно перед показом результата пользователю (Claim 1). Это критично для таких сценариев, как текущий счет спортивного матча или статус авиарейса в реальном времени.

Почему Google обновляет фиды чаще, чем сканирует сайт?

Это эффективнее с точки зрения ресурсов. Фиды содержат только структурированные данные и имеют меньший объем, чем полные HTML-страницы. Это позволяет Enrichment Engine быстро получать и обрабатывать только ту информацию, которая изменилась, не пересканируя и не рендеря весь сайт.

Описывает ли патент параллельный поиск по основному индексу и базе данных обогащения?

Да, патент явно описывает такую возможность (Claims 2 и 3, FIG. 3). Система может искать релевантные ресурсы и релевантную обогащающую информацию одновременно с помощью Query Matching Engine, а затем сопоставлять их. Это ускоряет процесс формирования выдачи.

Что произойдет, если данные в фиде (или микроразметке) и на странице отличаются?

Система может отдать предпочтение данным из фида, предполагая, что они более свежие (Claim 7). Однако значительные и постоянные расхождения противоречат рекомендациям Google и могут привести к отключению обогащенных результатов (например, ошибки в Google Merchant Center) или ручным мерам за спам в структурированных данных.

Как обеспечить максимальную скорость обновления моих данных в Google?

Используйте модели Push или уведомления. Патент упоминает возможность работы по модели publish/subscribe. На практике это реализуется через Content API (например, для Merchant Center), использование Google Indexing API для контента или XML Sitemaps с корректным и частым обновлением времени последнего изменения (lastmod).

Как Google использует структурированные данные и шаблоны для создания обогащенных сниппетов (Rich Results)

Google использует механизм, позволяющий владельцам сайтов влиять на отображение своих страниц в поиске. Система идентифицирует «Объекты отображения результатов поиска» (структурированные данные) и «Шаблоны» (правила форматирования), предоставленные вебмастером или сгенерированные автоматически. Это позволяет формировать обогащенные сниппеты с дополнительной информацией (цены, рейтинги, изображения).

US20100114874A1
2010-05-06

SERP
Краулинг
Техническое SEO

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных

Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.

US8577897B2
2013-11-05

SERP
Семантика и интент
EEAT и качество

Как Google обогащает оцифрованные документы (например, книги), автоматически находя и встраивая связанный веб-контент

Google улучшает представление оцифрованных документов (книг, статей), определяя их атрибуты (автор, название) и автоматически выполняя веб-поиск связанной информации (обзоров, биографий). Эта информация затем представляется вместе с исходным документом на «Справочной странице» (Reference Page), иногда путем прямого извлечения данных с релевантных веб-сайтов.

US8386453B2
2013-02-26

Индексация
Ссылки
Семантика и интент

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google позволял сторонним провайдерам внедрять специализированные результаты в выдачу по подписке пользователя (Google Subscribed Links)

Патент описывает систему (известную как "Google Subscribed Links"), позволяющую сторонним поставщикам контента определять шаблоны запросов и предоставлять структурированные данные (DataObjects) через XML-фиды. Если запрос пользователя соответствовал шаблону и пользователь был подписан на этого провайдера, система внедряла специализированный ответ непосредственно на страницу результатов поиска.

US7593939B2
2009-09-22

SERP
Индексация
Персонализация

Как Google использует данные о поведении пользователей и длительность кликов для улучшения и переписывания поисковых запросов

Google использует систему для автоматического переписывания запросов пользователей. Система анализирует миллионы прошлых поисковых сессий, чтобы определить, как пользователи уточняли свои запросы и насколько они были удовлетворены результатами (измеряя длительность кликов). На основе этого рассчитывается «Ожидаемая полезность» (Expected Utility) для предложенных вариантов запросов, что позволяет Google предлагать пользователю те формулировки, которые с наибольшей вероятностью приведут к качественному ответу.

US7617205B2
2009-11-10

Поведенческие сигналы
Семантика и интент
SERP

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности

Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.

US7657520B2
2010-02-02

SERP
EEAT и качество
Поведенческие сигналы

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность

Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.

US7870147B2
2011-01-11

Семантика и интент
Поведенческие сигналы
SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса

Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).

US9195703B1
2015-11-24

Персонализация
Поведенческие сигналы
Семантика и интент

Как Google (YouTube) ранжирует видео, повышая те, которые начинают сессию просмотра и приводят внешний трафик ("Lead Video")

Google использует систему ранжирования для видеоплатформ, которая идентифицирует "ведущее видео" (Lead Video), инициирующее сессию просмотра. Система применяет повышающие коэффициенты (Scaling Factors) ко времени просмотра этого видео. Видео, привлекшие пользователя на платформу из внешних источников (например, из социальных сетей или поиска Google), получают значительно больший коэффициент, чем те, что были найдены через внутренние рекомендации.

US10346417B2
2019-07-09

Мультимедиа
Поведенческие сигналы
SERP

Как Google проверяет работоспособность Deep Links и обратную совместимость перед индексированием контента мобильных приложений

Google использует автоматизированную систему верификации для индексирования контента мобильных приложений. Перед добавлением в индекс система эмулирует запуск приложения по Deep Link, проверяя корректность загрузки, отсутствие ошибок и соответствие контента связанной веб-странице. Также система тестирует обратную совместимость ссылок при обновлениях приложения, гарантируя, что в поиск попадают только функциональные результаты.

US9645980B1
2017-05-09

Индексация
Ссылки
Техническое SEO

Как Google использует механизм «Pull-Push» для валидации ссылок через трафик и время вовлечения (Dwell Time)

Google использует механизм «Pull-Push» для борьбы с искусственными ссылками, анализируя соотношение между количеством ссылок и реальными кликами по ним. Если ссылки не генерируют пропорциональный трафик (с учетом времени вовлечения), они обесцениваются. Сайты, которые систематически ставят такие ссылки, классифицируются как «неквалифицированные источники», и их исходящие ссылки дисконтируются при ранжировании.

US9558233B1
2017-01-31

Ссылки
Поведенческие сигналы
Антиспам

Как Google снижает влияние ссылок с аффилированных сайтов и PBN для борьбы с манипуляциями в ранжировании

Патент Google описывает систему ранжирования, которая идентифицирует группы сайтов под общим контролем (аффилированные узлы или PBN). Система резко снижает вес ссылок внутри такой группы и ограничивает общее влияние группы на другие сайты, учитывая только одну, самую сильную ссылку от всей группы. Также описывается механизм "Доверенных авторитетов", чьи ссылки передают максимальный вес независимо от количества исходящих ссылок.

US8719276B1
2014-05-06

Антиспам
Ссылки
Техническое SEO

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам

Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.

US9152652B2
2015-10-06

Поведенческие сигналы
Мультимедиа
Семантика и интент

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс

Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.

US8255386B1
2012-08-28

Индексация
Поведенческие сигналы