SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует внешние сигналы (соцсети, новости, блоги) для верификации реальной популярности контента и фильтрации накруток

EXTERNAL VERIFICATION OF CONTENT POPULARITY (Внешняя верификация популярности контента)
  • US9465871B1
  • Google LLC
  • 2013-08-07
  • 2016-10-11
  • Антиспам
  • SERP
  • Ссылки
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google верифицирует популярность контента (например, видео) проверяя, упоминается ли он на внешних источниках: блогах, новостных сайтах и в социальных сетях. Это позволяет формировать списки "популярного", отражающие подлинный широкий интерес, отфильтровывая контент с искусственно завышенными просмотрами или узконишевой популярностью. Система также учитывает географическую релевантность внешних упоминаний.

Описание

Какую проблему решает

Патент решает проблему ненадежности метрик популярности, основанных исключительно на внутренних счетчиках доступов (просмотров) внутри сервиса обмена контентом (Content sharing service). Он устраняет уязвимость к искусственному завышению просмотров (боты, платные сервисы) и корректирует ситуации, когда контент имеет много просмотров, но не представляет интереса для широкой аудитории (например, узконишевой контент или контент, популярный только в изолированном географическом/языковом сегменте). Цель — улучшить качество автоматически генерируемых списков популярного контента для повышения удержания пользователей.

Что запатентовано

Запатентована система для верификации популярности контента путем перекрестной проверки внутренних данных о доступах с внешними источниками (External sources), такими как новостные сайты, блоги и социальные сети. Система генерирует списки популярности (Externally verified list), используя взвешенную модель, которая учитывает не только количество внутренних просмотров, но и количество внешних источников, ссылающихся на контент, а также географическую релевантность этих источников.

Как это работает

Система работает следующим образом:

  • Предварительный список: Access Analyzer создает предварительный список популярного контента на основе внутренних счетчиков просмотров.
  • Мониторинг внешних источников: Система отслеживает зарегистрированные внешние источники (блоги, новости, соцсети) на предмет упоминания или встраивания контента.
  • Перекрестная проверка: List Verifier определяет, упоминается ли контент из предварительного списка на внешних источниках, и подсчитывает количество таких источников.
  • Географическая верификация: Geography Verifier оценивает релевантность внешних источников географическому положению целевого пользователя.
  • Переранжирование и генерация списка: List Generator создает финальный список, применяя Predetermined weights к трем параметрам: внутренние просмотры, количество внешних упоминаний и географическая релевантность упоминаний.

Актуальность для SEO

Высокая. Борьба с искусственным завышением показателей вовлеченности (fake views, боты) и верификация подлинного интереса к контенту являются критически важными задачами для таких платформ, как YouTube или Google Discover. Описанный механизм использования внешних сигналов для подтверждения популярности актуален для современных систем рекомендаций и трендов.

Важность для SEO

Влияние на SEO значительно, особенно для Video SEO и продвижения на платформах дистрибуции контента. Патент показывает, что количества просмотров недостаточно для максимальной видимости в списках "популярное" или "в тренде". Для попадания в эти списки критически важными факторами становятся продвижение вне платформы, органические упоминания и встраивания контента на авторитетных внешних сайтах.

Детальный разбор

Термины и определения

Access Analyzer (Анализатор доступов)
Компонент системы, который отслеживает базу данных использования и создает предварительный список популярного контента на основе количества доступов (просмотров).
Content sharing service (Сервис обмена контентом)
Платформа, которая предоставляет пользователям контент (видео, аудио, текст, изображения). Примером может служить YouTube.
External sources (Внешние источники)
Сторонние веб-ресурсы, не принадлежащие Content sharing service. Примеры включают блоги, новостные сайты, социальные сети.
External Source Interface Module (Модуль взаимодействия с внешними источниками)
Компонент, который отслеживает зарегистрированные External sources и фиксирует, какой контент на них размещен.
Externally verified list (Внешне верифицированный список)
Итоговый список популярного контента, сгенерированный после перекрестной проверки с внешними источниками и применения весовых коэффициентов.
Geography Verifier (Географический верификатор)
Компонент внутри List Verifier, который определяет, релевантны ли внешние источники, упоминающие контент, географическому положению пользователя, которому будет показан список.
List Generator (Генератор списка)
Компонент, который создает Externally verified list, используя информацию от List Verifier и применяя Predetermined weights.
List Verifier (Верификатор списка)
Компонент, который проверяет, присутствует ли контент из предварительного списка на External sources, и подсчитывает количество таких источников.
Predetermined weights (Предопределенные веса)
Весовые коэффициенты, применяемые к количеству доступов, количеству внешних упоминаний и географической релевантности для расчета итогового рейтинга популярности.
Preliminary list (Предварительный список)
Начальный список популярного контента, основанный только на количестве доступов (просмотров).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основную систему верификации популярности контента.

  1. Система создает Preliminary list популярного контента на основе количества доступов (просмотров) на Content sharing service.
  2. Система верифицирует популярность этого контента для подмножества пользователей в определенном географическом регионе, используя External sources.
  3. Процесс верификации включает:
    • Идентификацию контента, размещенного на External sources.
    • Определение совпадений между Preliminary list и контентом на External sources.
    • При обнаружении совпадения система определяет два ключевых параметра: (i) количество внешних источников, на которых размещен контент, и (ii) релевантность этих внешних источников определенному географическому региону.
  4. Система создает Externally verified list для показа пользователям в этом географическом регионе. Список формируется на основе этих двух параметров (количества внешних источников и их географической релевантности).

Claim 9 (Независимый пункт): Описывает метод, аналогичный системе в Claim 1, фокусируясь на генерации нового списка.

Метод включает ранжирование предварительного списка по просмотрам и его верификацию по географическому признаку через внешние источники. Новый список популярного контента генерируется на основе количества внешних источников, размещающих контент, и релевантности этих источников географическому положению пользователя.

Claim 3 (Зависимый от 1) и Claim 10 (Зависимый от 9): Детализируют механизм ранжирования.

Для генерации верифицированного (нового) списка система использует Predetermined weights (предопределенные веса) для двух факторов: количества доступов (просмотров) и количества внешних источников, на которых размещен контент.

Claim 4 (Зависимый от 3) и Claim 14 (Зависимый от 10): Добавляют географический фактор в ранжирование.

Предопределенные веса также основываются на географическом положении пользователя, которому будет показан список.

Где и как применяется

Важно отметить, что патент описывает процессы внутри Content Sharing Service (например, YouTube), а не в основном веб-поиске Google. Он применяется для генерации списков типа "Популярное", "В тренде" или рекомендательных блоков.

RANKING – Ранжирование (внутри сервиса)
На этом этапе генерируется Preliminary list. Система использует внутренние данные о количестве доступов (просмотров) для создания базового рейтинга популярности.

RERANKING – Переранжирование (внутри сервиса)
Основной этап применения патента. Система активирует процесс верификации:

  1. Сбор внешних данных: External Source Interface Module собирает данные о контенте, размещенном на зарегистрированных External sources.
  2. Верификация и подсчет: List Verifier сравнивает Preliminary list с внешними данными, подсчитывает количество внешних упоминаний для каждого элемента.
  3. Географическая оценка: Geography Verifier оценивает релевантность этих внешних источников местоположению пользователя.
  4. Применение весов и переранжирование: List Generator рассчитывает новые оценки популярности, применяя Predetermined weights к просмотрам, количеству внешних упоминаний и географической релевантности, и формирует финальный Externally verified list.

Входные данные:

  • Внутренние счетчики доступов (просмотры) из Usage Database.
  • Список зарегистрированных внешних источников из External Source Database.
  • Данные о контенте, размещенном на внешних источниках в реальном времени или за период.
  • Географическое положение пользователя, для которого генерируется список.

Выходные данные:

  • Externally verified list — отсортированный список популярного контента с новыми оценками популярности.

На что влияет

  • Конкретные типы контента: В первую очередь влияет на контент, размещаемый на платформах обмена (видео, изображения, аудио), где популярность традиционно измеряется просмотрами.
  • Конкретные ниши или тематики: Оказывает сильное влияние на ниши, подверженные искусственному завышению просмотров (например, музыкальные клипы, гейминг) или на контент с высокой степенью локализации, который может доминировать в просмотрах, но не иметь широкого распространения за пределами своего региона/языка.

Когда применяется

  • Условия применения: Алгоритм применяется, когда Content sharing service необходимо сгенерировать список популярного контента для показа пользователям. Это может происходить на главной странице, в разделе "Тренды", в рекомендациях после просмотра или при попытке пользователя покинуть сервис.
  • Временные рамки и частота применения: Списки могут динамически обновляться через предопределенные промежутки времени (Claim 5). Сбор данных с внешних источников также может быть ограничен по времени (например, контент, размещенный за последние две недели).

Пошаговый алгоритм

Процесс генерации верифицированного списка популярности.

  1. Получение предварительного рейтинга: Система получает рейтинг контента, основанный на количестве доступов (просмотров) за определенный период. Формируется Preliminary list.
  2. Сбор внешних данных: Система опрашивает зарегистрированные External sources (блоги, новости, соцсети) и получает информацию о контенте, который на них размещен (упомянут или встроен).
  3. Итеративная верификация списка: Система перебирает каждый элемент в Preliminary list.
  4. Проверка на кросс-референсы: Для текущего элемента определяется, присутствует ли он на одном или нескольких External sources.
  5. Подсчет внешних источников: Если контент присутствует на внешних источниках, система подсчитывает общее количество таких источников.
  6. Географическая верификация: Система определяет релевантность этих внешних источников географическому положению пользователя, для которого готовится список.
  7. Генерация нового списка: После завершения итерации система генерирует новый список (Externally verified list).
  8. Расчет новых оценок (Re-ranking): Для каждого элемента рассчитывается новая оценка популярности. Оценка базируется на применении Predetermined weights к трем факторам:
    • Количество внутренних доступов.
    • Количество внешних источников, ссылающихся на контент.
    • Географическая релевантность внешних источников.
  9. Сортировка и передача: Новый список сортируется по рассчитанным оценкам и передается Content sharing service для отображения пользователю.

Какие данные и как использует

Данные на входе

Система использует следующие типы данных для верификации популярности:

  • Поведенческие факторы: Количество доступов (просмотры, клики) к каждому элементу контента внутри Content sharing service. Это основной показатель для формирования Preliminary list.
  • Внешние факторы (аналог ссылочных): Данные о присутствии (упоминание, встраивание) контента на External sources (блоги, новостные сайты, социальные сети).
  • Географические факторы: Географическое положение пользователя, для которого формируется список. Географическая принадлежность или релевантность External sources.

Какие метрики используются и как они считаются

Система вычисляет и использует следующие ключевые метрики:

  • Number of accesses (Количество доступов): Внутренний счетчик просмотров контента.
  • Number of external sources (Количество внешних источников): Количество уникальных зарегистрированных внешних источников, на которых обнаружен данный контент.
  • Geographic relevance (Географическая релевантность): Метрика, определяющая, насколько внешние источники, ссылающиеся на контент, релевантны местоположению пользователя.
  • Итоговая оценка популярности: Рассчитывается путем применения Predetermined weights к трем вышеуказанным метрикам. Конкретные формулы взвешивания в патенте не приводятся, но указано, что веса могут быть настроены администратором системы. Пример из патента показывает, что больший вес может быть придан количеству внешних источников, чем количеству доступов.

Выводы

  1. Популярность требует внешнего подтверждения: Внутренние просмотры (Number of accesses) являются лишь отправной точкой. Для попадания в списки популярного контенту необходимо подтверждение его значимости за пределами платформы.
  2. Количество внешних упоминаний — ключевая метрика: Система явно подсчитывает количество External sources (блоги, новости, соцсети), которые разместили контент. Чем больше разнообразных внешних источников ссылаются на контент, тем выше его верифицированная популярность.
  3. Защита от накруток и нишевого контента: Механизм служит фильтром против искусственного завышения просмотров, так как такой контент редко получает широкое органическое распространение на внешних сайтах. Также он понижает контент, который популярен только в узкой нише и не интересен широкой аудитории.
  4. Географическая релевантность источников: Система учитывает не только факт упоминания, но и то, насколько внешний источник релевантен местоположению пользователя (Geographic relevance). Упоминание на локальном новостном сайте может быть более весомым для локального списка популярного, чем на международном ресурсе.
  5. Взвешенная модель популярности: Итоговый рейтинг определяется комбинацией просмотров, внешних упоминаний и географической релевантности с использованием настраиваемых Predetermined weights.

Практика

Best practices (это мы делаем)

  • Стимулирование Off-Platform дистрибуции: Ключевая стратегия для повышения видимости контента (например, видео) в трендах или списках популярного. Необходимо активно поощрять пользователей и партнеров встраивать (embed) контент на своих сайтах, блогах и делиться им в социальных сетях.
  • Цифровой PR и Outreach: Работайте над получением органических упоминаний и встраиваний контента на новостных сайтах и авторитетных тематических ресурсах. Это напрямую увеличивает метрику Number of external sources.
  • Локальная стратегия продвижения: Для попадания в локальные списки популярного (например, Тренды YouTube в определенной стране) фокусируйтесь на получении упоминаний от географически релевантных внешних источников (местные СМИ, локальные блоги). Это повышает Geographic relevance.
  • Создание вирального контента: Фокусируйтесь на создании контента, который имеет потенциал для широкого распространения и обсуждения за пределами платформы, а не только внутри нее.

Worst practices (это делать не надо)

  • Покупка просмотров и использование ботов: Этот патент описывает механизм, напрямую направленный на борьбу с искусственной инфляцией просмотров. Контент с высокими просмотрами, но нулевым внешним подтверждением, будет отфильтрован из списков популярного.
  • Изолированная оптимизация: Недостаточно оптимизировать контент только под внутренний поиск платформы (например, теги/заголовки на YouTube). Игнорирование внешних сигналов ограничит потенциал попадания в тренды.
  • Создание узконишевого контента без стратегии распространения: Контент, интересный только очень узкой группе пользователей, может набрать много просмотров от них, но не получит внешнего подтверждения и, следовательно, не будет считаться популярным для широкой аудитории.

Стратегическое значение

Патент подтверждает, что платформы Google (такие как YouTube) оценивают жизненность и популярность контента, выходя за рамки собственных метрик. Реальная популярность требует валидации со стороны внешнего интернета. Для SEO-стратегии это означает, что продвижение контента не заканчивается на платформе его размещения. Интеграция SEO, SMM и PR критически важна для максимизации видимости в рекомендательных системах и списках трендов.

Практические примеры

Сценарий: Верификация популярности видео на YouTube

Сравниваем два видео:

  • Видео А: "Как завязать галстук". 1 миллион просмотров (много повторных просмотров от узкой аудитории или частичная накрутка). Внешние источники: 0.
  • Видео Б: "Обзор нового смартфона". 800 тысяч просмотров (органический трафик). Внешние источники: 20 (встроено на TechCrunch, The Verge, 5 популярных блогах и 13 новостных сайтах).
  1. Предварительный список (по просмотрам): Видео А (1М) выше Видео Б (800К).
  2. Верификация: Система проверяет внешние источники.
    • Видео А: 0 внешних источников.
    • Видео Б: 20 внешних источников.
  3. Переранжирование: Система применяет Predetermined weights. Предположим, что вес внешних упоминаний выше веса просмотров.
    • Оценка Видео А снижается из-за отсутствия внешней верификации.
    • Оценка Видео Б значительно повышается за счет 20 внешних источников.
  4. Результат (В тренде): Видео Б занимает более высокую позицию в списке "Популярное", чем Видео А, несмотря на меньшее количество просмотров, так как его популярность подтверждена внешним интернетом.

Вопросы и ответы

К каким сервисам Google применим этот патент?

Патент описывает механизм для Content sharing service. Наиболее очевидным примером является YouTube, где этот механизм может использоваться для формирования вкладки "В тренде" или списков "Популярное". Также принципы внешней верификации популярности могут применяться в Google Discover или Google News для определения наиболее актуальных и широко распространенных материалов.

Означает ли это, что просмотры больше не важны для попадания в тренды?

Нет, просмотры по-прежнему важны. Они используются для формирования Preliminary list — кандидатов на попадание в тренды. Однако, если эти просмотры не подтверждены внешними источниками, контент может быть исключен или понижен в финальном списке. Важен баланс между внутренними просмотрами и внешним распространением.

Какие типы внешних источников учитываются?

В патенте явно упоминаются блоги, новостные сайты и сайты социальных сетей (Claim 8). Система может использовать как вручную зарегистрированный список авторитетных источников, так и автоматические методы для их определения, например, сайты с большим количеством реферального трафика на платформу или просто высокопосещаемые ресурсы.

Как именно учитываются социальные сети? Достаточно ли просто поделиться ссылкой?

Патент не детализирует механизм учета социальных сетей, но указывает, что система отслеживает контент, "обслуживаемый" (served) внешними источниками. Вероятно, учитываются публичные посты, встраивания контента (embeds) и, возможно, объем трафика или вовлеченности, генерируемый этими ссылками. Чем шире контент распространяется в соцсетях, тем выше его верифицированная популярность.

Как работает географическая верификация?

Система стремится показать пользователю контент, популярный в его регионе. Для этого она оценивает Geographic relevance внешних источников. Если видео популярно в Бразилии и встроено на 10 бразильских сайтах, оно получит высокий балл для пользователя из Бразилии. Но для пользователя из Франции эти упоминания будут иметь меньший вес, если нет упоминаний на французских сайтах.

Как этот патент помогает бороться с покупными просмотрами (fake views)?

Он напрямую нейтрализует эффект от накрутки. Если сервис нагоняет миллион просмотров ботами, но видео не получает органического распространения на реальных внешних сайтах (блоги, СМИ, соцсети), его метрика Number of external sources будет равна нулю. При переранжировании такой контент будет отфильтрован как не имеющий реальной широкой популярности.

Что важнее: количество просмотров или количество внешних упоминаний?

Патент предполагает использование Predetermined weights, которые можно настраивать. В приведенном примере показано, что система может придать больший вес количеству внешних упоминаний, чтобы вывести контент с широким распространением выше контента с большим количеством просмотров, но без внешнего подтверждения. На практике, вероятно, используется сложная взвешенная модель.

Влияет ли авторитетность внешнего источника на вес упоминания?

Патент не упоминает оценку авторитетности источников напрямую, он фокусируется на их количестве и географической релевантности. Однако в описании упоминается регистрация "популярных веб-сайтов" для мониторинга. Логично предположить, что система отдает предпочтение упоминаниям на более значимых (популярных) ресурсах.

Как SEO-специалисту использовать эту информацию для продвижения видео?

Необходимо интегрировать стратегию дистрибуции контента в общую SEO и PR стратегию. Активно занимайтесь посевом видео: договаривайтесь о встраивании на релевантных новостных и тематических площадках, стимулируйте обсуждение в блогах и социальных сетях. Это напрямую влияет на шансы попадания в тренды.

Может ли контент попасть в тренды, если у него мало просмотров, но много внешних упоминаний?

Теоретически, да, если веса настроены соответствующим образом. Однако обычно требуется достижение определенного порога просмотров для попадания в Preliminary list. Скорее система работает так: из всех видео с высоким количеством просмотров выше ранжируются те, у которых больше внешних упоминаний.

Похожие патенты

Как Google ранжирует и рекомендует источники контента (каналы, профили) на основе внутренних ссылок, аннотаций и кликов по ним
Google использует механизм для ранжирования и рекомендации источников контента (например, YouTube-каналов или профилей) внутри платформ. Система анализирует, как часто источник упоминается в аннотациях, описаниях и комментариях к контенту, который просматривал пользователь. Ключевым фактором ранжирования является не только количество упоминаний, но и общее число кликов (активаций) по этим ссылкам.
  • US9235625B2
  • 2016-01-12
  • Ссылки

  • Поведенческие сигналы

  • Мультимедиа

Как Google использует сеть доверия между экспертами для расчета Trust Rank и ранжирования контента
Google использует механизм для определения авторитетности контента путем анализа того, какие эксперты (сущности) доверяют друг другу и как они классифицируют (маркируют) контент в интернете. Система рассчитывает «Рейтинг Доверия» (Trust Rank) для каждой сущности и использует его для повышения в выдаче контента, отмеченного доверенными источниками, интегрируя сигналы репутации в алгоритм ранжирования.
  • US7603350B1
  • 2009-10-13
  • EEAT и качество

  • Knowledge Graph

  • SERP

Как Google определяет тематическую авторитетность источников ("каналов") и агрессивно продвигает их свежий контент
Google идентифицирует "каналы" (сайты, блоги, разделы), которые исторически создают высококачественный контент по определенным темам. Система рассчитывает тематическую авторитетность, учитывая качество контента и сфокусированность канала. Когда авторитетный канал публикует новый контент по своей теме, Google может агрессивно повысить его в выдаче, даже если у контента еще нет ссылок или поведенческих сигналов.
  • US8874558B1
  • 2014-10-28
  • EEAT и качество

  • Свежесть контента

  • Индексация

Как Google использует контекст внешних страниц для понимания и идентификации видео и аудио контента
Google анализирует внешние веб-страницы, которые ссылаются на медиафайлы или встраивают их (например, видео YouTube). Система извлекает метаданные из контекста этих страниц — заголовков, окружающего текста, URL. Надежность данных проверяется частотой их повторения на разных сайтах. Эта информация используется для улучшения понимания содержания медиафайла и повышения эффективности систем идентификации контента (Content ID).
  • US10318543B1
  • 2019-06-11
  • Ссылки

  • Индексация

  • Мультимедиа

Как Google использует офлайн-сигналы и авторитетность сущностей для ранжирования контента
Google использует реальные, офлайн-сигналы авторитетности для ранжирования документов, у которых отсутствует естественная ссылочная структура (например, оцифрованные книги). Система оценивает коммерческий успех документа (данные о продажах, списки бестселлеров), репутацию связанных сущностей (автора и издателя) и может переносить ссылочный авторитет с официальных сайтов этих сущностей на сам документ для улучшения его позиций в поиске.
  • US8799107B1
  • 2014-08-05
  • EEAT и качество

  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google Assistant адаптирует выдачу на лету, позволяя пользователям навигировать по результатам и запоминать предпочтения по источникам и темам
Google использует механизм для диалоговых систем (например, Google Assistant), позволяющий пользователям взаимодействовать с поисковой выдачей через естественный язык. Система предоставляет результаты последовательно и адаптирует порядок выдачи в ответ на команды навигации (например, «Вернись к новости о Кафе»). Кроме того, система фиксирует отношение пользователя к атрибутам контента (например, «Не показывай новости из Источника 1») и использует эти данные для фильтрации или изменения ранжирования в текущих и будущих сессиях.
  • US10481861B2
  • 2019-11-19
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google автоматически изучает синонимы, анализируя последовательные запросы пользователей и вариации анкорных текстов
Google использует методы для автоматического определения синонимов, акронимов и эквивалентных фраз. Система анализирует логи запросов: если пользователь быстро меняет запрос, сохраняя часть слов (например, с «отели в париже» на «гостиницы в париже»), система учится, что «отели» и «гостиницы» эквивалентны. Также анализируются вариации анкорных текстов, указывающих на одну и ту же страницу.
  • US6941293B1
  • 2005-09-06
  • Семантика и интент

  • Ссылки

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей
Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.
  • US11379527B2
  • 2022-07-05
  • Семантика и интент

  • Поведенческие сигналы

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует машинное обучение и данные о длительности сессий для выявления битых Deep Links в мобильных приложениях
Google использует систему машинного обучения для анализа того, как долго пользователи взаимодействуют с контентом в приложении после перехода по Deep Link (Presentation Duration). Анализируя распределение этих временных интервалов, система классифицирует ссылку как рабочую или битую без необходимости прямого сканирования контента. Это позволяет Google удалять неработающие ссылки из индекса.
  • US10628511B2
  • 2020-04-21
  • Ссылки

  • Индексация

  • Поведенческие сигналы

Как Google использует контекст пользователя в реальном времени и машинное обучение для переранжирования результатов поиска
Google использует систему для прогнозирования истинного намерения пользователя на основе его текущего контекста (местоположение, время, среда, недавние действия) и исторических данных о поведении других пользователей в аналогичных ситуациях. Система переранжирует стандартные результаты поиска, чтобы выделить информацию (особенно "Search Features"), которая наиболее соответствует прогнозируемому намерению.
  • US10909124B2
  • 2021-02-02
  • Семантика и интент

  • Персонализация

  • SERP

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам
Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).
  • US11609949B2
  • 2023-03-21
  • Антиспам

  • SERP

  • Поведенческие сигналы

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

Как Google использует структурированные данные для отображения прямых ссылок на песни в результатах поиска (Rich Snippets)
Google улучшает результаты поиска музыки, извлекая детали песен (названия, альбомы, продолжительность) из структурированной разметки (например, HTML5 microdata) на веб-страницах. Это позволяет Google отображать прямые ссылки на конкретные песни (вторичные ссылки) внутри основного блока результатов поиска, при условии соблюдения определенных порогов качества и популярности.
  • US9128993B2
  • 2015-09-08
  • Ссылки

  • SERP

  • Индексация

seohardcore