
Google использует модели машинного обучения для оценки релевантности пользовательского контента (например, постов в социальных сетях). Система учитывает не только текст поста, но и контекст его автора (биографию, экспертизу, местоположение). Это позволяет точнее интерпретировать короткие или неоднозначные публикации и повышать в выдаче контент от авторитетных источников.
Патент решает проблему сложности интерпретации и оценки релевантности короткого пользовательского контента (UGC), такого как посты в социальных сетях или комментарии. Такому контенту часто не хватает контекста, что затрудняет автоматическое определение его тематики и авторитетности. Например, пост "Самый длинный гол!" сложно интерпретировать без знания того, о каком виде спорта идет речь. Система улучшает точность (precision) подбора UGC для дополнения основного поискового контента.
Запатентована система и метод интеграции контекста автора (Creator Context Data) в процесс оценки релевантности пользовательского контента (User Post Items). Система использует обученные модели машинного обучения (энкодеры, например, BERT) для создания семантических векторных представлений (embeddings), которые учитывают как содержание поста, так и информацию об авторе. Это позволяет более точно определять релевантность UGC по отношению к заданному поисковому контенту (Search Content).
Система работает путем сравнения контента в векторном пространстве:
Search Content (например, новостная статья или запрос) обрабатывается первым энкодером для создания первого эмбеддинга.User Post Items и связанные с ними Creator Context Data (биография, локация и т.д.) обрабатываются одним или несколькими вторыми энкодерами. Патент описывает три стратегии (Early, Intermediate, Late Fusion) для интеграции контекста автора в итоговые вторые эмбеддинги.Similarity Measure), например, косинусное расстояние, между первым и вторыми эмбеддингами.User Post Items, чьи эмбеддинги наиболее близки к эмбеддингу Search Content.Крайне высокая. Это очень свежая заявка на патент (подана в конце 2023 года). Она напрямую затрагивает актуальные задачи интеграции UGC в поиск (например, блоки Perspectives) и новостные агрегаторы. Акцент на сигналах автора напрямую связан с принципами E-E-A-T и использованием современных технологий ML (Embeddings, BERT) для семантического понимания контента.
Влияние на SEO высокое (85/100). Патент описывает конкретный технический механизм того, как Google оценивает идентичность и экспертизу автора (Creator Context) для понимания и ранжирования UGC. Это имеет прямое значение для стратегий SMM, управления репутацией (ORM) и продвижения через пользовательский контент, подчеркивая критическую важность оптимизации публичных профилей авторов (Author E-E-A-T).
Combining Neural Network) перед сравнением с эмбеддингом поискового контента.Claim 1 (Независимый пункт): Описывает базовый метод определения релевантности UGC с учетом контекста автора.
Search Content в первый эмбеддинг с помощью первого энкодера.User Post Items и связанных с ними Creator Context Data Items (определенных как характеристики автора) во вторые эмбеддинги с помощью одного или нескольких вторых энкодеров.Ядро изобретения — использование контекста автора наряду с содержанием поста для генерации эмбеддингов, используемых при оценке релевантности.
Claim 4 (Зависимый от 1): Описывает реализацию через Раннее слияние (Early Fusion).
Для каждой пары (пост + контекст автора):
Claim 5 (Зависимый от 1): Описывает реализацию через Промежуточное слияние (Intermediate Fusion).
Используются отдельные энкодеры для постов и контекста. Для каждой пары:
Combining Neural Network для генерации итогового второго эмбеддинга.Claim 6 (Зависимый от 1): Описывает реализацию через Позднее слияние (Late Fusion).
Используются отдельные энкодеры. Для каждой пары:
Изобретение затрагивает несколько этапов поисковой архитектуры, фокусируясь на обработке и ранжировании пользовательского контента (UGC).
CRAWLING – Сканирование и Сбор данных
Система сканирует и собирает User Post Items (например, из социальных сетей) и связанную с ними публичную информацию о профилях авторов для получения Creator Context Data.
INDEXING – Индексирование и извлечение признаков
Основной этап предобработки.
Creator Context Data.vector database) для быстрого поиска.QUNDERSTANDING – Понимание Запросов
Если Search Content является пользовательским запросом, на этом этапе генерируется его эмбеддинг (первый эмбеддинг).
RANKING – Ранжирование (L1 - Retrieval)
Описанный механизм является системой отбора кандидатов (Retrieval). Система выполняет поиск ближайших соседей (nearest neighbor search) в векторном пространстве, сравнивая эмбеддинг Search Content с эмбеддингами UGC (которые включают контекст автора), чтобы найти наиболее семантически схожие посты.
METASEARCH / RERANKING
Отобранные посты интегрируются в выдачу или отображаются рядом с основным контентом. На этапе RERANKING могут применяться дополнительные сигналы, такие как популярность автора, свежесть поста или качество написания.
YMYL, спорт, политика), позволяя авторитетным авторам получать больше видимости.Обобщенный процесс работы системы:
Search Content (запрос или статью).User Post Items и связанные Creator Context Items.Combining Neural Network для генерации второго эмбеддинга.Система фокусируется на контентных и авторских факторах:
Исключенные или не приоритетные данные: Патент отмечает, что использование исторических постов автора для определения контекста может быть непрактичным из-за объема данных, вычислительных затрат и изменчивости интересов автора. Предпочтение отдается более стабильным данным профиля.
BERT). Модели обучаются (co-trained) таким образом, чтобы векторы релевантных пар были ближе друг к другу в векторном пространстве.Cosine Similarity, Евклидово сходство, скалярное произведение.Combining Neural Network (Промежуточное слияние): Нейронная сеть (например, полносвязный слой или FFNN) для объединения эмбеддингов поста и автора.Creator Context) для понимания смысла и определения релевантности пользовательского контента, особенно коротких форм. Это не просто анализ текста поста, а анализ поста в контексте того, кто его написал.E-E-A-T для отбора UGC. Знание автора (его биография, экспертиза) используется для оценки авторитетности (authoritativeness) и ценности публикации.bio), указанное местоположение и ссылка на основной сайт должны четко отражать их экспертизу и связь с ключевыми тематиками бизнеса. Это напрямую формирует Creator Context.Creator Context и помогает при локальном ранжировании.Creator Context и уменьшает вероятность того, что контент этих авторов будет высоко ранжироваться.Патент подтверждает стратегический приоритет Google в понимании сущностей и их авторитетности (E-E-A-T), распространяя этот подход на пользовательский контент. Для долгосрочной SEO-стратегии это означает, что инвестиции в развитие личного бренда экспертов и их публичной активности являются конкретным инструментом повышения видимости в поиске. С увеличением интеграции UGC в SERP, способность генерировать авторитетный пользовательский контент становится важным фактором ранжирования.
Сценарий: Повышение видимости мнения эксперта по финансовому запросу
Задача: Добиться появления комментария финансового аналитика компании в поисковой выдаче по запросу "прогноз курса биткоина" (Search Content).
Creator Context (сильно связан с финансами и криптовалютами).Что конкретно входит в понятие "Контекст автора" (Creator Context Data) согласно патенту?
Патент явно перечисляет следующие стабильные характеристики профиля автора: имя пользователя или идентификатор (username/identifier), биографическая информация (описание профиля, Bio), адрес связанного веб-сайта (URL) и географическое местоположение (location). Эти данные используются для определения экспертизы и релевантности автора.
Анализирует ли система историю предыдущих постов автора, чтобы понять его экспертизу?
Патент указывает, что использование исторических постов может быть технически непрактичным из-за большого объема данных, вычислительных затрат и изменчивости интересов автора. Поэтому система предпочитает использовать более стабильные сигналы из профиля автора (биографию, локацию) для аппроксимации его долгосрочных интересов.
Как этот патент связан с E-E-A-T?
Патент напрямую реализует принципы E-E-A-T для пользовательского контента (UGC) и социальных сетей. Анализ Creator Context позволяет алгоритмически оценить экспертизу и авторитетность автора поста. Пост от автора с релевантной экспертизой будет считаться более ценным и получит преимущество при ранжировании.
На какой тип контента этот патент влияет больше всего?
Наибольшее влияние оказывается на короткий пользовательский контент (short-form UGC), такой как посты в социальных сетях и комментарии. Этому типу контента часто не хватает собственного контекста, и информация об авторе становится критически важной для его правильной интерпретации и оценки релевантности.
Что такое стратегии слияния (Fusion Strategies) и в чем разница?
Это три способа объединения данных поста и контекста автора. Early Fusion объединяет текст до обработки моделью (потенциально точнее, но затратнее). Intermediate Fusion обрабатывает их отдельно и объединяет эмбеддинги. Late Fusion обрабатывает их отдельно и объединяет итоговые оценки сходства. Intermediate и Late Fusion более эффективны, так как позволяют кэшировать эмбеддинги авторов.
Как SEO-специалисту на практике использовать информацию из этого патента?
Ключевое действие — стратегическая оптимизация публичных профилей экспертов и авторов компании. Убедитесь, что их биографии, указанные локации и ссылки на сайты четко позиционируют их как экспертов в нужной тематике. Это напрямую улучшает их Creator Context и повышает шансы на видимость их контента в поиске.
Влияет ли количество подписчиков автора на ранжирование его постов согласно этому патенту?
В основных реализациях количество подписчиков не указано как часть Creator Context Data для генерации основного эмбеддинга релевантности. Фокус делается на семантической релевантности биографии автора теме запроса. Однако в описании патента упоминается, что эти данные могут использоваться как отдельный сигнал для определения авторитетности или на этапе переранжирования.
Применяется ли этот механизм только к тексту или также к изображениям и видео?
Патент явно указывает (Claim 7), что механизм применим к различным типам контента. User Post Items могут быть изображениями или видео, размещенными в социальных сетях. В этом случае система также будет анализировать контекст автора, чтобы определить релевантность этих медиафайлов поисковому запросу.
Как система определяет релевантность, если в посте нет ключевых слов из запроса?
Система использует семантический векторный поиск (на основе эмбеддингов). Она оценивает смысловую близость между постом и запросом в векторном пространстве, а не совпадение слов. Кроме того, если контекст автора (Creator Context) сильно релевантен запросу, это может компенсировать недостаток прямой текстовой релевантности поста.
Может ли пост с неоднозначным содержанием ранжироваться высоко благодаря автору?
Да, это один из ключевых аспектов изобретения. Если автор имеет сильный и релевантный Creator Context (например, известен как эксперт в этой области), система использует этот контекст для правильной интерпретации неоднозначного или очень короткого поста и может признать его релевантным и авторитетным.

Семантика и интент
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Индексация
Поведенческие сигналы

Ссылки
Индексация
Мультимедиа

Поведенческие сигналы
Персонализация
EEAT и качество

Персонализация
Семантика и интент
Поведенческие сигналы

Мультимедиа
Поведенческие сигналы
SERP

Поведенческие сигналы
Индексация
SERP

Local SEO
Поведенческие сигналы
Семантика и интент

Семантика и интент
Поведенческие сигналы
SERP

Семантика и интент
SERP
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
EEAT и качество

SERP
Ссылки
Структура сайта

Поведенческие сигналы
SERP

Ссылки
Поведенческие сигналы
Антиспам
