Google использует механизм для корректировки лент контента и результатов поиска. Система определяет долю пользователей с общей характеристикой (например, демография или интересы) в сети. Для пользователей, обладающих этой характеристикой, система гарантирует, что контент от их группы будет представлен в выдаче в пропорции, соответствующей их доле в сети. Это достигается путем повышения оценок релевантности и ранжирования контента от этой группы.
Описание
Какую задачу решает
Патент решает проблему недостаточной представленности (disproportionately less-represented) контента от определенных групп пользователей в социальных сетях или на платформах. Это может происходить, если группа составляет меньшинство или если ее члены менее активны в создании контента. Цель – гарантировать, что лента контента пользователя отражает реальный состав (Composition) сети, повышая вовлеченность за счет показа контента от «похожих» людей.
Что запатентовано
Запатентована система, которая динамически корректирует предоставление электронного контента (в лентах и результатах поиска) на основе характеристик пользователей (демография, интересы). Система определяет долю пользователей с определенной характеристикой в сети (например, 15% увлекаются парусным спортом). При формировании выдачи для пользователя с этой же характеристикой система гарантирует, что контент от этой группы будет представлен в заданной пропорции (например, те же 15%), даже если в стандартной выдаче его было бы меньше.
Как это работает
Механизм работает следующим образом:
- Идентификация групп: Система анализирует профили и онлайн-активность пользователей, чтобы определить общие характеристики (common characteristic) – демографию, интересы, хобби.
- Расчет доли в сети (P1): Определяется пропорция (First Proportion) пользователей с этой характеристикой в рамках всей сети.
- Идентификация пользователя: Система определяет, что текущий пользователь принадлежит к этой группе.
- Определение целевой доли контента (P2): Устанавливается целевая пропорция (Second Proportion) контента от этой группы в ленте пользователя. P2 основана на P1 (может быть равна ей, быть ее множителем, минимумом или максимумом).
- Корректировка выдачи: Система идентифицирует контент от членов этой группы и повышает его relevance scores и ranking scores, чтобы он занял нужную долю (P2) в выдаче и/или был показан на более ранних (высоких) позициях.
Актуальность для SEO
Высокая. Хотя патент изначально ориентирован на социальные сети (например, Google+), описанные принципы глубокой персонализации, основанные на соответствии характеристик автора и потребителя контента, крайне актуальны. Механизмы обеспечения разнообразия и представительства контента для релевантных аудиторных сегментов являются ключевыми для современных рекомендательных систем, таких как Google Discover и персонализированный поиск.
Важность для SEO
Патент имеет важное значение (7/10) для понимания механизмов персонализации и интерпретации сигналов, связанных с идентичностью автора (часть E-E-A-T). Он демонстрирует конкретный механизм, позволяющий повышать контент на основе соответствия характеристик (интересов, демографии) автора и пользователя. Для SEO-стратегий, ориентированных на узкие ниши или конкретные демографические группы, этот механизм может обеспечивать дополнительную видимость в персонализированной выдаче (Search, Discover).
Детальный разбор
Термины и определения
- Characteristic (Характеристика)
- Общий признак группы пользователей социальной сети. Примеры включают демографические данные (местоположение, образование), интересы (хобби, interest in a topic) или сетевую активность (network activity).
- Content Stream (Лента контента)
- Основной интерфейс пользователя в социальной сети или рекомендательной системе, отображающий поток электронного контента.
- First Proportion (P1) (Первая пропорция)
- Доля (процент) пользователей с определенной характеристикой в рамках всей социальной сети (или платформы).
- Second Proportion (P2) (Вторая пропорция)
- Целевая доля контента от пользователей с определенной характеристикой в итоговой выдаче (ленте или результатах поиска), предоставляемой конкретному пользователю. P2 основана на P1.
- Relevance Score (Оценка релевантности)
- Метрика для отбора контента. В контексте патента эта оценка может корректироваться на основе совпадения характеристик пользователя и автора.
- Ranking Score (Оценка ранжирования)
- Метрика для определения позиции контента в выдаче. Может корректироваться для повышения позиций контента от целевой группы на более ранние позиции (earlier positions).
- Social Affinity Score (Оценка социальной близости)
- Метрика, определяющая близость или силу связи между двумя пользователями в социальном графе (Social Graph). Используется для стандартного ранжирования контента.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает базовый механизм предоставления контента.
- Идентификация членов социальной сети с общей характеристикой.
- Определение первой пропорции (P1) – доли, которую эти члены составляют в сети.
- Определение того, что первый пользователь (текущий пользователь) обладает этой же характеристикой.
- Идентификация первого контента от членов сети с этой характеристикой.
- Вывод второго контента (общая выдача) первому пользователю. При этом первый контент составляет вторую пропорцию (P2) от второго контента, и P2 основана на P1.
Claim 4 (Зависимый): Уточняет механизм вывода. Второй контент выводится как часть Content Stream, в котором по крайней мере часть первого контента представлена на более ранних позициях по сравнению с остальным контентом. Это указывает на применение повышения в ранжировании (boosting).
Claim 7 (Зависимый): Описывает применение механизма при получении поискового запроса от пользователя.
- Генерация relevance score для первого контента. Эта оценка основана на том факте, что пользователь обладает данной характеристикой (т.е. релевантность повышается при совпадении характеристик).
- Выбор первого контента на основе этой relevance score.
Claim 9 (Зависимый от 8): Детализирует ранжирование в поиске. Второй контент является результатами поиска.
- Генерируются ranking scores для результатов поиска.
- Ranking scores первого контента (контента от группы) корректируются, чтобы повлиять на его ранжирование относительно другого контента.
Claim 15 (Независимый пункт): Описывает процесс с акцентом на корректировку оценок.
- Определение количества членов сети с характеристикой (пропорции).
- Определение, что пользователь обладает характеристикой.
- Идентификация контента от других членов с этой характеристикой.
- Корректировка Relevance Score на основе пропорции группы в сети.
- Корректировка Ranking Score на основе пропорции группы в сети.
- Вывод контента на основе скорректированных оценок таким образом, что контент от группы выводится на позициях выше (ranked above), чем прочий контент.
Где и как применяется
Изобретение применяется для персонализации лент контента и результатов поиска, используя данные о составе аудитории платформы.
INDEXING – Индексирование и извлечение признаков
На этом этапе система анализирует профили (examining profiles) и онлайн-активность (online activity) пользователей для определения их характеристик (демография, интересы). Эта информация индексируется. Также рассчитывается общий состав сети (P1) для разных характеристик.
QUNDERSTANDING – Понимание Запросов (и пользователя)
При обработке запроса (на поиск или генерацию ленты) система идентифицирует характеристики текущего пользователя.
RANKING / RERANKING – Ранжирование и Переранжирование
Основной этап применения патента.
- Система определяет, что пользователь принадлежит к определенной группе, и рассчитывает целевую пропорцию контента (P2) на основе P1.
- Система корректирует (повышает) relevance scores (для отбора кандидатов) и ranking scores (для позиционирования) для контента, созданного этой группой.
- Происходит финальная сортировка для достижения пропорции P2 в итоговой выдаче и размещения этого контента на более высоких позициях.
Входные данные:
- Данные о составе сети (пропорции P1).
- Характеристики текущего пользователя.
- Набор контента-кандидатов с характеристиками авторов.
- (Опционально) Поисковый запрос пользователя.
Выходные данные:
- Отсортированная лента контента или результаты поиска, в которых контент от целевой группы представлен в заданной пропорции (P2) и/или повышен в ранжировании.
На что влияет
- Конкретные типы контента: В первую очередь влияет на пользовательский контент (UGC) и контент в персонализированных лентах (типа Discover).
- Специфические запросы: Влияет на результаты поиска, проводимого внутри платформы или на веб-поиск, где применяется глубокая персонализация на основе интересов пользователя.
- Конкретные ниши или тематики: Наибольшее влияние в нишах, где пользователи четко классифицированы по интересам (хобби, профессии) или демографии, особенно если эти группы недостаточно представлены в стандартной выдаче.
Когда применяется
- Триггеры активации: Алгоритм активируется, когда система идентифицирует пользователя как члена группы с определенной характеристикой (демография, интерес).
- Условия применения: Применяется для корректировки стандартной выдачи, чтобы обеспечить соответствие состава контента (P2) составу сети (P1). Особенно актуально для групп, которые иначе были бы недостаточно представлены (less-represented).
- Вариативность применения пропорции (Claims 10-13):
- Прямая пропорция (P2 = P1): X% пользователей = X% контента.
- Минимум (Floor): Не менее X% контента.
- Максимум (Ceiling): Не более X% контента.
- Множитель (Multiple): X% * Множитель (например, для продвижения нишевых тем).
Пошаговый алгоритм
Процесс А: Анализ Состава Сети (Офлайн/Периодически)
- Сбор данных: Анализ профилей и онлайн-активности пользователей.
- Идентификация Характеристик: Определение общих характеристик.
- Расчет First Proportion (P1): Определение процента пользователей, обладающих этой характеристикой.
Процесс Б: Генерация Выдачи (Реальное время)
- Идентификация пользователя и его характеристик: Определение, принадлежит ли текущий пользователь к целевой группе.
- Определение целевой пропорции (P2): Установка целевого процента контента в ленте на основе P1.
- Отбор Кандидатов и Идентификация Целевого Контента: Сбор контента и определение, какой контент создан членами целевой группы.
- Корректировка Оценок: Повышение Relevance Scores и/или Ranking Scores для контента от целевой группы. Оценки повышаются, чтобы гарантировать достижение пропорции P2 и/или разместить контент на более высоких позициях.
- Формирование и Вывод Контента: Сортировка контента по скорректированным оценкам и вывод пользователю (Content Stream или результаты поиска).
Какие данные и как использует
Данные на входе
Система использует преимущественно пользовательские данные для определения характеристик и состава сети.
- Пользовательские факторы:
- Профили пользователей (profiles): Используются для идентификации заявленных демографических данных и интересов.
- Онлайн-активность (online activity): История взаимодействий пользователя (поисковые логи, взаимодействие с контентом, веб-сайтами, группами) используется для вывода (inference) характеристик.
- Социальный граф (Social Graph): Данные о связях между пользователями.
- Контентные факторы: Электронный контент (текст, изображения, видео) и метаданные, идентифицирующие автора и его характеристики.
Какие метрики используются и как они считаются
- First Proportion (P1): Рассчитывается как отношение количества членов сети с характеристикой к общему количеству членов сети.
- Second Proportion (P2): Целевая метрика для вывода контента. Рассчитывается на основе P1 (равна, в диапазоне, множитель, минимум/максимум).
- Relevance Score (Скорректированная): Базовая оценка релевантности корректируется (повышается) на основе того, что пользователь и автор контента имеют общую характеристику, и на основе размера этой группы в сети (Claim 15).
- Ranking Score (Скорректированная): Итоговая оценка для сортировки. Также корректируется для повышения позиций контента от целевой группы (Claim 15).
- Social Affinity Score: Упоминается как метрика, которая может использоваться для стандартного ранжирования и которая может быть скорректирована описанным механизмом.
Выводы
- Персонализация на основе групповой идентичности: Google активно использует характеристики пользователей (демография, интересы) для глубокой персонализации выдачи. Совпадение идентичности автора и потребителя контента является фактором ранжирования.
- Механизм гарантированного представительства: Система разработана для обеспечения видимости контента от определенных групп (особенно меньшинств или менее активных пользователей), даже если этот контент имеет более низкие стандартные оценки (например, Social Affinity Scores).
- Бустинг через корректировку оценок: Для достижения нужной пропорции контента система напрямую корректирует (повышает) Relevance Scores и Ranking Scores. Контент от «своей» группы получает преимущество для членов этой же группы.
- Применимость к поиску: Патент явно указывает (Claims 7-9), что этот механизм применяется не только к лентам (Content Streams), но и к обработке поисковых запросов и формированию результатов поиска.
- Гибкость пропорций: Система может не только уравнивать долю контента с долей группы в сети (P2=P1), но и агрессивно продвигать контент, используя множители (например, P2 = 2 * P1) или устанавливая минимальные пороги (Floor).
Практика
Best practices (это мы делаем)
Хотя патент сфокусирован на социальных сетях, описанные механизмы персонализации имеют прямые последствия для SEO, особенно в контексте E-E-A-T, персонализированного поиска и Google Discover.
- Четкое позиционирование и идентичность (E-E-A-T): Необходимо явно демонстрировать принадлежность автора или сайта к определенной нише, группе интересов или экспертизе. Это увеличивает вероятность того, что система идентифицирует контент как исходящий от «источника для этой группы» и применит бустинг для соответствующей аудитории.
- Глубокое понимание целевой аудитории: Создавайте контент, точно зная демографию и интересы вашей аудитории. Если характеристики вашего сайта/автора совпадают с характеристиками целевой аудитории, описанный механизм может дать преимущество в персонализированной выдаче.
- Развитие авторитетности внутри ниши (Niche Authority): Становление узнаваемым источником в рамках определенного сообщества или группы интересов критически важно. Это помогает Google лучше классифицировать характеристики вашего ресурса, что особенно полезно для нишевых тематик, которые могут быть недостаточно представлены в общем индексе.
- Оптимизация под Discover: Применяйте эти принципы при работе с Google Discover. Создание контента, который сильно резонирует с конкретными сегментами аудитории (интересами), увеличивает вероятность его продвижения через механизмы персонализации, подобные описанному.
Worst practices (это делать не надо)
- Размытое позиционирование («Сайт обо всем»): Попытка охватить слишком много тем без четкой идентичности и экспертизы снижает вероятность того, что система сможет классифицировать сайт как принадлежащий к определенной группе интересов, и, следовательно, снижает шансы на получение бустинга по этому механизму.
- Игнорирование сигналов автора: Сокрытие информации об авторах или использование анонимных авторов усложняет для Google определение характеристик источника контента, что мешает применению персонализированного бустинга.
- Оптимизация без учета персонализации: Фокус исключительно на ключевых словах без учета того, кто является целевым потребителем контента и кто его создает.
Стратегическое значение
Патент подтверждает стратегическую важность идентичности создателя контента (автора или бренда) и его соответствия целевой аудитории. Это выходит за рамки традиционной релевантности и подчеркивает важность персонализации на основе общих характеристик. В контексте E-E-A-T это усиливает значение «Experience» и «Authority» не в вакууме, а в привязке к конкретной нише или группе пользователей. Системы предпочитают показывать пользователям контент от людей, похожих на них или разделяющих их интересы.
Практические примеры
Сценарий: Продвижение нишевого хобби в рекомендательной ленте (например, Discover)
- Анализ: Предположим, анализ аудитории показывает, что 5% пользователей Google интересуются «Городским садоводством» (Urban Gardening) (P1=5%), но контента на эту тему мало.
- Действие: Специализированный сайт создает серию статей и видео по городскому садоводству, четко таргетированных на эту аудиторию.
- Механизм Google: Система Discover определяет пользователя как интересующегося «Городским садоводством». Согласно патенту, система стремится заполнить его ленту контентом от релевантных источников в пропорции, близкой к 5% (или выше, если используется множитель для ниш, например P2=10%).
- Корректировка: Чтобы выполнить эту квоту, система повышает Ranking Score и Relevance Score контента специализированного сайта.
- Результат: Сайт получает значительный прирост видимости среди целевой аудитории в Discover, даже если его общая популярность ниже, чем у крупных СМИ.
Вопросы и ответы
Влияет ли этот патент на обычный веб-поиск (Google Search)?
Да. Хотя основной фокус патента – ленты (Content Streams), в нем прямо указано применение этих механизмов к обработке поисковых запросов (Claims 7-9). Система может корректировать relevance scores и ranking scores результатов поиска на основе общих характеристик между пользователем и источником контента. Это особенно актуально для персонализированного поиска и Google Discover.
Как Google определяет «характеристики» пользователя или автора?
Патент упоминает два основных метода (Claim 5 и 6): анализ профилей пользователей (examining profiles), где может быть указана демография или интересы, и анализ онлайн-активности (online activity). Активность включает историю поиска, взаимодействие с контентом, посещенные сайты и участие в группах.
Что означает, что пропорция контента (P2) «основана на» пропорции группы в сети (P1)?
Это не всегда означает точное равенство (P2=P1). Патент описывает гибкость (Claims 10-13): P2 может быть равна P1, находиться в определенном диапазоне от P1, быть множителем P1 (например, если группа маленькая, ее контент могут продвигать агрессивнее, P2 = 2*P1), или P1 может служить минимальным (floor) или максимальным (ceiling) порогом для P2.
Насколько сильно повышается ранжирование контента от целевой группы?
Патент указывает, что контент от целевой группы может быть представлен на более ранних позициях в ленте (Claim 4). В Claim 15 также указано, что скорректированный ranking score приводит к тому, что контент выводится на позициях выше, чем прочий контент. Степень повышения зависит от необходимости достижения целевой пропорции P2.
Применяется ли этот механизм, если пользователь НЕ принадлежит к данной группе?
Основной механизм, описанный в ключевых независимых пунктах (Claim 1 и 15), требует, чтобы пользователь обладал той же характеристикой, что и группа, чей контент продвигается. Однако в описании патента упоминается возможность применения пропорционального вывода для всех пользователей сети, но это не является ядром изобретения.
Как это связано с E-E-A-T?
Этот патент предоставляет механизм, который опирается на идентификацию характеристик источника контента (автора/сайта). Если «характеристика» – это экспертиза в определенной области или принадлежность к профессиональной группе, это напрямую связано с E-E-A-T. Система может предпочесть контент от эксперта для пользователя, интересующегося этой темой.
Что важнее: социальная близость (Social Affinity) или общая характеристика?
В стандартном ранжировании социальных сетей Social Affinity (насколько вы близки с автором) играет ключевую роль. Описанный патент вводит механизм, который может корректировать или даже переопределять ранжирование на основе Affinity, чтобы обеспечить пропорциональное представительство на основе общих характеристик.
Как SEO-специалисту использовать это знание на практике?
Необходимо сосредоточиться на создании четкой идентичности сайта и авторов. Явно демонстрируйте принадлежность к нише или группе интересов через контент, страницу «Об авторе», и активность на внешних площадках. Это поможет Google правильно классифицировать ваш ресурс и потенциально применить бустинг для соответствующей целевой аудитории в персонализированной выдаче.
Может ли этот механизм продвигать низкокачественный контент?
Теоретически да. Если цель системы – выполнить квоту по представительству определенной группы (достичь P2), она может повысить в ранжировании контент от этой группы, даже если его базовые оценки качества или релевантности ниже, чем у другого доступного контента. Главный критерий здесь – принадлежность автора и потребителя к одной группе.
Может ли этот механизм понижать контент от слишком активных групп?
Да. В описании патента упоминается, что аналогичные процессы могут быть использованы для уменьшения количества и заметности контента от чрезмерно представленных (heavily-represented) групп. Это достигается путем понижения их relevance и ranking scores для достижения баланса.