Google может определять интересы пользователя не только по его прямым действиям, но и анализируя интересы его социальных связей (друзей, коллег). Если окружение пользователя активно интересуется определенной темой, система повышает оценку интереса (Interest Score) самого пользователя к этой теме. Эта оценка затем используется для переранжирования поисковой выдачи, лент социальных сетей и рекламы.
Описание
Какую задачу решает
Патент решает проблему неточности определения интересов пользователя, когда анализ основан исключительно на его собственных действиях. В частности, он адресует ситуацию с «экспертными пользователями» (expert users), которые могут обладать глубокими знаниями и высоким интересом к теме, но редко взаимодействуют с базовым контентом по этой теме онлайн (например, мало ищут информацию). Это приводит к ошибочно низкой оценке их интереса (Interest Score). Изобретение улучшает точность профилирования интересов, учитывая активность социального окружения пользователя.
Что запатентовано
Запатентована система для генерации оценки интереса (Interest Score) пользователя к определенной теме. Ключевая особенность — использование модели, которая учитывает не только собственные взаимодействия пользователя с темой (Interest Data), но и данные об интересах пользователей, с которыми он связан через социальные сети или граф связей. Если социальные связи пользователя демонстрируют высокий интерес к теме, его собственный Interest Score также повышается, что затем используется для персонализации сервисов.
Как это работает
Система работает следующим образом:
- Идентификация связей: Определяются пользователи, связанные с целевым пользователем в социальном графе (друзья, контакты).
- Сбор данных (Interest Data): Собираются данные о взаимодействиях целевого пользователя и его связей с конкретной темой. Взаимодействия отслеживаются по разным каналам (поиск, email, чаты) и типам (просмотры, загрузки, запросы).
- Применение модели: Используется модель, которая может быть специфичной для данной темы (Topic ID Model). Эта модель агрегирует данные пользователя и его связей.
- Взвешивание: Модель применяет весовые коэффициенты к разным типам взаимодействий и может учитывать силу связи (strength of a relationship) между пользователями.
- Генерация Interest Score: Вычисляется итоговая оценка интереса пользователя к теме.
- Персонализация: Полученный Interest Score используется для корректировки ранжирования результатов поиска (ranking), приоритезации постов в социальной ленте и таргетинга рекламы.
Актуальность для SEO
Высокая. Персонализация и использование графов связей для понимания контекста пользователя остаются ключевыми направлениями развития поисковых систем. Хотя патент упоминает социальные сети (вероятно, подразумевая Google+), описанные механизмы применимы к любому графу связей, который Google может построить через свои сервисы (Gmail, Контакты, Android, YouTube). Принцип выявления неявных интересов через окружение пользователя актуален для современных систем рекомендаций и поиска.
Важность для SEO
Патент имеет высокое значение (7.5/10) для понимания механизмов персонализации поиска. Он показывает, что видимость контента для конкретного пользователя может зависеть не только от его истории поиска, но и от активности его социального круга. Это подчеркивает стратегическую важность создания контента, который стимулирует глубокое вовлечение и распространение внутри целевых сообществ, так как активность одних пользователей может напрямую влиять на то, что увидят в поиске их связи.
Детальный разбор
Термины и определения
- Interest Score (Оценка интереса)
- Числовая метрика, отражающая прогнозируемый уровень интереса пользователя к определенной теме (Topic). Используется для персонализации.
- Interest Data (Данные об интересах)
- Набор данных о взаимодействиях пользователя (и его связей) с темой. Включает типы взаимодействий и каналы, через которые они произошли.
- Interactions (Взаимодействия)
- Действия пользователя, связанные с темой. Примеры: загрузки, просмотры, комментарии, веб-поиск, email, чаты, события в календаре и т.д.
- Channels (Каналы)
- Платформы или сервисы, через которые происходят Interactions (например, сервис поиска, email-сервис, социальная сеть, мессенджер, карты).
- Model (Модель)
- Алгоритм или формула для генерации Interest Score. Модели могут быть специфичными для тем (Topic ID Model) и используют взвешенные факторы.
- Social Circle / Connections (Социальный круг / Связи)
- Пользователи, связанные с целевым пользователем через социальную сеть или отношения, описанные графом в базе данных.
- Strength of a relationship (Сила связи)
- Метрика, определяющая близость связи между пользователями (например, на основе частоты контактов). Может использоваться для взвешивания влияния интересов друга.
- Expert User (Экспертный пользователь)
- Пользователь с глубокими знаниями в теме, который может редко взаимодействовать с базовым контентом по этой теме онлайн.
- Search Query Score (Оценка поискового запроса)
- Стандартная оценка, отражающая релевантность результата поисковому запросу.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает полный цикл от сбора социальных данных до персонализации поиска.
- Система выбирает пользователей, связанных с целевым пользователем через социальную сеть или граф.
- Для них система получает Interest Data по определенной теме, классифицированные по типам взаимодействий (interaction types).
- Система выбирает специфичную для темы Model из набора моделей. Модель учитывает типы взаимодействий связанных пользователей.
- Система применяет Interest Data связанных пользователей к модели для генерации Interest Score целевого пользователя.
- Применение в поиске: Система получает поисковый запрос от пользователя.
- Определяются стандартные оценки релевантности (Search Query Scores) для результатов.
- Система ранжирует (ranking) результаты на основе комбинации Interest Score пользователя и Search Query Scores.
- Предоставляется персонализированная страница результатов поиска (SERP).
Claim 2 и 3 (Зависимые): Детализируют работу модели с весами.
Модель назначает разные веса (weights) разным типам взаимодействий. Расчет Interest Score основывается на количестве взаимодействий каждого типа и их соответствующих весах. Это означает, что загрузка файла может быть более значимым сигналом интереса, чем просмотр страницы.
Claim 4 (Зависимый): Перечисляет типы взаимодействий.
Включает загрузки, просмотры, комментарии, веб-поиск, явные подтверждения (лайки), события в календаре, чаты, электронные письма, взаимодействия с веб-хранилищем, поиск по картам или видео.
Claim 7 (Зависимый): Расширяет применение на социальные ленты.
Interest Score также используется для корректировки оценок постов в социальной ленте (stream page) и их последующего ранжирования для пользователя.
Где и как применяется
Изобретение затрагивает этапы сбора данных, моделирования пользователя и финального ранжирования.
CRAWLING & Data Acquisition / INDEXING
Система должна постоянно собирать Interest Data о взаимодействиях пользователей через различные сервисы (Channels) и поддерживать актуальность социального графа. Эти данные индексируются и хранятся.
QUNDERSTANDING (Понимание Пользователя)
На этом этапе происходит основная работа по расчету Interest Score. Система использует собранные данные и социальный граф для применения Моделей (Topic ID Model) и расчета оценок интереса по различным темам. Эти оценки формируют профиль пользователя.
RERANKING – Переранжирование (Персонализация)
Это ключевой этап применения в поиске. При получении запроса система извлекает Interest Score пользователя и использует его как сигнал персонализации для корректировки базовых оценок (Search Query Scores) результатов, полученных на этапе RANKING. Это функционирует как Твидлер (Twiddler).
METASEARCH (Применимо к Социальным Лентам)
Механизм также применяется для ранжирования постов в социальных лентах, что аналогично процессу агрегации и смешивания контента перед показом.
Входные данные:
- Социальный граф пользователя (связи).
- Interest Data пользователя и его связей (типы взаимодействий, количество, каналы).
- База данных моделей (Topic ID Models) с весами.
- Поисковый запрос и базовые Search Query Scores.
Выходные данные:
- Interest Score пользователя по теме.
- Персонализированная SERP или лента контента.
На что влияет
- Специфические запросы: Наибольшее влияние на широкие или неоднозначные запросы, где Interest Score помогает уточнить интент пользователя на основе интересов его окружения.
- Конкретные ниши или тематики: Сильное влияние в профессиональных сферах, хобби и других областях, где пользователи формируют сообщества. Особенно актуально для выявления интересов «экспертных пользователей».
- Типы контента: Влияет на ранжирование веб-результатов, постов в социальных сетях и рекламных объявлений.
Когда применяется
- Расчет оценки: Расчет Interest Score может происходить в фоновом режиме (офлайн) или при обновлении значимых данных о взаимодействиях.
- Применение в поиске: Активируется в реальном времени на этапе RERANKING при обработке поискового запроса пользователя.
- Условия: Требуется наличие идентифицируемых социальных связей и достаточного объема Interest Data. Также зависит от настроек приватности пользователя (упоминаются опции opt-in/opt-out).
Пошаговый алгоритм
Процесс А: Расчет Interest Score (Офлайн/Фоновый режим)
- Идентификация темы и пользователя: Определение целевого пользователя и темы (например, ‘Язык Rust’).
- Обход социального графа: Выбор пользователей, связанных с целевым пользователем.
- Сбор Interest Data: Извлечение данных о взаимодействиях с темой ‘Язык Rust’ для пользователя и его связей. Данные агрегируются по типам (поиски, загрузки, email) и каналам.
- Выбор модели: Выбор модели, специфичной для темы ‘Язык Rust’.
- Применение весов и расчет: Interest Data подставляются в модель. Веса применяются в зависимости от:
- Типа взаимодействия (загрузка весит больше просмотра).
- Силы связи (strength of a relationship) между пользователями (интересы близкого коллеги весят больше).
Пример формулы из патента: (w1 * UserDownloads) + … + (w3 * Sum(FriendsInterest)) + (w4 * NumFriends(>100 Views)) + … = Interest_Score.
- Сохранение результата: Рассчитанный Interest Score сохраняется в профиле пользователя.
Процесс Б: Персонализация Поиска (Реальное время)
- Получение запроса: Пользователь вводит запрос (например, «лучшие новые языки программирования»).
- Генерация базовых результатов: Система рассчитывает базовые Search Query Scores.
- Извлечение Interest Score: Система извлекает Interest Score пользователя по теме ‘Язык Rust’.
- Корректировка оценок (Reranking): Базовые оценки результатов корректируются на основе Interest Score. Результаты про Rust получают повышение.
- Выдача результата: Формируется персонализированная SERP.
Какие данные и как использует
Данные на входе
Система использует обширный набор поведенческих и социальных данных, собранных из разных источников (Channels).
- Поведенческие факторы (Interactions): Это ключевые данные. Включают: загрузки (downloads), просмотры (views), комментарии (comments), показы (impressions), веб-поиск (web searches), явные подтверждения (explicit confirmations, например, лайки).
- Коммуникационные и Временные факторы: События в календаре (calendar-based interactions), чаты (chats), электронные письма (e-mails).
- Технические факторы: Взаимодействия с веб-хранилищем (web-based storage interactions).
- Мультимедиа и Географические факторы: Поиск на картах (map-based searches), поиск видео (video-based searches).
- Социальные факторы (User Factors):
- Структура социального графа (связи).
- Сила связи (strength of a relationship), основанная на частоте контактов.
- Interest Data связанных пользователей.
Какие метрики используются и как они считаются
- Interest Score: Основная метрика. Вычисляется путем применения Model к Interest Data.
- Модели (Topic ID Models): Используют взвешенную сумму факторов. Пример из патента: (w1 * UserDownloads) + (w2 * UserViews) + … + (w3 * Sum(FriendsInterest)) + (w4 * NumFriends(>100 Views)) + (w5 * Friends(Views + Downloads + Queries)) = Interest_Score.
- Весовые коэффициенты (Weights wi): Применяются к различным типам взаимодействий. Веса зависят от типа взаимодействия, канала и, возможно, силы социальной связи.
- Агрегация социальных данных: Система использует агрегированные метрики окружения: сумма интересов друзей, количество друзей с интересом выше порога, общая активность друзей.
- Нормализация: Interest Score может быть нормализован (например, в диапазоне [0, 1]).
Выводы
- Социальный контекст как фактор персонализации: Патент подтверждает использование активности социального окружения пользователя для вывода о его собственных интересах. Интересы могут быть «унаследованы» от друзей или коллег.
- Решение проблемы «Экспертного пользователя»: Система стремится выявить интерес, даже если пользователь сам не проявляет явной активности по теме, анализируя его окружение.
- Глубокое профилирование и Кросс-канальный сбор данных: Google агрегирует Interest Data из множества источников (Channels), включая поиск, почту, календари, чаты, для построения комплексного профиля интересов.
- Гранулярность и Взвешивание взаимодействий: Не все действия равны. Система использует разные веса для разных типов взаимодействий (загрузка vs просмотр) и учитывает силу социальных связей (strength of a relationship).
- Interest Score как прямой сигнал для Reranking: Рассчитанный Interest Score напрямую используется для переранжирования результатов поиска, комбинируясь со стандартными оценками релевантности (Search Query Scores).
Практика
Best practices (это мы делаем)
- Построение и вовлечение сообществ: Стимулируйте органическое взаимодействие и распространение контента внутри целевых сообществ (профессиональных или по интересам). Если контент становится популярным в определенном социальном графе, участники этого графа с большей вероятностью увидят его в своей персонализированной выдаче за счет повышенного Interest Score.
- Фокус на высокоценных взаимодействиях: Поскольку разные типы взаимодействий имеют разный вес, создавайте контент, стимулирующий более глубокое вовлечение: загружаемые ресурсы (Downloads), обсуждения (Comments), добавление событий в календарь. Это генерирует более сильные сигналы Interest Data.
- Кросс-канальная стратегия контента: Учитывайте, что Google собирает данные из разных каналов. Присутствие бренда и вовлечение пользователей на разных платформах (YouTube, Поиск, Карты, рассылки по Email) способствует формированию более четкого профиля интересов аудитории и их связей.
- Анализ P-SERP (Персонализированной выдачи): При анализе эффективности SEO необходимо учитывать влияние персонализации. Понимайте, как выдача меняется для вашей целевой аудитории с определенным профилем интересов, а не только в «чистой» выдаче.
Worst practices (это делать не надо)
- Игнорирование персонализации: Оптимизация только под общую релевантность и игнорирование того факта, что выдача сильно адаптируется на основе интересов пользователя и его окружения.
- Создание искусственных социальных графов/Накрутка: Попытки манипулировать Interest Score через ботов или фейковые аккаунты неэффективны, так как система учитывает реальную активность (Interest Data) и силу связей (strength of a relationship), основанную на частоте коммуникаций.
- Изолированный контент: Создание контента, который не стимулирует обсуждение или распространение внутри сообщества, упускает возможность использовать механизм социального влияния на персонализацию поиска.
Стратегическое значение
Патент подчеркивает стратегический сдвиг от анализа изолированного поведения пользователя к анализу его социального контекста. Для SEO это означает, что стратегии продвижения должны быть тесно интегрированы с SMM и комьюнити-менеджментом. Способность контента генерировать социальный отклик и вовлечение становится косвенным, но мощным фактором ранжирования через механизм персонализации. Долгосрочный успех зависит от способности бренда формировать реальный интерес и становиться значимым для целевых сообществ.
Практические примеры
Сценарий: Персонализация выдачи для разработчика (Влияние коллег)
- Пользователь и Граф: Пользователь — опытный C++ разработчик (Expert User). Он редко ищет информацию по программированию. Однако многие из его близких контактов (идентифицированных через Gmail/Chat/Календарь как коллеги) в последнее время активно загружают SDK и ищут документацию для языка Rust.
- Сбор Interest Data: Система фиксирует эту активность (загрузки, поиски) у коллег, связанную с темой «Rust».
- Расчет Interest Score: Используя Model и учитывая высокую силу связей (Strength of a relationship) с этими контактами, система значительно повышает Interest Score пользователя по теме «Rust».
- Поисковый запрос: Пользователь вводит широкий запрос: «новые тенденции в системном программировании».
- Персонализация (Reranking): Из-за высокого Interest Score по теме «Rust», система переранжирует выдачу и поднимает результаты, связанные с Rust, выше, хотя сам пользователь его не искал.
- Результат для SEO: Сайт, продвигающий курсы по Rust, получит высокую видимость в персонализированной выдаче этого разработчика благодаря активности его коллег.
Вопросы и ответы
Означает ли этот патент, что социальные сигналы (лайки, шеры) являются прямым фактором ранжирования?
Нет, это не фактор глобального ранжирования. Патент описывает использование социальных связей и активности для расчета персонального Interest Score пользователя. Этот показатель затем используется для персонализации (Reranking) выдачи только для этого пользователя. Это мощный механизм персонализации, а не общего ранжирования.
Как Google определяет связи между пользователями, особенно после закрытия Google+?
Патент упоминает связи через социальную сеть ИЛИ через «отношения, описанные графом, хранящимся в базе данных». Google может строить этот граф, анализируя взаимодействия в других продуктах: контакты в Gmail и Android, частоту общения в Google Chat, совместные события в Календаре или общие документы в Google Workspace.
Учитывается ли сила социальной связи при расчете интереса?
Да. В патенте упоминается возможность взвешивания Interest Data на основе strength of a relationship. Интересы близкого друга или коллеги, с которым пользователь часто общается (например, по email или в чате), будут оказывать большее влияние на его Interest Score, чем интересы случайного контакта.
Что такое проблема «экспертного пользователя» (Expert User), упомянутая в патенте?
Это ситуация, когда пользователь хорошо разбирается в теме и поэтому редко ищет базовую информацию о ней. Традиционные методы могут ошибочно заключить, что тема ему неинтересна. Патент решает эту проблему, анализируя интересы его социального окружения (предполагая, что эксперты общаются с другими экспертами), чтобы выявить скрытый интерес.
Какие типы взаимодействий (Interactions) наиболее важны?
Патент перечисляет множество типов (загрузки, просмотры, комментарии, поиски, email и т.д.) и указывает (Claim 2), что модель применяет к ним разные веса. Конкретные веса не указаны, но активные действия (загрузки, комментарии, общение по теме) логично предположить как более весомые, чем пассивные просмотры.
Что такое «Model» и почему они специфичны для тем (Topic ID Model)?
Модель — это формула, определяющая, как комбинировать и взвешивать Interest Data. Они специфичны для тем, потому что природа интереса различается. Например, для темы «Рецепты» просмотры видео могут быть важны, а для темы «Программирование» — загрузки кода или активность в веб-хранилище.
Как SEO-специалисту использовать эти знания на практике?
Необходимо сфокусироваться на построении и вовлечении целевых сообществ. Создавайте контент, который стимулирует высоковесомые взаимодействия (комментарии, загрузки) и распространение в профильных социальных кругах. Это повысит Interest Score участников сообщества и их связей, улучшая видимость вашего сайта в их персонализированной выдаче.
Может ли этот механизм объяснить, почему я вижу контент, который я не искал, но который интересен моим друзьям?
Да, это именно тот сценарий. Если ваши друзья активно интересуются темой и система идентифицирует их как вашу социальную связь, ваш Interest Score по этой теме повышается. В результате система может подмешивать этот контент в вашу поисковую выдачу или ленту для улучшения релевантности.
Как этот патент влияет на мониторинг позиций сайта?
Он подчеркивает ограниченность стандартного мониторинга позиций в «стерильной» выдаче. Поскольку выдача может быть сильно персонализирована на основе социального графа пользователя, реальная видимость сайта для целевой аудитории может существенно отличаться. Необходимо учитывать фактор персонализации при оценке эффективности SEO.
Какова связь этого патента с E-E-A-T?
Прямой связи нет. E-E-A-T фокусируется на оценке качества и авторитетности контента и его создателей для глобального ранжирования. Данный патент описывает сигналы для оценки интересов конкретного пользователя с целью персонализации выдачи. Это разные системы, работающие на разных этапах поисковой архитектуры.