Google анализирует активность контактов пользователя в социальных сетях (посты, комментарии, лайки) и извлекает из этого контента ключевые фразы (n-grams). Эти фразы ранжируются по значимости, учитывая объем активности и близость контактов (affinity). Наиболее релевантные фразы используются для генерации персонализированных подсказок или рекомендуемых действий внутри социальной платформы.
Описание
Какую задачу решает
Патент решает проблему безличности и «роботизированности» стандартных систем рекомендаций и подсказок (например, основанных только на общих трендах или личной истории поиска), особенно в контексте социальных сетей (Social Networking Services). Традиционные системы часто игнорируют социальные данные, генерируемые контактами пользователя. Изобретение направлено на создание более персонализированных и социально-релевантных подсказок для улучшения пользовательского опыта и стимулирования взаимодействия.
Что запатентовано
Запатентована система генерации персонализированных подсказок на основе анализа социальной активности контактов пользователя. Система собирает контент (посты, комментарии, шейры), связанный с контактами, извлекает из него ключевые фразы или темы (n-grams) и ранжирует их на основе критериев социальной значимости. Ключевыми критериями являются объем активности и степень близости (affinity) между пользователем и вовлеченными контактами.
Как это работает
Система работает следующим образом:
- Идентификация контактов и Affinity: Система определяет контакты пользователя и их близость (affinity), используя Social Graph.
- Сбор контента: Собираются данные о социальной активности (Social Content Items) этих контактов (посты, лайки, комментарии), которые видны пользователю (с учетом access rights).
- Анализ и извлечение: Из собранного контента извлекаются n-grams (фразы-кандидаты).
- Ранжирование: Кандидаты ранжируются по Significance Criteria. Учитывается объем активности вокруг фразы, affinity контактов, обсуждающих тему, и общая популярность.
- Отображение: Наиболее значимые n-grams представляются пользователю как подсказки (например, в автозаполнении) или рекомендуемые действия (recommended actions), часто с указанием связанных контактов для стимулирования вовлеченности.
Актуальность для SEO
Средняя/Низкая (для Web Search SEO). Персонализация остается критически важной задачей. Однако прямая зависимость от активности в конкретных социальных сетях (подобных Google+, для которых, вероятно, разрабатывался этот механизм) снизилась. Принципы использования социальных сигналов, анализа n-grams и учета близости контактов (affinity) остаются актуальными, но могут применяться с использованием более современных NLP-технологий и в рамках других продуктов Google (например, Discover, YouTube).
Важность для SEO
(2/10). Влияние на традиционное SEO (ранжирование в веб-поиске) минимальное. Патент сфокусирован на генерации подсказок и рекомендаций внутри социальной сети или персонализированной ленты на основе активности известных контактов. Он не описывает механизмы ранжирования веб-контента. Патент имеет значение для Social Media Optimization (SMO) и стратегий вовлечения на платформах, использующих подобные механизмы персонализации.
Детальный разбор
Термины и определения
- Affinity (Близость, Аффинити)
- Метрика, указывающая на степень связи или близости между пользователем и одним или несколькими его контактами или группами контактов. Используется для взвешивания значимости активности этих контактов.
- Contacts (Контакты)
- Другие пользователи, с которыми связан основной пользователь в одной или нескольких социальных сетях.
- N-gram (N-грамма)
- Последовательность из ‘n’ элементов (символов или слов) из заданного текста. Используется для извлечения фраз-кандидатов из социального контента. Также может относиться к вероятностной языковой модели (probabilistic language model).
- Recommended Actions (Рекомендуемые действия)
- Предлагаемые пользователю действия для выполнения в социальной сети, основанные на сгенерированных подсказках.
- Significance Criteria (Критерии значимости)
- Метрики, используемые для ранжирования n-grams. Включают объем активности (volume of activity), близость (affinity), популярность (popularity) и релевантность действиям пользователя (relevance to user activity).
- Social Content Items / Social Activity (Элементы социального контента / Социальная активность)
- Контент и действия, связанные с взаимодействием пользователей. Включает посты, комментарии (comment), лайки/одобрения (endorsement), рекомендации (recommendation), теги (tagging), шейры (share).
- Social Graph (Социальный граф)
- Структура данных, хранящая информацию о пользователях и их связях в социальной сети.
- Social Networking Service (SNS) (Сервис социальной сети)
- Онлайн-платформа для построения социальных отношений.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод генерации и отображения социально-релевантных подсказок.
- Выбор набора n-grams из social content items. Контент связан с активностью пользователя в SNS.
- Присвоение оценки (Score) каждому n-gram на основе significance criteria.
- Генерация подсказок-кандидатов на основе оценок. Ключевой момент: подсказки включают рекомендуемые действия (recommended actions) внутри SNS.
- Идентификация контактов или групп контактов, связанных с конкретной подсказкой.
- Предоставление этих контактов/групп для отображения вместе с подсказкой. Цель — стимулирование дальнейшей активности пользователя (facilitate additional user activity) в SNS.
Claim 3 (Зависимый): Детализирует, что входит в significance criteria.
Критерии включают одно или несколько из: популярность n-grams, объем социальной активности в отношении контента, социальная близость (social affinity) пользователя и контактов, уровень интереса пользователя к контенту, связанному с n-grams, или релевантность n-grams активности пользователя.
Claim 6 (Зависимый): Учитывает приватность.
Система использует только тот социальный контент, который виден пользователю в соответствии с правами доступа (access rights).
Claim 12 (Независимый пункт — Система): Описывает систему, реализующую аналогичную логику, с фокусом на обработку запроса.
- Получение запроса на предоставление подсказок пользователю.
- Идентификация данных о социальной активности и взаимодействии, связанных с пользователем и его контактами в SNS.
- Анализ данных и выбор набора n-grams.
- Присвоение оценки (Score) каждому n-gram и генерация подсказок-кандидатов (включая рекомендуемые действия).
- Идентификация контактов/групп, связанных с конкретным n-gram, на основе того, в каких данных этот n-gram появился.
- Предоставление контактов/групп для отображения вместе с подсказкой.
Где и как применяется
Изобретение предназначено для использования преимущественно в инфраструктуре Социальной сети (Social Networking Service) или системы персонализированных рекомендаций.
CRAWLING & Data Acquisition – Сбор данных
Система собирает данные о социальной активности (посты, шейры, комментарии, одобрения) от службы социальной сети. Это не стандартный веб-краулинг, а сбор данных внутри платформы.
INDEXING – Индексирование и извлечение признаков
На этом этапе происходит несколько ключевых процессов:
- Анализ Social Graph для определения контактов и социальных групп пользователя.
- Расчет и сохранение метрик близости (Affinity scores) между пользователями.
- Обработка собранного социального контента и предварительное извлечение из него n-grams.
QUNDERSTANDING – Понимание Запросов (или этап генерации подсказок)
Основная логика патента применяется здесь. Когда система получает запрос на генерацию подсказок (например, пользователь начинает вводить текст в поисковую строку для автозаполнения или загружает ленту новостей):
- Система анализирует проиндексированный социальный контент от контактов пользователя.
- Происходит ранжирование n-grams на основе Significance Criteria.
RERANKING – Переранжирование (Персонализация)
Финальный набор подсказок корректируется с учетом специфики пользователя, его конкретных контактов и рассчитанных Affinity scores. Подсказки обогащаются данными о связанных контактах.
Входные данные:
- Social Graph (информация о связях и группах).
- User Activity Data (посты, комментарии, лайки контактов).
- Метрики Affinity.
- Запрос на предоставление подсказок.
Выходные данные:
- Ранжированный список подсказок (n-grams).
- Список ассоциированных контактов для каждой подсказки.
- Рекомендуемые действия (Recommended actions).
На что влияет
- Типы контента: В первую очередь влияет на видимость тем, сущностей и обсуждений, которые популярны внутри социального круга пользователя на платформе.
- Специфические запросы: Влияет на автозаполнение (auto-complete suggestions) и рекомендации тем при использовании поиска внутри социальной сети или в персонализированных лентах.
- Конкретные ниши: Не зависит от тематики, но полностью зависит от того, какие темы обсуждают контакты пользователя.
Когда применяется
- Триггеры активации: Активируется, когда системе необходимо предоставить пользователю подсказки. Это может происходить при взаимодействии с поисковой строкой, при загрузке персонализированной ленты контента или в виджете рекомендаций.
- Условия применения: Пользователь должен иметь контакты, и эти контакты должны генерировать социальную активность, видимую пользователю (с учетом access rights).
Пошаговый алгоритм
- Инициация: Система получает индикацию запроса на предоставление подсказок пользователю.
- Идентификация контактов и контента: Определяются контакты пользователя (на основе Social Graph) и собираются связанные с ними Social Content Items (активность), которые видны пользователю.
- Анализ и генерация N-grams: Собранный контент анализируется. Применяется n-gram modeling для извлечения последовательностей слов (фраз), которые являются статистически значимыми или часто встречающимися.
- Фильтрация кандидатов: Сгенерированные n-grams могут фильтроваться (например, удаление неприемлемого контента).
- Расчет оценок значимости (Scoring): Каждому n-gram присваивается оценка на основе Significance Criteria. Оценка учитывает:
- Объем социальной активности, связанной с n-gram (количество постов, комментариев).
- Близость (Affinity) между пользователем и контактами, связанными с n-gram.
- Популярность слов в n-gram (в описании патента упоминается возможность использования модели типа TFIDF).
- Релевантность текущим действиям или интересам пользователя.
- Ранжирование и выбор: N-grams сортируются по оценке значимости. Выбирается Топ-N кандидатов.
- Генерация подсказок и действий: Выбранные кандидаты используются для генерации подсказок. Также определяются рекомендуемые социальные действия (recommended social actions).
- Обогащение данных: Для выбранных подсказок идентифицируются связанные контакты или группы контактов.
- Предоставление результата: Выбранные подсказки предоставляются пользователю, отображаясь вместе со связанными контактами и рекомендуемыми действиями.
Какие данные и как использует
Данные на входе
- Контентные факторы: Текст постов, комментариев, описаний, теги, связанные с социальной активностью контактов. Это основной источник для извлечения n-grams.
- Поведенческие/Социальные факторы:
- Типы взаимодействия контактов с контентом (comment, endorsement, recommendation, tagging, share, posting).
- История активности самого пользователя используется для определения его уровня интереса (level of interest) и расчета Affinity.
- Структурные факторы (SNS):
- Social Graph: данные о связях между пользователями.
- Social Circles/Social Groups: данные о группах контактов.
- Access rights: данные о правах доступа и видимости контента.
Какие метрики используются и как они считаются
- Affinity Score (Оценка близости): Степень связи между пользователем и его контактами. Патент не уточняет формулу расчета, но указывает, что она базируется на Social Graph и данных об активности.
- Volume of Activity (Объем активности): Количество социальных действий (постов, шейров, комментариев, лайков), связанных с конкретным n-gram.
- Popularity (Популярность): Частота использования слов или фраз. В описании патента упоминается возможность использования моделей значимости, таких как TFIDF.
- Relevance (Релевантность): Соответствие n-gram текущим действиям пользователя (например, вводимому запросу) или его интересам.
- Методы анализа текста: Используется N-gram modeling — вероятностные языковые модели для оценки значимости фраз в контенте.
Выводы
- Фокус на социальной персонализации: Патент описывает механизм глубокой персонализации подсказок, где источником данных является активность известных контактов пользователя в социальной сети.
- Affinity как ключевой сигнал: Социальная близость (Affinity) является критически важным фактором ранжирования. Система придает больший вес контенту от контактов, с которыми пользователь взаимодействует чаще.
- Социальная значимость важнее глобальной популярности: Приоритет отдается тому, что обсуждают контакты пользователя (Volume of Activity) и насколько они близки (Affinity), а не общим трендам интернета.
- N-grams как индикаторы тем: Извлечение n-grams используется как метод для автоматического определения тем или трендов, циркулирующих внутри социального круга.
- Стимулирование вовлеченности через атрибуцию: Система явно связывает подсказки с контактами, которые генерировали активность (отображая их рядом с подсказкой), и предлагает recommended actions, что направлено на повышение вовлеченности внутри платформы.
- Ограниченное влияние на Web SEO: Патент является инфраструктурным для социальных платформ и не дает практических выводов для ранжирования в общем веб-поиске (SEO). Он актуален для SMO или стратегий вовлечения в рамках персонализированных платформ.
Практика
ВАЖНО: Патент скорее инфраструктурный для социальных платформ и не дает прямых практических выводов для традиционного SEO (ранжирования в веб-поиске). Приведенные ниже рекомендации относятся к Social Media Optimization (SMO) и стратегиям повышения видимости в персонализированных лентах (например, Google Discover), если подобные механизмы там используются.
Best practices (это мы делаем)
- Стимулирование естественного социального вовлечения: Поощряйте пользователей делиться вашим контентом, комментировать его и ставить лайки (shares, comments, endorsements). Эта активность является входными данными для систем генерации персонализированных подсказок на релевантных платформах.
- Построение близости (Affinity) с аудиторией: Работайте над повышением Affinity с вашей целевой аудиторией через регулярное взаимодействие. Чем выше близость (в рамках платформы, например, YouTube или Discover), тем больший вес имеет ваша активность при генерации подсказок для ваших подписчиков.
- Использование естественного языка и актуальных фраз: Используйте четкие, естественные формулировки (легко извлекаемые n-grams), которые отражают то, как пользователи обсуждают темы. Это повышает вероятность того, что ключевые фразы из вашего контента будут выбраны в качестве подсказок в персонализированных системах.
Worst practices (это делать не надо)
- Искусственная накрутка социальной активности: Создание фейковой активности через бот-сети неэффективно для этого механизма. Система опирается на Affinity scores в рамках реального Social Graph или паттернов взаимодействия. Спам от аккаунтов с низкой близостью будет иметь малый вес.
- Переоптимизация и Keyword Stuffing в социальных медиа: Насыщение постов ключевыми словами может выглядеть неестественно. Механизмы типа n-gram modeling ищут статистически значимые языковые паттерны, а не просто плотность ключевых слов.
- Ожидание влияния социальных сетей на веб-ранжирование: Не следует строить SEO-стратегию, полагаясь на то, что активность в социальных сетях напрямую улучшит позиции в Google Search, основываясь на этом патенте.
Стратегическое значение
Патент подтверждает интерес Google к использованию социальных сигналов и сигналов взаимодействия как мощного инструмента для персонализации. Хотя прямые реализации в виде конкретных социальных сетей (таких как Google+) могли уйти на второй план, базовый принцип — действия доверенных связей являются сильными рекомендательными сигналами — сохраняется. Эти принципы могут использоваться в системах типа Google Discover или при персонализации YouTube, где механизмы определения «связей» и Affinity эволюционировали за пределы явных социальных графов.
Практические примеры
Прямых практических примеров для стандартных стратегий SEO нет. Пример ниже иллюстрирует работу механизма.
Сценарий: Повышение видимости нового продукта в персонализированных подсказках.
Бренд электроники запускает новый смартфон «Vector X Pro».
- Действие (SMO): Бренд активно публикует контент о смартфоне на платформах с социальными функциями (например, YouTube) и стимулирует обсуждение, например, «камера Vector X Pro». Лидеры мнений (Influencers) также публикуют обзоры.
- Механизм: Пользователь подписан на бренд и нескольких лидеров мнений (высокий Affinity). Система фиксирует высокую активность (Volume of Activity: много комментариев и шейров) вокруг этой темы.
- Извлечение N-gram: Система извлекает n-gram «камера Vector X Pro» из текстов постов и комментариев.
- Ранжирование: Благодаря высокому объему активности и высокому Affinity контактов, этот n-gram получает высокую оценку значимости для данного пользователя.
- Результат: Когда пользователь открывает свою персонализированную ленту или начинает вводить «Vector…» в поиске на платформе, система предлагает подсказку «камера Vector X Pro». Рядом с подсказкой могут отображаться аватары авторов или контактов, которые это обсуждали.
Вопросы и ответы
Влияет ли этот патент на ранжирование сайтов в Google Поиске?
Нет, напрямую не влияет. Патент описывает механизм генерации подсказок (suggestions) и рекомендаций контента внутри социальной сети или персонализированной ленты. Он не описывает алгоритмы ранжирования веб-страниц в основном индексе Google.
Что такое n-gram в контексте этого патента?
N-gram — это фраза (последовательность слов), извлеченная из текстов социальной активности (постов, комментариев). Система анализирует эти фразы, чтобы понять, какие темы обсуждаются контактами пользователя, и использует их как кандидатов для подсказок.
Как система определяет, какая подсказка более значима (Significance Criteria)?
Значимость определяется комбинацией факторов: Volume of Activity (как много обсуждается тема), Affinity (насколько близки пользователю те, кто ее обсуждает), Popularity (общая популярность фразы) и Relevance (релевантность текущим действиям пользователя).
Что такое Affinity и как она рассчитывается?
Affinity (близость) — это мера того, насколько тесно пользователь связан с контактом. Патент не дает формулы, но указывает, что она основана на структуре Social Graph и истории взаимодействий. На практике это означает, что активность близких друзей или часто взаимодействующих контактов весит больше.
Зачем система показывает контакты рядом с подсказкой?
Это ключевая особенность патента (Claim 1 и 12). Отображение связанных контактов призвано повысить социальную релевантность подсказки и стимулировать дальнейшее взаимодействие пользователя (facilitate additional user activity) внутри социальной сети.
Может ли этот механизм использоваться в Google Discover или YouTube?
Хотя патент сфокусирован на Social Networking Services, описанные принципы — анализ активности связей и расчет Affinity для генерации рекомендаций — могут применяться в Discover и YouTube. Однако в этих продуктах источником связей могут быть не только явные социальные графы, но и другие сигналы взаимодействия пользователя с авторами или контентом.
Как SEO-специалист может использовать информацию из этого патента?
Для традиционного SEO польза минимальна. Для SMO и продвижения в персонализированных лентах это подчеркивает важность построения реального вовлечения и близости (Affinity) с аудиторией на соответствующих платформах, а не просто накрутки лайков.
Учитывает ли система настройки приватности?
Да. В патенте (например, Claim 6) упоминается, что система учитывает access rights. Для анализа используется только тот социальный контент, который виден пользователю в соответствии с настройками приватности его контактов.
Что такое «рекомендуемые действия» (recommended actions), упоминаемые в патенте?
Помимо предложения темы или поискового запроса (n-gram), система может предлагать конкретные действия внутри социальной сети, связанные с этой темой. Например, прокомментировать пост друга, поделиться контентом или присоединиться к обсуждению.
Эффективны ли накрутки социальной активности против этого алгоритма?
Накрутки малоэффективны, так как система использует метрику Affinity. Чтобы повлиять на подсказки конкретного пользователя, необходимо генерировать активность от аккаунтов, которые имеют высокий Affinity с этим пользователем. Массовая активность от ботов будет иметь минимальный вес.