Close Menu
    Telegram
    SEO HARDCORE
    • Разборы патентов
      • Патенты Google
      • Патенты Яндекс
    • Скоро
      SEO инструменты
    • Скоро
      SEO аналитика
    SEO HARDCORE
    Разборы патентов • Патенты Google

    Как Google агрегирует и автоматически кластеризует социальные связи пользователя из разных источников

    PROCESSING SOCIALLY NETWORKED ENTITIES (Обработка сущностей в социальных сетях)
    • US9258264B1
    • Google LLC
    • 2016-02-09
    • 2012-03-30
    2012 Патенты Google Персонализация

    Патент Google описывает систему для сбора данных о социальных связях пользователя из различных сервисов (контакты, микроблоги, мессенджеры). Система анализирует интенсивность взаимодействия и социальную дистанцию, чтобы автоматически формировать группы (кластеры) контактов. Это инфраструктурный патент, направленный на управление социальным графом, а не на ранжирование в веб-поиске.

    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх

    Описание

    Какую задачу решает

    Патент решает проблему фрагментации и сложности управления социальными связями пользователя, которые распределены по множеству различных сервисов (например, управление контактами, микроблогинг, мессенджеры). Цель изобретения — автоматически организовать эти связи в осмысленные группы на основе реальных паттернов взаимодействия и социального контекста, минимизируя необходимость ручного управления списками контактов.

    Что запатентовано

    Запатентована система обработки данных социальных сетей (social network data). Система агрегирует данные из множества источников и анализирует взаимоотношения, вычисляя ключевые метрики: intensity of interaction (интенсивность взаимодействия) и social distance (социальная дистанция). На основе этого анализа система автоматически определяет значимые подмножества (subsets) или кластеры контактов пользователя.

    Как это работает

    • Агрегация данных: Система извлекает данные о взаимоотношениях (relationship data) и профилях (profile data) из нескольких серверов, предоставляющих различные социальные сервисы.
    • Анализ взаимоотношений: Вычисляется intensity of interaction на основе частоты, длительности и содержания контактов. Также вычисляется social distance на основе индикаторов близости, доверия (trust), уважения (respect), общих контактов и интересов.
    • Кластеризация: Система определяет группы (subsets) сущностей на основе вычисленных метрик, общих атрибутов в профилях или семантического сходства атрибутов.

    Актуальность для SEO

    Средняя. Патент тесно связан с функциональностью Google+ Circles (Круги), которая была актуальна на момент подачи заявки (см. FIG. 13-26 в патенте). Хотя Google+ прекратил существование как массовый продукт, базовые концепции понимания социальных графов, агрегации данных из разных источников и анализа прочности связей остаются актуальными для коммуникационных инструментов (например, Google Contacts, Gmail) и внутренних систем управления данными.

    Важность для SEO

    Влияние на SEO минимальное (1/10). Патент описывает инфраструктуру для управления социальными связями и организации контактов пользователя в рамках социальных продуктов. Он не описывает механизмы ранжирования веб-страниц, сканирования или индексирования веб-контента. Для традиционных SEO-стратегий он не имеет практического значения.

    Детальный разбор

    Термины и определения

    Entity (Сущность)
    Объект в социальной сети (человек, группа, бизнес), связанный с пользователем.
    Social Network Data (Данные социальной сети)
    Совокупность данных, описывающих социальную сеть пользователя, включающая Relationship Data и Profile Data.
    Relationship Data (Данные о взаимоотношениях)
    Данные, представляющие социальные связи (прямые или косвенные) между пользователем и другими сущностями.
    Profile Data (Данные профиля)
    Данные, описывающие сущности. Включают профиль для каждой сущности, состоящий из атрибутов (Attributes) и их значений (Values).
    Intensity of Interaction (Интенсивность взаимодействия)
    Метрика, характеризующая активность взаимодействия. Определяется на основе частоты контактов (frequency of contact), длины (length) и содержания (content) взаимодействий.
    Social Distance (Социальная дистанция)
    Метрика, характеризующая близость отношений. Определяется на основе степени близости (degree of closeness), уровня доверия (extent of trust), уважения (level of respect), количества общих контактов и общих интересов.
    Subset / Cluster (Подмножество / Кластер)
    Группа сущностей, определенная системой на основе общих характеристик или метрик. Аналог «Кругов» в Google+.
    Live Interaction (Живое взаимодействие)
    Обмен информацией в реальном или почти реальном времени (например, телефонный звонок, чат).

    Ключевые утверждения (Анализ Claims)

    Claim 1 (Независимый пункт): Описывает основной процесс обработки социальных данных, агрегированных из нескольких сетей.

    1. Система получает доступ к Social Network Data пользователя из нескольких социальных сетей, в которых он состоит.
    2. Эти данные включают Relationship Data и Profile Data. Атрибуты профилей представляют intensity of interaction и/или social distance.
    3. Система получает запрос на предоставление подмножества (subset) сущностей.
    4. В ответ система определяет это подмножество на основе: данных о связях, интенсивности взаимодействия, общих атрибутов с пользователем, А ТАКЖЕ путем сопоставления поискового критерия пользователя (user search criterion) с семантически схожими значениями (semantically similar values) атрибутов в профилях сущностей.
    5. Система сохраняет и передает инструкции для отображения этого подмножества.

    Claim 2 (Зависимый): Уточняет расчет Intensity of Interaction. Значение определяется на основе одного или нескольких факторов: частота контакта, длина конкретного взаимодействия и содержание конкретного взаимодействия.

    Claim 4 и 5 (Зависимые): Уточняют расчет Social Distance. Значение определяется на основе данных профиля и указывает на: степень доверия (extent of trust) или уровень уважения (level of respect) (Claim 4); количество общих контактов или общие личные интересы (Claim 5).

    Claim 6 (Зависимый): Подчеркивает, что извлечение данных происходит с нескольких серверов (plurality of server machines), так как пользователь связан с сущностями через несколько социальных сетей (multiple social network services).

    Claim 12 (Зависимый): Описывает метод определения подмножества на основе примеров. Оно определяется на основе конкретного значения атрибута, присутствующего в профилях одного или нескольких примеров сущностей, выбранных пользователем (метод «найти похожих»).

    Claim 17 (Зависимый): Описывает функцию контекстной осведомленности. Система определяет, что происходит Live Interaction между пользователем и сущностью. В ответ система представляет пользователю обновление статуса (status update) этой сущности.

    Где и как применяется

    Патент описывает систему управления социальными связями и контактами, а не систему веб-поиска. Он применяется в контексте социальных продуктов (например, Google Contacts или исторически Google+).

    INDEXING – Индексирование (Социальных данных)
    На этом этапе система агрегирует Profile Data и Relationship Data из различных источников (сервисы контактов, микроблоги, мессенджеры). Происходит анализ взаимодействий и вычисление ключевых метрик Intensity of Interaction и Social Distance. Эти данные индексируются для быстрого доступа и анализа.

    QUNDERSTANDING – Понимание (Социального контекста и Запросов)
    Система интерпретирует запросы пользователя внутри социального приложения. При получении запроса (например, поиск контактов по интересу) система использует семантический анализ (Semantics Module) для сопоставления критериев запроса с атрибутами профилей.

    RANKING / RERANKING (В контексте социальных данных)
    На этом этапе происходит финальное определение подмножеств (subsets) или кластеров. Сущности организуются и ранжируются внутри интерфейса на основе рассчитанных метрик и соответствия запросу.

    Входные данные:

    • Relationship Data и Profile Data из различных сервисов взаимодействия.
    • Данные о взаимодействиях (частота, длина, содержание сообщений/звонков).
    • Запросы пользователя на поиск или группировку контактов (search criterion).
    • Примеры сущностей, предоставленные пользователем.
    • Сигналы в реальном времени (Live Interaction, данные о местоположении).

    Выходные данные:

    • Подмножества (кластеры/группы) сущностей.
    • Рекомендации по взаимодействию с подмножеством.
    • Предложения по обновлению профиля пользователя (описано как одна из функций системы).
    • Контекстная информация (обновления статуса во время взаимодействия).

    На что влияет

    Алгоритм влияет исключительно на управление социальными связями пользователя и интерфейсы связанных коммуникационных продуктов.

    В патенте нет информации о влиянии этого алгоритма на:

    • Ранжирование в веб-поиске.
    • Обработку конкретных типов веб-контента (статьи, товары и т.д.).
    • Специфические типы поисковых запросов (информационные, коммерческие).
    • Конкретные ниши или тематики (YMYL, ecommerce).

    Когда применяется

    Алгоритм применяется в следующих условиях:

    • Триггеры активации:
      • Когда пользователь запрашивает организацию или просмотр своих контактов.
      • Когда пользователь ищет контакты по определенному критерию (Claim 1).
      • Когда пользователь предоставляет примеры контактов для поиска похожих (Claim 12).
      • Автоматически системой для предложения групп на основе анализа взаимодействий.
      • При обнаружении Live Interaction для предоставления контекстной информации (Claim 17).

    Пошаговый алгоритм

    1. Агрегация данных: Извлечение social network data (профили и связи) из множества источников (например, контакты, микроблоги, мессенджеры).
    2. Анализ и вычисление метрик: Для каждой сущности вычисляется Intensity of Interaction (на основе частоты, длины, содержания общения) и Social Distance (на основе общих контактов, интересов, доверия).
    3. Семантическая обработка: Анализ атрибутов профилей для выявления семантического сходства между различными значениями (например, «лодки» и «яхты»).
    4. Получение триггера: Получение запроса от пользователя (поиск по критерию или предоставление примеров) или автоматическая инициация кластеризации.
    5. Определение подмножества (Subset Determination): Идентификация группы сущностей, которые соответствуют критериям запроса (включая семантическое сопоставление), имеют схожие метрики интенсивности/дистанции, разделяют общие атрибуты или похожи на предоставленные примеры.
    6. Хранение и представление: Сохранение определенного подмножества и его представление пользователю (например, в виде кластеров).
    7. Применение (Опционально): Использование подмножества для предложения взаимодействий, обновления профиля пользователя, показа релевантной рекламы (упомянуто в патенте) или предоставления контекстной информации во время Live Interaction.

    Какие данные и как использует

    Данные на входе

    Система использует данные, извлеченные из профилей и истории взаимодействий пользователя.

    • Контентные факторы (Профили и Сообщения): Атрибуты и их значения, описывающие сущности (интересы, профессия, аффилиации). Содержание взаимодействий (текст сообщений).
    • Поведенческие факторы (Взаимодействия): Частота контактов, длина сообщений/звонков, скорость ответов (responsiveness), частота постов (post frequency).
    • Структурные факторы (Социальный граф): Relationship data — кто с кем связан, идентификация общих контактов между пользователем и сущностью.
    • Контекстные факторы: Данные о местоположении, события в календаре, обнаружение живого взаимодействия (звонки).

    Какие метрики используются и как они считаются

    • Intensity of Interaction (Интенсивность взаимодействия): Вычисляется на основе агрегации данных о коммуникациях: частота контакта, длина взаимодействия, содержание взаимодействия (Claim 2).
    • Social Distance (Социальная дистанция): Вычисляется на основе анализа профилей и структуры графа: степень доверия (trust), уважения (respect), количество общих контактов, количество общих личных интересов (Claims 4, 5).
    • Semantic Similarity (Семантическое сходство): Используется для сопоставления поискового критерия с атрибутами профилей или для группировки сущностей с похожими атрибутами. Может определяться на основе совместной встречаемости слов в профилях или документах.
    • Метрики активности: В патенте также упоминаются (FIG. 27) метрики для визуализации активности: Popularity, Post Frequency, Responsiveness, Influence.

    Выводы

    Патент описывает внутренние процессы Google по организации социальных данных пользователя, но не содержит прямых рекомендаций для SEO. Он дает следующее понимание работы систем Google:

    1. Фокус на управлении социальными связями: Патент описывает исключительно инфраструктуру и методы для организации контактов пользователя и управления его социальным графом. Он не содержит информации о том, как эти данные используются для ранжирования в веб-поиске.
    2. Квантификация взаимоотношений: Система стремится количественно оценить силу и природу связей, используя две основные метрики: Intensity of Interaction (основана на реальных коммуникациях) и Social Distance (основана на структуре графа, доверии и общих интересах).
    3. Агрегация данных из разных источников: Ключевой особенностью является способность собирать фрагментированные данные из разных сервисов (контакты, почта, мессенджеры) для построения целостного социального графа.
    4. Автоматизация и Контекстность: Система разработана для автоматической кластеризации контактов и предоставления контекстной информации в реальном времени (например, во время Live Interaction).
    5. Использование семантического анализа: Система применяет семантическое понимание для нормализации атрибутов профилей и обработки запросов пользователя, что позволяет улучшить качество группировки и поиска контактов.

    Практика

    ВАЖНО: Патент является инфраструктурным и описывает механизмы управления социальными сетями (например, функциональность, подобную Google+ Circles). Он не дает практических выводов для SEO-продвижения веб-сайтов.

    Best practices (это мы делаем)

    Патент не содержит рекомендаций, которые можно применить для улучшения ранжирования веб-сайтов в поиске Google. Он подтверждает технические возможности Google по анализу социальных графов и сигналов взаимодействия, но не предоставляет действенных советов для внешних вебмастеров.

    Worst practices (это делать не надо)

    Патент не описывает SEO-тактик, которые становятся неэффективными или опасными. Однако, исходя из логики работы системы, можно сделать вывод о сложности имитации подлинных социальных связей в контексте этой системы:

    • Имитация взаимодействия: Попытки искусственно создать социальные связи или имитировать взаимодействие (например, ботами) вероятно будут неэффективны. Система анализирует реальные данные коммуникаций, включая частоту, длину и содержание, для определения подлинной Intensity of Interaction.

    Стратегическое значение

    Стратегическое значение патента для SEO минимально. Он подтверждает интерес Google к глубокому пониманию социального графа и использованию семантического анализа для интерпретации данных профилей. Он служит напоминанием о том, что Google анализирует связи между сущностями на глубоком уровне, но описывает технологию, ориентированную на продукт управления контактами, а не на технологию поискового ранжирования.

    Практические примеры

    Практических примеров для SEO нет. Патент описывает интерфейс и логику управления контактами.

    Пример использования (Управление контактами):

    1. Сбор данных: Система собирает контакты пользователя из Gmail, подписки из сервиса микроблогов и контакты из мессенджера.
    2. Анализ: Система замечает, что с группой контактов пользователь часто переписывается по почте (высокая Intensity of Interaction), и у всех этих контактов в профиле указано место работы «Компания X».
    3. Кластеризация: Система автоматически создает подмножество (кластер/круг) и предлагает назвать его «Коллеги из Компании X».
    4. Результат: Пользователь получает организованный список контактов, что упрощает взаимодействие с этой группой.

    Вопросы и ответы

    Означает ли этот патент, что социальные сигналы являются фактором ранжирования в поиске?

    Нет. Патент описывает исключительно систему для агрегации и организации личных контактов пользователя из разных источников. Он не упоминает использование этих данных или вычисленных метрик (Intensity of Interaction, Social Distance) для ранжирования результатов в веб-поиске.

    Что такое «Intensity of Interaction» и как она рассчитывается?

    Это метрика, показывающая, насколько активно пользователь взаимодействует с контактом. Согласно патенту (Claim 2), она рассчитывается на основе частоты контактов, длины взаимодействий (например, размер письма или длительность звонка) и содержания этих взаимодействий. Это позволяет системе отличать близких коллег от случайных знакомых.

    Что такое «Social Distance» и чем она отличается от интенсивности взаимодействия?

    Social Distance — это метрика близости, основанная не только на общении. Согласно патенту (Claims 4, 5), она учитывает структурные и профильные данные: уровень доверия (trust), уважения (respect), количество общих контактов и наличие общих личных интересов. Можно интенсивно общаться с неблизким человеком или редко общаться с близким другом.

    Связан ли этот патент с Google+ Circles (Круги)?

    Да, очень вероятно. Время подачи заявки (2012 г.) совпадает с активным развитием Google+. Описанные механизмы автоматической кластеризации контактов и представленные в патенте скриншоты интерфейса (FIG. 13-26) точно соответствуют функциональности, которая предлагалась для управления Кругами в Google+.

    Может ли эта система помочь в понимании E-E-A-T или авторитетности сущностей?

    Только косвенно. Патент демонстрирует, что у Google есть сложные механизмы для измерения силы и качества связей между сущностями, включая доверие и уважение. Теоретически, подобные методы анализа могут применяться для оценки авторитетности. Однако данный патент не устанавливает связь между этой системой управления контактами и оценкой качества поиска или E-E-A-T.

    Зачем система собирает данные из разных социальных сетей?

    Цель — преодолеть фрагментацию социального графа пользователя (Claim 6). Пользователь может общаться с одним и тем же человеком через разные сервисы (например, почта, микроблог, мессенджер). Агрегация позволяет системе понять полную картину взаимоотношений и создать унифицированное представление контактов.

    Как система определяет, что два разных атрибута означают одно и то же?

    Патент упоминает использование семантического сходства (Claim 1). Например, система может определить, что значения «лодки» и «яхты» семантически близки, анализируя их совместную встречаемость в профилях или внешних документах. Это позволяет группировать контакты, даже если они используют разную терминологию.

    Может ли система автоматически обновлять профиль пользователя?

    Да, патент описывает механизм (FIG. 11), где система может определить, что некий атрибут, характерный для контактов пользователя, вероятно, описывает и самого пользователя, но отсутствует в его профиле. Система может предложить добавить этот атрибут или сделать это автоматически с разрешения пользователя.

    Как система использует информацию о «Live Interaction» (Живом взаимодействии)?

    Если система обнаруживает, что пользователь в данный момент общается с контактом (например, во время телефонного звонка или в чате), она может предоставить контекстную информацию. В патенте (Claim 17) приводится пример отображения последнего обновления статуса этого контакта пользователю.

    Какова основная ценность этого патента для понимания работы Google?

    Основная ценность заключается в демонстрации технической глубины, с которой Google подходит к анализу социального графа. Он показывает, как агрегируются разнородные данные и как используются поведенческие сигналы (общение) и структурные сигналы (связи) для автоматической организации информации о сущностях в рамках социальных продуктов.

    Навигация
    • Описание
    • Детальный разбор
    • Выводы
    • Практика
    • Вопросы и ответы
    • Наверх
    Telegram
    © 2025 SEO HARDCORE

    Type above and press Enter to search. Press Esc to cancel.