Как Google использует социальные связи и действия пользователей для персонализации и аннотирования поисковой выдачи

Google использует механизм для персонализации поисковой выдачи путем добавления аннотаций к результатам, которые связаны с социальными группами пользователя (друзья, коллеги, жители города). Система определяет, как участники этих групп взаимодействовали с контентом (создали, поделились, одобрили), приоритизирует эти действия и добавляет пояснения к сниппетам. Также описаны механизмы агрегации действий и защиты конфиденциальности при показе аннотаций.

Описание

Какую задачу решает

Патент решает задачу повышения релевантности поисковой выдачи за счет интеграции социального контекста пользователя. Он описывает, как идентифицировать контент, который представляет социальный интерес (social interest) для конкретного пользователя, и как информировать пользователя о причине, по которой этот результат показан, с помощью аннотаций. Система помогает пользователю отличить общие результаты от персонализированных, основанных на действиях его социального окружения или его собственной предыдущей активности.

Что запатентовано

Запатентована система аннотирования результатов поиска на основе связей между ресурсами и социальными группами (social affinity groups) пользователя. Система определяет различные типы ассоциаций (например, создание, шеринг, одобрение) и использует иерархию приоритетов (predetermined priority hierarchy) для выбора наиболее значимой аннотации. Также запатентован механизм агрегации социальных действий с использованием пороговых значений и обфускации для защиты конфиденциальности участников групп.

Как это работает

Система работает следующим образом:

Определение связей: Система поддерживает данные о социальных группах пользователя (друзья, коллеги, географические группы и т.д.).
Идентификация ассоциаций: При получении результатов поиска система определяет, связаны ли ресурсы с членами этих групп через определенные действия (associations).
Приоритизация: Если ассоциаций несколько, система выбирает наиболее важную согласно заданной иерархии (например, создание контента важнее его одобрения; действия друзей важнее действий коллег).
Аннотирование: К результату добавляется аннотация, объясняющая связь (например, «Опубликовано Другом А»).
Агрегация и Обфускация: Если с ресурсом взаимодействовало много людей из группы, система агрегирует данные. Для защиты приватности используются пороговые значения и криптографические хеш-функции для применения относительных терминов (например, «Одобрено многими вашими коллегами») вместо точных чисел.

Актуальность для SEO

Средняя. Патент подан в 2011 году, в период активного развития социального поиска (Google+). Прямые реализации социального аннотирования на основе сетей вроде Google+ больше не актуальны. Однако базовые принципы использования социального контекста, авторства, пользовательской активности и персонализированных аннотаций остаются фундаментальными для работы современных систем рекомендаций (например, Google Discover) и персонализации поиска. Механизмы приоритизации ассоциаций и агрегации данных также актуальны.

Важность для SEO

Влияние на стандартные SEO-стратегии умеренное (6/10). Патент описывает механизмы глубокой персонализации, на которые SEO-специалист не может влиять напрямую для всех пользователей одновременно. Однако он подчеркивает важность узнаваемости авторов и стимулирования органического распространения и одобрения контента внутри сообществ. Если система идентифицирует автора контента как члена социальной группы пользователя, этот контент получит приоритетную аннотацию, что значительно повышает его заметность и CTR для данного конкретного пользователя.

Детальный разбор

Термины и определения

Annotator (Аннотатор): Компонент системы, отвечающий за добавление аннотаций к результатам поиска.
Association (Ассоциация): Связь между ресурсом и членом социальной группы пользователя. Устанавливается через действия, такие как создание (creating), шеринг (sharing), одобрение (endorsing) или тегирование (tagged).
Association Types (Типы ассоциаций): Категории действий, которые определяют характер ассоциации (например, тип «создание», тип «одобрение»).
Predetermined Priority Hierarchy (Предопределенная иерархия приоритетов): Правила ранжирования, используемые для выбора одной аннотации из множества возможных. Учитывает значимость типа ассоциации и значимость отношений между пользователем и членом группы.
Relative Terms (Относительные термины): Термины, используемые в аннотациях для агрегированного описания количества участников (например, «некоторые», «многие»). Используются для защиты конфиденциальности.
Social Affinity Group / Social Circle (Социальная группа / Социальный круг): Группа пользователей, с которыми у ищущего пользователя есть отношения (явные или неявные). Примеры: друзья в социальной сети, коллеги, жители одного города, контакты из адресной книги.
Social Interest (Социальный интерес): Интерес пользователя к ресурсам, связанным с его социальными группами.
Thresholding Algorithm (Алгоритм пороговых значений): Алгоритм, используемый для применения относительных терминов. Включает использование криптографических хеш-функций для обфускации и защиты от идентификации отдельных пользователей.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод аннотирования результатов поиска с учетом социальных связей и приоритизации действий.

Система получает запрос от пользователя, у которого есть несколько социальных групп.
Получаются результаты поиска.
Идентифицируются результаты, имеющие ассоциацию с одной или несколькими социальными группами. Каждая ассоциация соответствует одному из типов ассоциаций, определяющих действия пользователя (например, создание или одобрение ресурса).
Выбирается один из идентифицированных результатов для аннотирования. Выбор основан на предопределенной иерархии приоритетов типов ассоциаций, которая определяет разный приоритет для каждого действия пользователя. Выбирается результат с ассоциацией, имеющей наивысший приоритет.
Выбранный результат аннотируется. Аннотация описывает ассоциацию и идентифицирует социальную группу.
Процесс аннотирования включает сложный механизм агрегации и выбора терминов аннотации (относительных терминов):
- Определяется количество пользователей в социальной группе.
- Для каждого термина аннотации (например, «многие», «некоторые») определяется целевое пороговое значение (target threshold).
- Для каждого термина вычисляется фактическое пороговое значение (threshold value) на основе количества пользователей в группе и целевого порога.
- Количество пользователей, совершивших действие, сравнивается с пороговыми значениями.
- В качестве аннотации применяется термин с наивысшим целевым порогом, который был превышен.
Аннотированный результат предоставляется пользователю.

Claim 10 (Независимый пункт): Фокусируется на механизме агрегации и применения относительных терминов.

Система получает запрос и результаты поиска.
Идентифицируется результат, имеющий ассоциацию с несколькими пользователями в определенной социальной группе.
Количество этих пользователей сравнивается с несколькими порогами. Каждый порог соответствует числовому диапазону пользователей и относительному термину (например, порог для «многие» отличается от порога для «некоторые»).
Определяется, что количество пользователей попадает в числовой диапазон первого порога.
В ответ на это к результату поиска применяется относительный термин, соответствующий этому первому порогу.

Где и как применяется

Изобретение применяется на финальных этапах обработки поискового запроса, используя данные, собранные и обработанные на более ранних этапах.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна собирать и индексировать данные о социальных взаимодействиях с контентом (кто создал, кто поделился, кто одобрил) и данные о членстве пользователей в социальных группах (Social Network Data, User Profile Data). Эти данные сохраняются для последующего использования.

RANKING – Ранжирование
Основная система ранжирования (Search Engine) генерирует результаты, релевантные запросу. Вероятно, социальные сигналы могут учитываться уже на этом этапе для персонализации ранжирования.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. Компонент Annotator получает результаты поиска и данные из Social Network Data и User Profile Data.

Идентификация социального интереса: Annotator определяет, какие результаты имеют ассоциации с социальными группами пользователя.
Приоритизация и Выбор: Система применяет иерархию приоритетов для выбора лучших кандидатов для аннотирования и выбора наиболее значимой аннотации для каждого результата.
Агрегация и Обфускация: При необходимости применяются алгоритмы пороговых значений для генерации агрегированных аннотаций с относительными терминами.
Формирование SERP: Аннотированные результаты (Annotated Search Results) предоставляются пользователю.

Входные данные:

Запрос пользователя (Query).
Результаты поиска от поисковой системы (Search Results).
Данные социальных сетей (Social Network Data): информация о связях пользователя и действиях его контактов.
Данные профиля пользователя (User Profile Data): информация о членстве в группах, географии.
Журнал сессий (Session Log): данные о предыдущей поисковой активности пользователя.

Выходные данные:

Аннотированные результаты поиска (Annotated Search Results) с пояснениями социального контекста.

На что влияет

Типы контента: Влияет на любой тип контента, который может быть создан, опубликован, расшарен или одобрен пользователями: статьи, блоги, изображения, микроблоги, новости, обзоры продуктов.
Специфические запросы: Наибольшее влияние на информационные и коммерческие запросы, где мнение или опыт социального окружения имеет значение для пользователя.
Персонализация: Система напрямую влияет на персонализацию выдачи. Два пользователя с разными социальными графами увидят разные аннотации для одного и того же запроса.

Когда применяется

Условия применения: Алгоритм применяется, когда система идентифицирует ресурсы в результатах поиска, которые имеют явные ассоциации с членами социальных групп пользователя или с его предыдущей поисковой активностью.
Триггеры активации: Наличие социального контекста для данного результата поиска.
Ограничения: Патент упоминает, что может быть установлено максимальное количество аннотированных результатов (например, только первые четыре результата социального интереса), чтобы избежать перегрузки выдачи. Определение того, аннотировать ли результат, может зависеть от порогового количества ранее аннотированных результатов.

Пошаговый алгоритм

Процесс А: Обработка запроса и аннотирование

Получение запроса: Система получает запрос от пользователя.
Получение результатов: Поисковая система генерирует набор результатов, релевантных запросу.
Идентификация социальных ассоциаций: Annotator анализирует результаты и идентифицирует ресурсы, связанные с социальными группами пользователя или его прошлой активностью.
Приоритизация ассоциаций: Для каждого результата определяются все применимые ассоциации. Они ранжируются согласно иерархии приоритетов. Например:
- Приоритет 1: Социальная связь (выше, чем прошлая активность).
- Приоритет 2 (Внутри социальных связей): Друзья > Коллеги > Географические группы.
- Приоритет 3 (Внутри действий): Создание > Шеринг > Одобрение.
Выбор аннотации: Выбирается ассоциация с наивысшим приоритетом.
Агрегация (если применимо): Если выбрана агрегированная ассоциация (например, одобрение группой), применяется Процесс Б.
Генерация аннотации: Формируется текст аннотации на основе выбранной ассоциации (например, «Опубликовано Другом А»).
Применение лимитов: Система проверяет, не превышено ли максимальное количество аннотаций в выдаче. Если превышено, последующие результаты могут не аннотироваться или удаляться из списка.
Предоставление результатов: Аннотированные результаты передаются пользователю.

Процесс Б: Применение относительных терминов (Thresholding)

Этот процесс используется для защиты конфиденциальности при агрегации действий группы (например, для применения термина «многие»).

Определение параметров: Определяется ресурс (E), социальная группа (c) и количество членов группы (q), совершивших действие.
Вычисление порогов (k): Для каждого относительного термина (например, «многие») вычисляется текущее пороговое значение (k). Используется формула, включающая целевой порог (k0) и криптографическую хеш-функцию (f) от ресурса и членов группы: $k = k_0 + f(E, members(c), k_0, 0)$ . Порог может зависеть от размера группы.
Сравнение: Проверяется, превышает ли количество членов (q) порог (k).
Применение термина: Если q > k, термин применяется. Если превышено несколько порогов (например, и для «некоторые», и для «многие»), применяется термин с наивысшим порогом.
Гистерезис (Hysteresis): Если термин уже применялся ранее, он продолжает применяться, пока количество членов (q) не упадет ниже нижнего предела (например, $k — f(E, members(c), k_0, 0)$ ). Это предотвращает частое изменение термина.

Какие данные и как использует

Данные на входе

Система использует данные, которые связывают пользователей, их социальные связи и взаимодействие с контентом.

Поведенческие факторы (Пользовательские действия):
- Действия членов социальных групп: создание контента, шеринг (публичный или приватный), одобрение (лайки, рейтинги), тегирование, комментирование.
- Предыдущая поисковая активность пользователя (previous search activity): прошлые запросы и клики по результатам (хранятся в Session Log).
Пользовательские факторы (Данные о пользователе):
- User Profile Data: Явные данные профиля (друзья, местоположение, интересы, членство в группах, работодатель).
- Social Network Data: Данные из подключенных социальных сетей.
- Неявные данные: email-корреспонденция, адресная книга, список контактов мессенджера (с разрешения пользователя).
Географические факторы: Местоположение пользователя (по IP или данным профиля) для определения географических социальных групп (например, «люди в Сан-Франциско»).

Какие метрики используются и как они считаются

Иерархия приоритетов (Priority Hierarchy): Система использует качественные метрики для ранжирования аннотаций. Приоритеты определяются по типу отношений и типу действий.
- Отношения: Друзья > Группы (например, коллеги) > Гео-агрегации.
- Действия: Создание/Публикация > Шеринг > Одобрение (Лайк).
- Прошлая активность пользователя имеет низший приоритет по сравнению с социальными действиями.
Агрегированные счетчики (Aggregated Counts): Подсчет количества пользователей в группе, совершивших определенное действие с ресурсом.
Пороговые значения (Thresholds) для относительных терминов: Метрики, используемые для определения, когда применять термины «некоторые» или «многие». Рассчитываются с использованием сложных формул, включающих:
- Размер социальной группы (members(c)).
- Целевые пороги (k0).
- Криптографические хеш-функции (f) для обфускации и обеспечения конфиденциальности. Формула: $k = k_0 + f(E, members(c), k_0, 0)$ .
Комбинированный рейтинг (Combined Ranking): Используется для определения самых популярных ресурсов внутри группы (гистограммы популярности). Может быть суммой голосов или рейтингов (например, звезд) от членов группы за определенный период.

Выводы

Приоритет социального контекста: Google считает социальный контекст критически важным для персонализации. Система разработана так, чтобы явно выделять контент, с которым взаимодействовало окружение пользователя.
Иерархия действий и связей: Не все социальные сигналы равны. Патент четко определяет иерархию приоритетов: действия близких контактов (друзей) важнее, чем действия групп (коллеги), которые, в свою очередь, важнее гео-агрегаций. Авторство (создание контента) имеет наивысший приоритет среди действий, опережая шеринг и одобрение.
Социальный сигнал важнее прошлой активности: Если результат релевантен и по социальным причинам, и из-за прошлых запросов пользователя, система предпочтет показать социальную аннотацию.
Сложные механизмы конфиденциальности: Патент уделяет значительное внимание защите конфиденциальности при агрегации данных. Использование криптографических хеш-функций и динамических порогов для применения относительных терминов («многие», «некоторые») показывает сложность баланса между персонализацией и приватностью.
Управление перегрузкой (Clutter Management): Система предусматривает ограничение количества аннотированных результатов, чтобы не перегружать выдачу социальным контекстом.

Практика

Best practices (это мы делаем)

Хотя этот патент описывает глубоко персонализированную систему, на которую сложно влиять напрямую, он дает стратегические ориентиры:

Развитие и продвижение авторов: Поскольку «Создание» (Authorship) имеет наивысший приоритет в иерархии действий, критически важно, чтобы контент был связан с узнаваемыми авторами. Необходимо способствовать тому, чтобы авторы были идентифицированы системой и имели сильные социальные связи (например, активные профили в профессиональных сетях, узнаваемость в комьюнити). Это повышает вероятность того, что их контент будет аннотирован для их социального круга.
Стимулирование органического шеринга и одобрения: Необходимо создавать контент, которым пользователи захотят делиться и который они будут одобрять. Чем шире контент распространяется внутри определенных сообществ (социальных групп), тем выше вероятность его появления с агрегированными аннотациями (например, «Популярно среди ваших коллег») для членов этих сообществ.
Развитие сообществ вокруг бренда/сайта: Формирование лояльных групп пользователей (например, профессиональные группы, фан-клубы), которые система может распознать как социальную группу. Активность внутри этой группы может приводить к персонализированным аннотациям для ее участников.
Локальное SEO и Гео-сигналы: Участие в локальных событиях и создание локального контента может стимулировать взаимодействие пользователей из одного региона, что приведет к появлению гео-агрегированных аннотаций (например, «Одобрено людьми в вашем городе»).

Worst practices (это делать не надо)

Игнорирование авторства контента: Публикация анонимного или сгенерированного контента без привязки к реальному автору лишает контент возможности получить наиболее приоритетные аннотации, основанные на авторстве.
Накрутка социальных сигналов: Попытки искусственно накрутить лайки или шеринг с помощью ботов или нерелевантных пользователей неэффективны в контексте этого патента. Система фокусируется на действиях реальных социальных групп конкретного пользователя, а не на общем количестве лайков.
Фокус только на общих запросах без учета сообществ: Стратегия, не учитывающая нишевые сообщества и инфлюенсеров, упускает возможность использования механизмов социального аннотирования для повышения видимости контента среди связанных аудиторий.

Стратегическое значение

Патент подтверждает долгосрочную стратегию Google на интеграцию социального контекста и авторства в поиск для повышения качества и персонализации. Хотя конкретная реализация (Google+) устарела, описанные принципы иерархии сигналов (авторство > шеринг > одобрение) важны для понимания того, как Google оценивает взаимодействие пользователей с контентом. Для SEO это означает, что построение авторитетности через реальных экспертов и стимулирование естественного вовлечения сообщества являются ключевыми элементами долгосрочной стратегии, влияющими на персонализированную видимость.

Практические примеры

Сценарий 1: Приоритизация авторства в технической нише

Контекст: Пользователь А (инженер) ищет «лучшие практики Python 3.10». Пользователь Б (известный разработчик Python) находится в социальном круге Пользователя А (например, они связаны в профессиональной сети, которую Google учитывает).
Действия системы: В выдаче есть две релевантные статьи: одна на популярном сайте (Site X), другая — в личном блоге Пользователя Б.
Применение патента: Система идентифицирует, что блог Пользователя Б имеет ассоциацию типа «Создание» с членом социального круга. Согласно иерархии приоритетов, это действие имеет высший приоритет.
Результат: Результат, ведущий на блог Пользователя Б, аннотируется как «Опубликовано Пользователем Б». Эта аннотация значительно повышает заметность и доверие к результату для Пользователя А.

Сценарий 2: Агрегация действий в локальном поиске

Контекст: Пользователь ищет «лучший ресторан для барбекю».
Действия системы: Система идентифицирует несколько ресторанов. Один из них (Ресторан Z) получил положительные отзывы от 5 друзей пользователя и от 50 человек из того же города.
Применение патента: Система должна выбрать аннотацию. Отзывы друзей имеют более высокий приоритет, чем гео-агрегация.
Результат: Результат Ресторана Z аннотируется как «Одобрено 5 вашими друзьями» (или перечисляются имена друзей, если их мало). Система не будет использовать менее приоритетную аннотацию «Одобрено 50 людьми в вашем городе», даже если число больше.

Вопросы и ответы

Что такое «Социальная группа» (Social Affinity Group) в контексте этого патента?

Это любая группа пользователей, с которыми у ищущего есть связь, известная поисковой системе. Это могут быть явные связи (друзья в соцсетях, контакты в адресной книге, коллеги, подписчики блога) или неявные связи (жители одного географического региона, пользователи со схожими интересами или историей поиска). Система рассматривает эти группы как отдельные сущности.

Какие действия пользователей учитывает система для аннотирования результатов?

Система учитывает несколько типов ассоциаций между пользователем и ресурсом. Основные упомянутые действия: создание контента (creating), шеринг или распространение ресурса (sharing), одобрение ресурса (endorsing, лайки, рейтинги) и тегирование (tagged). Каждое из этих действий может стать основой для аннотации в поиске.

Если контент лайкнули 100 человек из моего города и 1 друг, какую аннотацию покажет Google?

Согласно описанной иерархии приоритетов, связи с друзьями имеют более высокий приоритет, чем географические агрегации. Поэтому система выберет аннотацию, основанную на действии друга, например: «Одобрено Другом А». Информация о 100 людях из города будет проигнорирована в пользу более сильной социальной связи.

Имеет ли значение, кто автор контента?

Да, это критически важно. В патенте указано, что действие «Создание» (авторство) имеет наивысший приоритет в иерархии действий. Если автор контента находится в социальном круге пользователя, этот контент с высокой вероятностью получит аннотацию «Опубликовано [Имя Автора]», что является мощным сигналом доверия.

Что означают аннотации типа «Одобрено многими вашими коллегами» и почему не показывается точное число?

Это агрегированная аннотация с использованием относительных терминов («многие»). Она используется, когда значительное количество людей из определенной группы (например, коллеги) совершили действие. Точное число не показывается для защиты конфиденциальности и предотвращения идентификации отдельных пользователей. Система использует сложные алгоритмы с хеш-функциями, чтобы определить, когда порог для термина «многие» достигнут.

Может ли моя собственная история поиска влиять на аннотации?

Да, патент описывает возможность аннотирования на основе предыдущей активности пользователя. Например, если вы искали «Hilton Head», а затем ищете «BBQ», система может показать результат о Каролинском барбекю с аннотацией «Рекомендовано, потому что вы искали Hilton Head». Однако социальные аннотации имеют приоритет над аннотациями, основанными на личной истории.

Актуален ли этот патент, учитывая закрытие Google+?

Хотя патент был подан во времена Google+ и его прямая реализация может быть устаревшей, описанные в нем принципы остаются актуальными. Иерархия социальных сигналов, важность авторства и механизмы персонализации на основе связей и действий пользователя по-прежнему используются в продуктах Google (например, в рекомендательных системах и персонализированном поиске), хотя источники данных изменились.

Как SEO-специалист может использовать информацию из этого патента?

Напрямую оптимизировать под персонализированные аннотации сложно. Однако стратегически важно фокусироваться на развитии узнаваемых авторов (так как авторство имеет высший приоритет) и создании качественного контента, который стимулирует органический шеринг и одобрение внутри целевых сообществ. Это увеличивает вероятность персонализированной видимости.

Все ли результаты поиска, имеющие социальный контекст, будут аннотированы?

Нет. Патент предусматривает механизмы для ограничения количества аннотаций в выдаче, чтобы избежать перегрузки. Может быть установлен лимит (например, только топ-4 социально релевантных результата будут аннотированы). Остальные результаты могут показываться без аннотаций.

Как система определяет популярность контента внутри группы?

Система использует алгоритмы гистограмм для определения самых популярных ресурсов на основе комбинированного рейтинга (например, суммы голосов или оценок) от членов группы за определенный период. Если ресурс превышает определенный порог популярности, он может получить специальную аннотацию, например, «Одна из самых одобряемых страниц среди коллег».