Google использует этот механизм для глубокой персонализации поиска, интегрируя релевантный контент из личных источников пользователя (Gmail, Drive, Calendar) и от его социальных связей. Система индексирует этот контент с разрешения пользователя, ранжирует его с учетом социальных сигналов (Affinity) и адаптивно отображает в SERP, смешивая с публичными результатами.
Описание
Какую задачу решает
Патент решает задачу повышения релевантности и полезности поисковой выдачи за счет интеграции контента, который может быть недоступен публично, но имеет высокую ценность для конкретного пользователя. Система стремится предоставить информацию из источников, которым пользователь доверяет: его собственные данные (например, электронные письма) или контент от людей из его социального графа (social graph). Это позволяет находить личную и социально значимую информацию в рамках одного поискового интерфейса.
Что запатентовано
Запатентована система для поиска и отображения пользовательского контента (User-Generated Content, UGC), включая контент с контролируемым доступом (Access Controlled Content), вместе с общими результатами поиска. Система идентифицирует социальные связи пользователя и ищет релевантный контент, созданный или распространенный этими связями. Ключевой особенностью является адаптивный способ представления этого контента, зависящий от интента запроса и настроек пользователя.
Как это работает
Система работает следующим образом:
- Индексирование и Разрешения: С разрешения пользователя система индексирует его личный контент (например, Gmail, Drive) и доступный контент его социального графа.
- Анализ связей (Affinity): Определяется социальный граф пользователя и степень близости (Affinity) к различным контактам на основе истории взаимодействий.
- Параллельный поиск: В ответ на запрос система ищет как в публичном индексе, так и в индексе UGC.
- Ранжирование UGC: Релевантность UGC может зависеть не только от соответствия запросу, но и от Affinity между пользователем и источником контента.
- Адаптивное отображение: Система определяет формат отображения. Если запрос явный (например, «мои письма о поездке»), UGC может быть показан вверху. Если запрос общий, может быть показана опция для просмотра UGC.
- Извлечение данных: Система может извлекать структурированные данные из UGC (например, маршрут полета из письма) и отображать их в удобном формате.
Актуальность для SEO
Высокая. Персонализация поиска остается фундаментальной стратегией Google. Механизмы интеграции данных из экосистемы Google (Gmail, Calendar, Drive) в основную выдачу являются прямой реализацией идей этого патента. Хотя публичная интеграция социальных постов изменилась со времен Google+, использование личных данных для обогащения поиска крайне актуально.
Важность для SEO
Патент имеет значительное влияние на SEO (7.5/10). Он описывает механизмы, которые фундаментально меняют композицию SERP для авторизованных пользователей. Интеграция персонализированного и социального контента может смещать публичные органические результаты вниз. Это подчеркивает важность создания контента, стимулирующего социальное распространение, так как контент, которым поделились контакты пользователя, может получить приоритет в его персонализированной выдаче.
Детальный разбор
Термины и определения
- User-Generated Content (UGC) (Пользовательский контент)
- Контент, созданный пользователями. Включает электронные письма, чаты, посты в социальных сетях, блоги, фотографии, документы на диске, события календаря.
- Access Controlled Content (Контент с контролируемым доступом)
- Приватный или полуприватный контент, доступ к которому ограничен настройками конфиденциальности. Требует разрешения пользователя для индексации и показа.
- Social Graph (Социальный граф)
- Структура данных, представляющая социальные связи между сторонами (людьми, организациями) и связи между сторонами и контентом в одной или нескольких сетях.
- Affinity (Аффинити, Степень близости)
- Метрика, определяющая силу или близость связи в социальном графе. Зависит от частоты и типа взаимодействий, количества общих контактов. Может быть специфичной для типа контента или темы.
- Social Signals (Социальные сигналы)
- Данные о взаимодействиях в социальном графе (лайки, комментарии, репосты, частота общения), используемые для расчета Affinity и влияния на ранжирование UGC.
- Profile Data (Данные профиля)
- Информация о пользователе, включающая его индекс контактов (Contact Index), используемый для построения социального графа.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной процесс интеграции социально-релевантного контента в поиск с учетом разрешений.
- Система получает запрос от первого пользователя.
- Идентифицируются социальные связи между первым пользователем и другими пользователями.
- Идентифицируются Первые результаты поиска: контент, релевантный запросу И созданный (created by) подмножеством социально связанных пользователей.
- Идентифицируются Вторые результаты поиска: контент, релевантный запросу И с которым взаимодействовали (interacted by), но не создавали, другое подмножество социально связанных пользователей.
- Примечание: В патенте присутствует запутанная формулировка, утверждающая, что оценка релевантности (relevance score) для Вторых результатов основана на «отсутствии социальной связи» (non-existence of a social connection) между первым пользователем и взаимодействовавшим пользователем. Это противоречит логике пункта. Вероятно, это юридическая конструкция, означающая, что базовая релевантность контента рассчитывается независимо от социального бонуса, но сам факт включения в выдачу зависит от взаимодействия связи.
- Получается контрольная информация (разрешения, приватность) для Первых и Вторых результатов, и определяется подмножество, разрешенное к показу.
- Идентифицируются Третьи результаты поиска (общие результаты, не относящиеся к социально-значимому UGC).
- Данные для отображения разрешенного подмножества Первых/Вторых результатов и Третьих результатов передаются пользователю.
Claim 4 (Зависимый от 1): Детализирует отображение связанного контента.
Система идентифицирует дополнительный контент, ассоциированный с основным UGC (например, ответы на письмо или вложения), и отображает его в ассоциации с основным контентом.
Claim 11 (Зависимый от 1): Уточняет обработку изображений в UGC.
Если UGC содержит цифровое изображение и определяется, что оно не связано с текстом (independent of text), система принимает решение отобразить это изображение в разделе результатов поиска изображений.
Claims 15-18 (Зависимые от 1): Определяют логику адаптивного отображения в зависимости от интента запроса.
- (15) Система определяет, идентифицирует ли запрос тип UGC (например, содержит слово «email»).
- (16) Если ДА (явный интент), результаты UGC отображаются на видном месте (например, вверху первой страницы).
- (17) Если НЕТ (неявный интент), система отображает опцию (ссылку/кнопку) для просмотра результатов UGC.
- (18) Если НЕТ (неявный интент), НО пользователь заранее указал в настройках всегда показывать UGC, система отображает UGC на видном месте.
Где и как применяется
Изобретение затрагивает ключевые этапы поискового процесса, обеспечивая глубокую персонализацию выдачи.
INDEXING – Индексирование и извлечение признаков
На этом этапе система (с разрешения пользователя) сканирует и индексирует UGC (Gmail, Drive, посты в соцсетях). Также происходит построение и обновление Social Graph и расчет метрик Affinity на основе взаимодействий пользователей.
QUNDERSTANDING – Понимание Запросов
Система анализирует запрос на предмет явного указания на необходимость поиска в UGC (например, наличие ключевых слов «my emails», «calendar»). Это определяет стратегию отображения.
RANKING – Ранжирование
Происходит параллельное ранжирование публичного контента и UGC. При ранжировании UGC система учитывает не только текстовую релевантность, но и социальные сигналы, в частности Affinity между ищущим и автором/распространителем контента.
METASEARCH & RERANKING – Метапоиск, Смешивание и Переранжирование
Основной этап применения патента. Система агрегирует результаты из разных индексов. Применяется логика адаптивного представления (Claims 15-18). Происходит форматирование UGC: группировка связанных сообщений, извлечение структурированных данных (например, деталей рейса из письма), интеграция в вертикали (например, фото в поиск картинок).
Входные данные:
- Поисковый запрос.
- Идентификатор пользователя и статус авторизации.
- Данные Social Graph и метрики Affinity.
- Настройки предпочтений и разрешений пользователя.
- Публичный веб-индекс и персонализированный индекс UGC.
Выходные данные:
- Смешанные данные SERP, включающие публичные результаты и персонализированный UGC, отформатированные согласно логике представления.
На что влияет
- Конкретные типы контента: Электронная почта, события календаря, документы в облачных хранилищах, посты в социальных сетях, фотографии, чаты.
- Специфические запросы: Запросы, где личный контекст имеет высокую ценность (планирование путешествий, статус заказов) или где важны социальные рекомендации (обзоры продуктов, выбор ресторанов).
- Персонализация выдачи: Патент описывает механизм, делающий выдачу уникальной для каждого авторизованного пользователя на основе его личных данных и социальных связей.
Когда применяется
- Условия работы: Пользователь должен быть авторизован (logged in) и предоставить разрешения на индексацию своего контента или данных социальных связей.
- Триггеры активации: Обнаружение релевантного UGC для данного запроса.
- Логика отображения: Активация полного отображения зависит от явного интента в запросе или включенной опции постоянного отображения в настройках. В противном случае UGC может быть скрыт за опцией просмотра.
Пошаговый алгоритм
- Получение запроса и идентификация пользователя: Система получает запрос и идентифицирует авторизованного пользователя.
- Анализ интента запроса: Определяется, содержит ли запрос явное указание на тип UGC.
- Получение социальных данных: Извлекается Social Graph пользователя и связанные метрики Affinity.
- Параллельный поиск:
- Поиск в публичном индексе (Третьи результаты).
- Поиск в индексе UGC: идентификация контента, созданного связями (Первые результаты) и контента, с которым взаимодействовали связи (Вторые результаты).
- Фильтрация и Ранжирование UGC:
- Применение правил контроля доступа и настроек приватности. Отбор разрешенного контента.
- Ранжирование UGC с учетом релевантности и Affinity.
- Обработка UGC:
- Идентификация связанного контента (ответы, вложения).
- Извлечение структурированных данных (например, деталей рейса).
- Определение вертикали для медиа (например, фото без текста в поиск картинок).
- Определение формата отображения: На основе анализа интента (Шаг 2) и настроек пользователя определяется способ показа UGC (проминантно, интегрировано или через опцию).
- Смешивание и генерация SERP: Объединение публичных результатов и обработанного UGC в единую страницу выдачи.
- Передача данных пользователю.
Какие данные и как использует
Данные на входе
- Контентные факторы (UGC): Текст электронных писем, постов, чатов, документов. Метаданные (дата, автор, тема письма). Вложения и встроенные медиафайлы (изображения, видео).
- Пользовательские факторы (Персональные данные):
- Информация о логине пользователя.
- Разрешения на доступ к аккаунтам (Gmail, Drive, Calendar).
- Настройки отображения (например, «Always show full pane»).
- Социальные факторы (Social Graph Data):
- Contact Index: Список контактов.
- Структура связей (прямые, косвенные).
- История взаимодействий (частота, тип коммуникации).
- Поведенческие факторы (Interactions): Взаимодействие пользователя с контентом от определенных авторов (клики, время просмотра) – используется для расчета Affinity.
Какие метрики используются и как они считаются
- Affinity Score (Оценка близости): Ключевая метрика силы связи в социальном графе. Рассчитывается на основе:
- Типа и источника связи (прямой контакт vs контакт контакта).
- Частоты и типа взаимодействия (переписка, клики, время просмотра контента).
- Количества общих контактов.
- Специфичности контента (Affinity может быть разной для разных тем или типов контента от одного и того же контакта).
- Relevance Score (Оценка релевантности): Стандартная оценка соответствия контента запросу. Для UGC может модифицироваться с учетом Affinity Score.
- Query Intent Classification (Классификация интента запроса): Определение того, содержит ли запрос явное указание на поиск в UGC (например, наличие слов «email», «calendar»).
Выводы
- Глубокая персонализация через личные и социальные данные: Патент описывает архитектуру для интеграции данных из экосистемы пользователя (Email, Calendar, Drive) и его социального круга непосредственно в поисковую выдачу.
- Влияние социального графа и Affinity на ранжирование: Система использует Social Graph и метрики Affinity (близость связи) для оценки важности UGC. Контент от близких контактов может ранжироваться выше в персонализированной выдаче.
- Адаптивный интерфейс зависит от интента запроса: Способ отображения UGC адаптивен. При явном запросе личного контента он отображается заметно (вверху). При общем запросе система может предложить опцию просмотра, соблюдая баланс между полезностью и приватностью.
- Извлечение структурированных данных из UGC: Система способна извлекать и структурировать информацию из неструктурированного текста (например, данные о рейсе из письма) и отображать ее в виде обогащенных блоков.
- Обработка разных типов контента: Система адаптирует отображение в зависимости от формата. Например, изображения из UGC без текста могут интегрироваться в результаты поиска по картинкам.
- Снижение видимости традиционного SEO: Для авторизованных пользователей видимость стандартных органических результатов может снижаться, так как персонализированные блоки (личные или социальные) могут занимать приоритетные позиции в SERP.
Практика
Best practices (это мы делаем)
- Стимулирование социального распространения контента: Создавайте контент, которым пользователи захотят делиться в социальных сетях и личных коммуникациях. Если контент попадает в социальный граф пользователя (например, его контакт поделился ссылкой или обсудил ваш бренд), он может быть показан этому пользователю в приоритетном порядке в рамках персонализированной выдачи.
- Использование микроразметки для транзакционных писем: Для ecommerce и сервисных компаний (авиабилеты, отели, доставка) критически важно использовать разметку (например, Schema.org для Email) в транзакционных письмах. Это помогает системе извлекать структурированные данные (как в примере с маршрутом полета) и отображать их напрямую в выдаче пользователя.
- Развитие авторитетности и вовлеченности (Affinity): Работайте над построением сообщества и вовлечением аудитории. Высокая Affinity к вашему бренду или авторам в социальных графах пользователей увеличивает вероятность показа вашего контента через эти персонализированные механизмы.
- Анализ персонализированной выдачи: При анализе позиций и трафика необходимо учитывать фактор глубокой персонализации. Выдача для авторизованных пользователей может сильно отличаться от анонимной.
Worst practices (это делать не надо)
- Игнорирование социального фактора и персонализации: Полагаться только на традиционные факторы ранжирования и оценивать эффективность только по анонимной выдаче. Патент показывает, что личный и социальный контент может полностью перестраивать SERP.
- Спам и накрутка социальных сигналов: Попытки манипулировать социальными сигналами неэффективны, так как система учитывает Affinity (качество и историю связи), а не только количество упоминаний или лайков.
- Отправка неструктурированных писем: Отправка важных уведомлений (бронирования, заказы) без микроразметки упускает возможность отображения этой информации напрямую в поиске пользователя в виде удобных блоков.
Стратегическое значение
Патент подтверждает стратегию Google на создание унифицированного и глубоко персонализированного поискового опыта, стирая границы между публичным вебом и личными данными. Для SEO это означает, что выдача становится все более фрагментированной и зависимой от контекста пользователя. Долгосрочная стратегия должна включать построение сильного бренда и стимулирование органического распространения контента через социальные и личные каналы коммуникации.
Практические примеры
Сценарий 1: Извлечение структурированных данных из Email
- Действие компании: Авиакомпания отправляет подтверждение бронирования по email, используя микроразметку Schema.org для деталей рейса.
- Процесс Google: Google индексирует письмо пользователя (с его разрешения) и извлекает структурированные данные о рейсе.
- Результат в поиске: Когда пользователь вводит запрос, связанный с путешествием (например, «мой рейс в Танзанию»), Google отображает блок с деталями предстоящего рейса прямо вверху SERP (как показано на FIG. 14 в патенте).
Сценарий 2: Приоритет социального контента над публичным
- Запрос пользователя: «лучшие рестораны в Праге».
- Работа механизма: Система обнаруживает, что близкий контакт пользователя (высокий Affinity) недавно опубликовал пост в социальной сети с обзором ресторанов Праги.
- Результат: Этот пост (UGC) интегрируется в выдачу пользователя на высокую позицию, смещая стандартные результаты агрегаторов, так как источник является доверенным для пользователя (как показано на FIG. 6 в патенте).
- Действие SEO: Стимулировать создание положительных отзывов и обзоров в социальных сетях, чтобы увеличить охват через персонализированный поиск.
Вопросы и ответы
Что в этом патенте понимается под «Пользовательским контентом» (UGC)?
Патент определяет UGC очень широко. Это включает как публичный контент (блоги, открытые посты), так и, что более важно, контент с контролируемым доступом (Access Controlled Content): электронные письма, сообщения чатов, документы на Диске, события Календаря и посты в социальных сетях, видимые только друзьям.
Означает ли этот патент, что социальные сигналы являются фактором публичного ранжирования?
Нет, напрямую не означает. Патент фокусируется исключительно на персонализации выдачи для авторизованного пользователя. Социальные сигналы (особенно Affinity) являются сильным фактором ранжирования внутри этого персонализированного слоя, но патент не описывает их использование для ранжирования публичных веб-результатов для всех пользователей.
Как этот патент влияет на стандартное SEO и видимость сайта?
Он меняет итоговую выдачу для авторизованных пользователей. Персонализированные результаты (личные или социальные) могут занимать приоритетные позиции на экране, смещая стандартные органические результаты вниз. Это усложняет мониторинг позиций и требует от SEO-специалистов понимания принципов персонализации.
Что такое Affinity (Близость) и как она рассчитывается?
Affinity — это мера силы связи между пользователем и его контактом. Она рассчитывается на основе частоты и типа взаимодействий (переписка, клики на посты, комментарии), количества общих друзей и структуры социального графа. Чем выше Affinity, тем выше будет ранжироваться контент от этого контакта в персонализированной выдаче.
Как SEO-специалист может оптимизировать сайт под эти механизмы?
Напрямую оптимизировать чужой личный контент невозможно. Стратегически нужно стимулировать аутентичное обсуждение вашего бренда и распространение контента в социальных сетях. Если пользователи делятся вашим контентом, он попадает в социальные графы их контактов и может быть показан им как доверенный результат.
Как система обрабатывает приватность данных и может ли она показать мои письма другим людям?
Патент подчеркивает важность контроля доступа и разрешений. Индексация личных данных требует согласия пользователя. Система показывает пользователю только тот контент, к которому у него уже есть доступ (его собственные письма или письма, адресованные ему). Она не предоставляет доступ к вашим письмам третьим лицам.
Почему иногда личные результаты показываются сразу, а иногда скрыты за ссылкой?
Это зависит от интента запроса (Claims 15-18). Если запрос явный (например, «мои письма о велосипедах»), результаты показываются сразу. Если запрос общий («велосипеды»), система может показать ссылку для просмотра личных результатов, чтобы соблюсти приватность, если только пользователь не выбрал опцию «Всегда показывать».
Как это влияет на стратегию email-маркетинга?
Это критически важно для транзакционных писем. Компании должны использовать микроразметку Schema.org в своих письмах (бронирования, заказы, билеты). Это позволяет Google извлекать структурированные данные (например, детали рейса) и показывать их пользователю в виде обогащенного блока прямо в поиске.
Как система обрабатывает изображения из приватных источников?
Патент описывает, что если изображение из UGC не сопровождается текстом, оно может быть интегрировано в вертикаль поиска по картинкам (Claim 11) для этого пользователя. Если оно сопровождается текстом, оно может быть показано как часть сниппета веб-результата.
Связан ли этот патент с инициативой Google «Search plus Your World» (SPYW)?
Да, этот патент описывает техническую реализацию идей, которые легли в основу SPYW. Он детализирует, как именно происходит индексация, ранжирование с учетом Affinity и смешивание социального и личного контента с публичной выдачей. Хотя Google+ закрыт, базовая технология интеграции личных данных (Gmail, Drive) продолжает использоваться.