Google патентует систему построения «графа интересов» пользователя на основе его личных данных: истории поиска, посещенных сайтов, email, социальных связей и истории местоположений. Этот граф используется для автоматического предсказания интересов и персонализации предложений локальных событий и мест, когда пользователь находится в новом месте.
Описание
Какую задачу решает
Патент решает проблему сложности и времязатратности поиска релевантных событий и достопримечательностей (events and attractions), особенно когда пользователь находится в новом или незнакомом месте. Традиционный поиск часто требует ручного ввода ключевых слов и фильтрации результатов, которые могут не соответствовать личным интересам пользователя. Изобретение направлено на автоматизацию этого процесса путем предоставления персонализированных предложений.
Что запатентовано
Запатентована система для автоматического предсказания интересов пользователя и предоставления локальных рекомендаций. Система строит профиль или interest graph пользователя путем анализа пассивно собираемых данных: истории поиска, истории браузера, электронных сообщений, профилей в социальных сетях и истории местоположений. Этот граф используется для идентификации релевантных событий и мест рядом с текущим местоположением пользователя.
Как это работает
Система функционирует в нескольких режимах. Во-первых, она пассивно собирает и анализирует данные о действиях пользователя (даже если эти действия не связаны напрямую с поиском интересов) для построения interest graph. Во-вторых, она отслеживает текущее географическое местоположение устройства. При получении запроса от пользователя или автоматически (например, при прибытии в новое место) система определяет доминирующий интерес пользователя из графа. Затем она ищет события поблизости, соответствующие этому интересу, ранжирует их на основе силы связи (strength of a relationship) с интересом и выводит персонализированные предложения.
Актуальность для SEO
Высокая. Персонализация, локальный поиск и проактивные рекомендации являются ключевыми направлениями развития поиска Google и основой таких продуктов, как Google Maps, Google Assistant и Google Discover. Механизмы построения профиля интересов пользователя на основе его активности критически важны для повышения релевантности выдачи в современных поисковых системах.
Важность для SEO
Патент имеет высокое значение для SEO, особенно в области локального поиска (Local SEO) и продвижения событий (Event SEO). Он раскрывает механизмы глубокой персонализации, при которых видимость локального бизнеса или события зависит не только от местоположения и общих факторов ранжирования, но и от соответствия контента профилю интересов (interest graph) конкретного пользователя. Это подчеркивает важность оптимизации контента под тематики и интересы, а не только под конкретные ключевые слова.
Детальный разбор
Термины и определения
- Computing System (Вычислительная система)
- Сервер или система, которая получает данные от устройства пользователя, строит граф интересов и определяет предложения. В патенте подчеркивается, что обработка может происходить не на самом устройстве.
- Event / Attraction (Событие / Достопримечательность)
- Объекты поиска, включающие концерты, шоу, парки, музейные выставки и т.д.
- Event Information (Информация о событии)
- Данные, описывающие событие, такие как местоположение, описание, место проведения, расстояние до него.
- Interest Graph (Граф интересов)
- Структура данных, генерируемая системой на основе информации о пользователе и включающая множество тем, представляющих интерес (topics of interest).
- Predicted Interest (Предсказанный интерес)
- Тема, которая, по мнению системы, может заинтересовать пользователя. Определяется как наиболее часто встречающаяся тема в interest graph.
- Social Connection (Социальная связь)
- Отношения между пользователем и другими пользователями в социальной сети (например, друзья, подписчики).
- Stated Interest (Заявленный интерес)
- Интерес, явно указанный пользователем или его социальными связями в их профилях в социальных сетях.
- Strength of a Relationship (Сила связи)
- Метрика, определяющая степень релевантности между предсказанным интересом и информацией о событии. Используется для ранжирования.
- Threshold Distance (Пороговое расстояние)
- Максимальное расстояние или время в пути от текущего местоположения пользователя до события, используемое для фильтрации результатов.
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод, выполняемый вычислительной системой (computing system).
- Система получает индикацию географического местоположения устройства пользователя.
- Система получает информацию, связанную с пользователем. Ключевой момент: эта информация основана на вводе пользователя, который заставлял устройство выполнять функции, не связанные с предсказанием интересов (т.е. пассивный сбор данных во время обычной активности).
- Система генерирует interest graph на основе этой информации, включающий множество тем интересов.
- Система определяет тему интереса из графа, которая встречается чаще, чем другие темы.
- Система определяет одно или несколько событий, происходящих в пределах threshold distance от местоположения устройства, основываясь на этой теме интереса.
- Система выводит для передачи на устройство информацию по крайней мере об одном из этих событий.
Claim 2 (Зависимый): Детализирует построение interest graph из текстовой информации.
Система подсчитывает количество вхождений (respective count) различных ключевых слов в текстовой информации пользователя. Ключевое слово с наибольшим количеством вхождений вставляется в interest graph как тема интереса.
Claim 3 (Зависимый от 2): Уточняет подсчет ключевых слов.
Подсчет вхождений включает сумму вхождений самого ключевого слова и вхождений его синонимов.
Claim 5 (Зависимый): Детализирует использование социальных профилей пользователя.
Система определяет stated interest пользователя на основе его социального профиля и вставляет этот интерес в interest graph.
Claim 6 (Зависимый): Детализирует использование социальных связей (интересы друзей).
- Система идентифицирует других пользователей, имеющих social connection с основным пользователем.
- Система идентифицирует stated interests этих пользователей из их профилей.
- Система подсчитывает, какие интересы являются общими для двух или более из этих пользователей.
- Интерес с наибольшим количеством совпадений вставляется в interest graph основного пользователя.
Claim 7 (Зависимый): Детализирует использование истории браузера (browsing history).
Система извлекает текст со страниц, указанных в URL истории браузера. Затем она подсчитывает вхождения ключевых слов в этом тексте. Ключевое слово с наибольшим количеством вхождений вставляется в interest graph.
Claim 14 (Зависимый): Описывает процесс ранжирования.
Система определяет ранжирование событий на основе strength of a relationship между темой интереса пользователя и информацией о каждом событии. Результаты выводятся в порядке, определенном этим ранжированием.
Claim 17 (Зависимый): Описывает проактивный режим работы (уведомления).
Система определяет, является ли текущее местоположение новым (т.е. не включенным в историю местоположений пользователя). Если да, система автоматически выводит информацию о событии в виде уведомления (notification).
Где и как применяется
Изобретение затрагивает этапы, связанные с пониманием пользователя и персонализацией выдачи.
INDEXING – Индексирование и извлечение признаков
Косвенно. Система полагается на то, что информация о событиях и достопримечательностях (Event Information) проиндексирована и доступна для поиска.
QUNDERSTANDING – Понимание Запросов (и Пользователя)
Основное применение для построения профиля пользователя. Система анализирует личные данные пользователя (история поиска, браузера, социальные данные) офлайн или в реальном времени для генерации и обновления Interest Graph. Это ключевой компонент для понимания контекста и намерений пользователя за пределами текущего запроса.
RANKING / RERANKING – Ранжирование и Переранжирование
Основное применение для персонализации выдачи. Когда инициируется поиск локальных событий (по запросу или автоматически), система использует Interest Graph как фильтр для отбора кандидатов и как фактор ранжирования. Ранжирование определяется метрикой strength of a relationship между интересом и событием.
Входные данные:
- Текущее географическое местоположение устройства.
- История поиска пользователя (search history).
- История браузера (browsing history, URLs).
- Электронные сообщения (electronic communication message).
- Социальные профили (social media profile) пользователя и его связей.
- История местоположений (geographic location history).
Выходные данные:
- Interest Graph пользователя.
- Ранжированный список персонализированных предложений событий/достопримечательностей (Event Information).
На что влияет
- Конкретные типы контента: В первую очередь влияет на видимость страниц событий (концерты, выставки) и локальных достопримечательностей (музеи, парки, рестораны).
- Специфические запросы: Наибольшее влияние на локальные запросы (явные, например, «события рядом») и проактивные предложения (без запроса пользователя).
- Конкретные ниши или тематики: Туризм, развлечения, культура, общественное питание.
Когда применяется
Алгоритм применяется в двух основных сценариях:
- Реактивный режим: Когда пользователь явно запрашивает информацию о ближайших событиях или достопримечательностях (например, через поиск или карту).
- Проактивный режим (Claim 17): Автоматически, когда система определяет, что устройство находится в новом географическом местоположении (new geographic location), которое отсутствует в истории пользователя. В этом случае предложения выводятся как уведомления.
Пошаговый алгоритм
Процесс А: Построение Графа Интересов (Офлайн или Фоновый режим)
- Сбор данных: Система получает доступ к личной информации пользователя (история поиска/браузера, email, социальные профили). Сбор происходит пассивно, во время выполнения пользователем функций, не связанных с предсказанием интересов.
- Анализ текстовых данных:
- Система извлекает текст из сообщений, истории поиска и страниц, посещенных пользователем (из browsing history).
- Производится подсчет вхождений ключевых слов и их синонимов.
- Определяются темы интересов на основе ключевых слов с наибольшим количеством вхождений.
- Анализ социальных данных:
- Определяются заявленные интересы (stated interests) из профиля пользователя.
- Идентифицируются социальные связи пользователя.
- Анализируются заявленные интересы этих связей и определяются наиболее частые общие интересы.
- Генерация графа: Идентифицированные темы и интересы добавляются в Interest Graph пользователя с соответствующими весами (частотой).
Процесс Б: Генерация Предложений (Реальное время)
- Определение местоположения: Система определяет текущее географическое местоположение устройства.
- Триггер активации: Процесс запускается либо по запросу пользователя, либо автоматически, если местоположение определено как новое (проверка по истории локаций).
- Определение интереса: Система анализирует Interest Graph и определяет доминирующий Predicted Interest (тему, которая встречается наиболее часто).
- Поиск событий: Система инициирует поиск (например, через поисковую машину) событий, связанных с Predicted Interest.
- Фильтрация по локации: Результаты фильтруются по Threshold Distance (расстояние или время в пути) от текущего местоположения.
- Ранжирование: Система определяет strength of a relationship между Predicted Interest и каждым найденным событием. События ранжируются на основе этой метрики.
- Вывод результатов: Система форматирует Event Information и выводит ранжированный список пользователю (в виде списка, на карте или как уведомление).
Какие данные и как использует
Данные на входе
Патент детально описывает источники данных для построения профиля пользователя:
- Контентные факторы: Текстовое содержимое электронных сообщений (email, SMS). Текстовое содержимое веб-страниц, посещенных пользователем (извлекается по URL из browsing history). Текстовое содержимое социальных профилей пользователя и его связей (stated interests).
- Поведенческие факторы: История поисковых запросов (search history). История посещенных URL (browsing history). Структура социальных связей (social connections) на сервисе социальной сети.
- Географические факторы: Текущее географическое местоположение устройства. История географических местоположений (geographic location history).
Какие метрики используются и как они считаются
- Count of Keywords (Частота ключевых слов): Метрика для определения интереса. Рассчитывается как количество вхождений ключевого слова и его синонимов в анализируемых текстовых данных пользователя (email, история поиска, контент из истории браузера). Тема, связанная с ключевым словом с наибольшим показателем, становится Predicted Interest.
- Count of Common Stated Interests (Частота общих заявленных интересов): Метрика для определения интереса на основе социального графа. Подсчитывается, сколько социальных связей пользователя имеют определенный общий интерес в своих профилях. Наиболее частый интерес используется для профилирования пользователя.
- Strength of a Relationship (Сила связи): Метрика для ранжирования результатов. Определяет релевантность между Predicted Interest и Event Information. Патент не дает формулы, но упоминает, что поисковая система может определять это на основе частоты и расположения ключевых слов в описании события.
- Threshold Distance (Пороговое расстояние): Фильтр. Может быть задано как расстояние (например, 10 миль) или как время в пути (например, 20 минут на автобусе).
Выводы
- Глубокая персонализация локального поиска: Патент описывает систему, где локальная выдача формируется не только на основе местоположения и общих факторов, но и критически зависит от личных интересов пользователя. Два пользователя в одном месте получат разные рекомендации.
- Построение Interest Graph из пассивных данных: Ключевой механизм — это создание детального Interest Graph путем анализа данных, которые пользователь генерирует в ходе обычной деятельности (Claim 1: «functions unrelated to predicting interests»), такой как переписка, серфинг в интернете и использование социальных сетей.
- Использование разнообразных источников данных: Система агрегирует сигналы из истории поиска, браузера, личных сообщений и социальных сетей, что позволяет создать комплексный профиль интересов.
- Влияние социального графа (Интересы друзей): Патент явно указывает на использование интересов социальных связей пользователя для предсказания его собственных интересов (Claim 6). Если друзья пользователя часто интересуются определенной темой, эта тема будет добавлена в Interest Graph пользователя.
- Семантический анализ контента пользователя: Система не просто фиксирует активность, но анализирует содержимое посещенных страниц и сообщений, включая использование синонимов (Claim 3), для точного определения тем.
- Проактивные рекомендации: Система может работать без явного запроса, автоматически предлагая контент в виде уведомлений, когда пользователь оказывается в новом месте (Claim 17).
Практика
Best practices (это мы делаем)
- Оптимизация под Темы и Интересы (Topics/Interests), а не только Ключи: Контент о событии или месте должен быть семантически богатым и четко соответствовать определенным категориям интересов. Необходимо использовать разнообразную лексику и синонимы, связанные с темой (например, для выставки по астрономии использовать «космос», «галактики», «планеты», «астронавты»). Это повышает вероятность сильной связи (strength of a relationship) с соответствующим Predicted Interest пользователя.
- Детальное описание событий и мест: Предоставляйте максимально полную информацию (Event Information). Чем детальнее описание, тем больше данных у системы для оценки релевантности интересу пользователя и, соответственно, для более высокого ранжирования (Claim 14).
- Использование структурированных данных: Активно используйте микроразметку (Schema.org) для типов Event, Place, LocalBusiness. Это помогает поисковой системе лучше понять суть предложения и сопоставить его с интересами пользователя.
- Стимулирование социального вовлечения: Поскольку интересы социальных связей влияют на профиль пользователя (Claim 6), важно, чтобы ваш контент обсуждался и распространялся в социальных сетях среди целевой аудитории. Это косвенно влияет на видимость вашего предложения для пользователей со схожим социальным графом.
Worst practices (это делать не надо)
- Размытое позиционирование: Создание событий или мест «для всех» без четкой тематической направленности снижает шансы на попадание в персонализированную выдачу, так как система не сможет установить сильную связь с конкретным интересом пользователя.
- Использование только общих ключевых слов: Оптимизация только под общие запросы (например, «ресторан рядом») без учета специфики интересов (например, «веганская кухня», «крафтовое пиво») делает бизнес зависимым только от геолокации и игнорирует фактор персонализации.
- Скудное описание контента: Отсутствие детальной информации на сайте или в листинге мешает системе оценить релевантность и снижает ранжирование в персонализированной выдаче.
Стратегическое значение
Патент подтверждает стратегическую важность персонализации в локальном поиске. Он демонстрирует, как Google строит понимание пользователя (спрос), чтобы лучше удовлетворить его с помощью релевантного контента (предложение). Для SEO-специалистов это означает, что анализ SERP должен учитывать фактор персонализации: невозможно гарантировать одинаковую видимость для всей аудитории. Долгосрочная стратегия должна фокусироваться на построении тематического авторитета (Topical Authority) и четком соответствии контента профилям интересов целевых пользователей.
Практические примеры
Сценарий: Оптимизация выставки для привлечения целевой аудитории
Задача: Музей открывает новую выставку по астрономии и хочет привлечь посетителей, интересующихся этой темой.
- Анализ целевого Interest Graph: Определить, какие ключевые слова и синонимы могут присутствовать в Interest Graph целевого пользователя (на основе Claim 2 и 3). Например: «астрономия», «космос», «НАСА», «телескоп Хаббл», «черные дыры», «инопланетяне».
- Оптимизация контента (Event Information): Создать страницу выставки, используя эти термины в заголовках, описании экспонатов, расписании лекций. Это увеличит strength of a relationship (Claim 14) между выставкой и интересом «астрономия».
- Локальная оптимизация: Убедиться, что местоположение музея четко определено в Google Business Profile.
- Ожидаемый результат: Когда пользователь с доминирующим интересом «астрономия» окажется рядом с музеем (в пределах Threshold Distance), система Google (например, в Картах или как проактивное уведомление) с высокой вероятностью покажет ему эту выставку на высоких позициях, даже если он не вводил явный запрос.
Вопросы и ответы
Что такое Interest Graph в контексте этого патента и как он строится?
Interest Graph — это структура данных, содержащая темы (topics of interest), которые могут быть интересны пользователю. Он строится путем анализа личных данных пользователя: подсчета частоты ключевых слов и их синонимов в истории поиска, контенте посещенных страниц (browsing history) и электронных сообщениях. Также в граф добавляются интересы, явно указанные в социальном профиле пользователя и наиболее популярные интересы его социальных связей (друзей).
Насколько сильно этот патент влияет на локальное SEO?
Влияние очень значительно. Патент описывает механизм глубокой персонализации локальной выдачи. Это означает, что ранжирование вашего бизнеса или события для конкретного пользователя зависит не только от его близости и общих факторов SEO, но и от того, насколько ваше предложение соответствует его личному Interest Graph. Это делает стандартный анализ локальной выдачи менее точным.
Патент упоминает анализ электронных сообщений (email). Значит ли это, что Google читает почту для SEO?
Да, патент явно указывает electronic communication message как один из источников данных для построения Interest Graph (Claim 1). Система автоматически анализирует текст сообщений для подсчета частоты ключевых слов (Claim 2). Это используется для персонализации предложений (например, в Google Assistant или Discover), а не для общего веб-ранжирования, но влияет на видимость контента для конкретного пользователя.
Что значит, что данные собираются во время выполнения функций, «не связанных с предсказанием интересов»?
Это ключевой аспект пассивного сбора данных (Claim 1). Система анализирует действия, которые пользователь выполняет для своих целей (например, пишет письмо другу о новом хобби или читает новости), и использует контент этих действий для понимания его интересов. Пользователю не нужно специально сообщать Google о своих интересах.
Как используется информация из социальных сетей?
Используются два подхода. Во-первых, анализируется профиль самого пользователя для выявления заявленных интересов (stated interests) (Claim 5). Во-вторых, что более интересно, анализируются профили его социальных связей (друзей) (Claim 6). Если многие друзья интересуются определенной темой, система добавит эту тему в Interest Graph пользователя.
Как система определяет релевантность события интересу пользователя?
Релевантность определяется метрикой strength of a relationship (Claim 14). Хотя формула не приводится, упоминается, что она может основываться на частоте и расположении ключевых слов, связанных с интересом, в описании события (Event Information). Для SEO это означает необходимость использования семантически богатого и релевантного описания.
Может ли система предлагать события без запроса пользователя?
Да. Патент описывает проактивный режим (Claim 17). Если система обнаруживает, что пользователь находится в новом месте (которого нет в его истории локаций), она может автоматически сгенерировать персонализированные предложения и показать их в виде уведомления (notification).
Как SEO-специалист может оптимизировать контент под Interest Graph?
Необходимо сместить фокус с конкретных поисковых запросов на более широкие темы и интересы. Создавайте контент, который четко позиционируется в рамках определенной тематики, используйте разнообразную лексику, синонимы и связанные сущности. Это поможет системе установить сильную связь между вашим предложением и соответствующей темой в Interest Graph пользователя.
Влияет ли этот механизм на ранжирование в обычном веб-поиске (10 синих ссылок)?
Патент сфокусирован на предложении локальных событий и достопримечательностей, что чаще реализуется в Google Maps, Discover или специализированных блоках выдачи. Однако механизмы построения Interest Graph, описанные здесь, являются фундаментальными для понимания пользователя и могут использоваться для персонализации любого типа выдачи, включая обычный веб-поиск.
Где происходит обработка данных – на устройстве пользователя или на серверах Google?
Claim 1 указывает, что метод выполняется «вычислительной системой» (computing system), которая получает данные от устройства пользователя. Это предполагает, что основная обработка, включая построение Interest Graph и поиск событий, происходит на серверах Google, а не локально на устройстве пользователя.