Google патентует механизм для устранения неоднозначности при поиске людей с одинаковыми именами. Система идентифицирует конкретных людей (сущностей) и предлагает их в Autocomplete, используя различающую информацию (фото, профессию, локацию) и сигналы персонализации (социальная близость, местоположение пользователя). Выбор подсказки запускает поиск по кластеру ресурсов, связанных именно с этим человеком.
Описание
Какую задачу решает
Патент решает проблему неоднозначности (ambiguity) при поиске информации о людях. Когда пользователь вводит имя (Individual Identifier), которое носят несколько человек, стандартный поиск возвращает смешанные результаты. Изобретение направлено на то, чтобы помочь пользователю идентифицировать и выбрать нужного человека непосредственно в интерфейсе поисковых подсказок (Suggest/Autocomplete), до выполнения основного поиска.
Что запатентовано
Запатентована система интеграции распознавания сущностей (конкретных людей) в механизм поисковых подсказок. Система использует предварительно сгруппированные данные (Clustered Resources) и сигналы персонализации для дифференциации людей с одинаковыми именами. Вместо текстового дополнения запроса система предлагает выбрать конкретную сущность, предоставляя различающую информацию (фото, профессию, локацию).
Как это работает
Механизм активируется при вводе Individual Identifier:
- Идентификация: Система находит несколько сущностей (людей), соответствующих введенному имени.
- Персонализация и Ранжирование: Кандидаты ранжируются на основе контекста пользователя: его местоположения, истории поиска и Social Affinity Score (степени социальной близости), а также общей популярности сущности.
- Disambiguation в Suggest: В подсказках отображаются профили с различающей информацией (визуальные индикаторы, профессия, организация), чтобы помочь пользователю сделать выбор.
- Кластерный поиск: При выборе конкретной подсказки система выполняет поиск только по Clustered Resources, связанным с выбранной сущностью.
- Представление результатов: Результаты могут быть представлены в специализированном формате Social Profile Page.
Актуальность для SEO
Средняя/Высокая. Концепция распознавания сущностей в Autocomplete крайне актуальна. Однако патент, поданный в 2012 году, сильно опирается на инфраструктуру Google+ (Social Circles, Social Profiles), которая сейчас неактуальна. Несмотря на устаревшие детали реализации, фундаментальные принципы идентификации сущностей, кластеризации ресурсов и персонализации подсказок на основе близости (Affinity) и контекста остаются ключевыми для современного поиска и Knowledge Graph.
Важность для SEO
Патент имеет значительное влияние на Entity SEO и стратегии построения персонального бренда. Он демонстрирует, насколько критично для Google четко идентифицировать человека как сущность и кластеризовать связанную с ним информацию. Он также подчеркивает глубокий уровень персонализации на этапе формирования подсказок. Если система не может однозначно идентифицировать персону и ее ключевые атрибуты, эта персона может не появиться в специализированных подсказках.
Детальный разбор
Термины и определения
- Clustered Resources (Кластеризованные ресурсы)
- Набор ресурсов (веб-страницы, изображения, документы, социальный контент), которые система предварительно связала с конкретной сущностью (например, конкретным человеком). Поиск по выбранной сущности ограничивается этим кластером.
- Clustering Engine (Механизм кластеризации)
- Компонент поисковой системы, отвечающий за идентификацию ресурсов, связанных с конкретной сущностью, и их группировку в кластеры. Может работать офлайн или в реальном времени.
- Entity (Сущность)
- Конкретный экземпляр объекта поиска. В контексте патента — конкретный человек, отличающийся от других людей с тем же именем.
- Individual Identifier (Идентификатор индивидуума)
- Термин в поисковом запросе, который идентифицирует одного или нескольких людей. Это может быть имя, описание профессии (Occupation Identifier), название организации (Organization Identifier) или их комбинация.
- Social Affinity Score (Оценка социальной близости)
- Метрика, представляющая уровень взаимодействия или связи между пользователем, выполняющим поиск, и искомой сущностью. Учитывает частоту просмотра профиля, уровень коммуникации, нахождение в Social Circle.
- Social Circle (Социальный круг)
- Группа контактов пользователя в социальной сети. Используется как сигнал для персонализации подсказок и оценки популярности.
- Social Profile (Социальный профиль)
- Профиль пользователя в социальной сети, содержащий информацию о нем (имя, профессия, локация, контакты). Используется как ключевой источник данных для идентификации сущностей и как формат представления результатов (Social Profile Page).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод улучшения поисковых подсказок для запросов о людях.
- Система получает ввод части поискового запроса, содержащего Individual Identifier, который соответствует нескольким разным людям с одинаковым именем.
- До выполнения поиска (ключевой момент — это происходит в Suggest):
- Система идентифицирует как минимум двух разных людей с этим именем (например, Персона А и Персона Б).
- Система предоставляет набор подсказок, включающий первую подсказку для Персоны А и вторую для Персоны Б.
- Обе подсказки содержат одинаковое имя, НО также включают дополнительную различающую информацию (further information distinguishing), которая отличает Персону А от Персоны Б.
- В ответ на выбор одной из подсказок (например, для Персоны А):
- Система получает результаты поиска, используя ресурсы, связанные именно с Персоной А.
- Система предоставляет эти результаты.
Система предлагает выбор между сущностями, используя дополнительную информацию для устранения неоднозначности до того, как пользователь выполнит поиск.
Claim 6 (Зависимый от 1): Уточняет, что получение результатов включает идентификацию одного или нескольких Social Profiles, связанных с этим Individual Identifier.
Система полагается на данные из социальных профилей для идентификации кандидатов.
Claims 7, 8, 9 (Зависимые от 6): Детализируют факторы персонализации при выборе социальных профилей для показа в подсказках. Идентификация основана на:
- Географическом местоположении пользователя (Claim 7).
- Истории поисковых запросов пользователя (Claim 8).
- Включении профиля в Social Circle пользователя (Claim 9).
Выбор кандидатов для Suggest сильно персонализирован и зависит от близости (географической, исторической или социальной) между пользователем и сущностью.
Claim 10 (Зависимый от 1): Уточняет, что различающая информация включает указание на географическое местоположение каждой из персон.
Claim 41, 42 (Зависимые от 1): Уточняют, что различающая информация может включать визуальный индикатор или изображение (фотографию) персоны.
Claim 44 (Концептуально важный, зависимый от Claim 28): Описывает использование Affinity Score для ранжирования.
- Идентифицируются несколько профилей социальной сети.
- Для каждого профиля определяется Affinity Score, представляющий уровень взаимодействия между ищущим пользователем и индивидуумом.
- Предоставление подсказок или получение результатов поиска основывается на этих Affinity Scores.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, с акцентом на предобработку данных и понимание запросов.
INDEXING – Индексирование и извлечение признаков
На этом этапе работает Clustering Engine. Система идентифицирует сущности (людей), собирает информацию о них (включая Social Profiles) и кластеризует все связанные ресурсы (веб-страницы, изображения, посты) вокруг каждой сущности. Эти Clustered Resources сохраняются. Также рассчитываются данные для Social Affinity Score и популярности сущностей.
QUNDERSTANDING – Понимание Запросов
Это основная фаза применения патента, конкретно в механизме Suggest (Autocomplete). Процесс происходит в реальном времени по мере ввода запроса:
- Система распознает Individual Identifier.
- Система идентифицирует потенциальные сущности-кандидаты.
- Система получает данные персонализации пользователя (локация, история поиска, социальные связи).
- Система рассчитывает Social Affinity Score и ранжирует кандидатов.
- Система формирует поисковые подсказки, добавляя дискриминирующую информацию (фото, локация, профессия).
RANKING – Ранжирование
Когда пользователь выбирает предложенную сущность, выполняется поиск. Ключевая особенность в том, что поиск (Retrieval) ведется не по всему индексу, а преимущественно по Clustered Resources, связанным с этой конкретной сущностью.
На что влияет
- Специфические запросы: В первую очередь влияет на запросы, связанные с поиском людей (People Search) — по имени, а также по профессии или организации, если они используются для идентификации людей.
- Конкретные типы контента: Влияет на видимость социальных профилей, персональных сайтов, блогов, изображений и авторского контента, связанного с конкретным человеком.
- Конкретные ниши или тематики: Критично для персонального брендинга, поиска специалистов, публичных личностей и рекрутинга.
Когда применяется
- Триггеры активации: Когда пользователь вводит запрос, который система классифицирует как Individual Identifier.
- Условия применения: Применяется, если система идентифицирует более одной сущности, соответствующей идентификатору (неоднозначность), и имеет достаточно данных (например, Social Profiles или метаданные в кластерах) для их дифференциации.
Пошаговый алгоритм
Процесс А: Предварительная обработка (Индексирование)
- Идентификация сущностей и профилей: Система идентифицирует индивидуумов, используя Social Profiles и другие источники.
- Кластеризация ресурсов: Clustering Engine группирует ресурсы, связанные с каждой сущностью, формируя Clustered Resources.
- Извлечение атрибутов: Из профилей и кластеров извлекается различающая информация (фото, профессия, организация, геолокация).
- Расчет популярности и связей: Оценивается популярность сущностей и анализируются социальные связи (Social Circles).
Процесс Б: Обработка ввода запроса (Реальное время)
- Получение ввода и распознавание: Система получает частичный запрос и определяет наличие Individual Identifier.
- Идентификация Кандидатов: Система ищет сущности, соответствующие идентификатору.
- Ранжирование Кандидатов (Персонализация): Система ранжирует найденные сущности для данного пользователя. Приоритет отдается сущностям на основе:
- Social Affinity Score (уровень взаимодействия).
- Географической близости к пользователю.
- Истории поиска пользователя.
- Общей популярности сущности.
- Формирование Подсказок (Disambiguation): Для топовых кандидатов генерируются подсказки. К имени добавляется различающая информация (фотография, профессия, локация).
- Отображение Подсказок: Подсказки отображаются пользователю до выполнения поиска.
- Обработка Выбора: Пользователь выбирает одну из предложенных сущностей.
- Выполнение Поиска по Кластеру: Система запускает поиск, ограничивая его набором Clustered Resources, соответствующих только выбранной сущности.
- Представление Результатов: Результаты предоставляются пользователю, возможно, в формате Social Profile Page.
Какие данные и как использует
Данные на входе
Система использует разнообразные данные для идентификации, кластеризации и персонализации.
- Социальные факторы (Ключевые):
- Social Profiles: Основной источник данных об атрибутах индивидуумов (имя, профессия, организация, локация).
- Social Circles: Данные о связях пользователя и популярности сущности.
- Контентные факторы: Данные из Clustered Resources, используемые для извлечения метаданных о сущности.
- Мультимедиа факторы: Изображения (фотографии профиля), используемые как визуальные дискриминаторы (visual indicator) в подсказках.
- Поведенческие и Пользовательские факторы:
- История поисковых запросов пользователя.
- История взаимодействия пользователя с Social Profile сущности (просмотры, коммуникация).
- Географические факторы:
- Географическое местоположение пользователя, выполняющего поиск.
- Географическое местоположение сущности.
- Технические факторы: Упоминается возможность использования IP-адреса или DNS для определения организации пользователя и фильтрации поиска по сотрудникам.
Какие метрики используются и как они считаются
- Social Affinity Score (Оценка социальной близости): Ключевая метрика для персонализированного ранжирования кандидатов в Suggest. Рассчитывается на основе уровня взаимодействия между пользователем и сущностью (частота просмотров профиля, коммуникации, социальные связи).
- Популярность Сущности (Entity Popularity): Метрика общей авторитетности сущности. Упоминаются способы расчета:
- Количество социальных кругов, в которые добавлена сущность.
- Количество ресурсов в кластере сущности.
- Популярность (рейтинг в поисковой системе) ресурсов в кластере сущности.
- Географическая Близость: Расстояние между местоположением пользователя и местоположением сущности.
Выводы
- Disambiguation на этапе ввода запроса: Ключевая функция патента — устранение неоднозначности имен до выполнения поиска, непосредственно в Autocomplete, путем предложения конкретных сущностей.
- Критичность Кластеризации Ресурсов: Эффективность системы зависит от способности Google корректно кластеризовать ресурсы вокруг конкретного человека (Clustered Resources). Поиск выполняется внутри этого кластера, а не по общему индексу.
- Глубокая Персонализация Поиска Людей: Выбор кандидатов для показа в Suggest сильно зависит от контекста пользователя. Social Affinity Score, история поиска и географическое положение являются решающими факторами, определяющими, кого увидит пользователь.
- Важность Отличительных Атрибутов: Для различения людей система полагается на четкие сигналы: фотографии, профессию, организацию и местоположение. Эти атрибуты критичны для Entity SEO.
- Зависимость от Социальных Сигналов (Контекст Google+): Патент явно опирается на инфраструктуру социальных профилей и кругов. Хотя детали реализации устарели, это демонстрирует важность структурированных данных о людях и связях для поисковых систем.
Практика
Best practices (это мы делаем)
Рекомендации сфокусированы на оптимизации персональных сущностей (Entity SEO) и управлении репутацией (ORM).
- Консолидация Персональной Сущности: Необходимо обеспечить консистентность ключевых идентификаторов личности (Имя, Профессия, Организация, Локация) во всех важных источниках (профили в соцсетях, корпоративные сайты, структурированные данные Schema.org/Person). Это помогает Google корректно идентифицировать сущность и извлечь атрибуты для показа в Suggest.
- Использование консистентного визуального образа: Патент указывает на использование изображений (Claim 42) для визуальной дифференциации. Используйте одинаковую профессиональную фотографию во всех профилях.
- Оптимизация Социальных Профилей: Активно ведите и полностью оптимизируйте ключевые Social Profiles, так как они являются основным источником данных для идентификации и различающей информации, описанной в патенте.
- Локальная Оптимизация для Специалистов: Для специалистов, привязанных к локации, критично указывать точное местоположение. Система будет отдавать приоритет локальным результатам в Suggest (Claim 7).
- Насыщение Кластера Ресурсов: Создание и оптимизация контента, связанного с человеком (статьи, интервью, персональный сайт). Это увеличивает объем Clustered Resources и повышает авторитетность сущности.
Worst practices (это делать не надо)
- Распыление Идентичности (Неконсистентность): Использование разных вариантов имени, указание разных профессий или организаций на разных платформах. Это затрудняет работу Clustering Engine и снижает шансы на корректное распознавание сущности.
- Использование разных фотографий: Отсутствие единого визуального образа мешает пользователям и системе использовать фото как надежный различающий признак.
- Игнорирование Персонализации при анализе: Оценка видимости персонального бренда только в режиме инкогнито не дает полной картины. Этот патент показывает, что видимость в Suggest сильно зависит от того, кто (Social Affinity) и откуда (Location) ищет.
Стратегическое значение
Патент подтверждает стратегию Google по переходу к сущностно-ориентированному поиску (Entity-based Search). Для персонального брендинга это означает, что недостаточно просто ранжироваться по запросу «Имя Фамилия»; необходимо быть распознанным как четкая сущность с атрибутами. Это также подчеркивает, что этап Query Understanding становится все более персонализированным. Стратегия должна быть направлена на создание сильной, четко определенной и легко идентифицируемой персональной сущности.
Практические примеры
Сценарий: Оптимизация профиля локального специалиста для Disambiguation
Задача: Увеличить видимость профиля юриста «Алексей Иванов» в Москве, учитывая, что есть много других людей с таким именем.
- Консолидация Сущности: Убедиться, что на всех платформах (сайт юридической фирмы, LinkedIn, правовые агрегаторы) используется единое представление: «Алексей Иванов, Адвокат по недвижимости, Москва».
- Визуальная Дифференциация: Использовать одну и ту же профессиональную фотографию на всех платформах.
- Локальные Сигналы: Четко указать адрес офиса в Москве и использовать локальные сигналы для усиления географической привязки.
- Внедрение разметки: Использовать Schema.org/Person на личном сайте или странице компании, связывая все профили через sameAs.
- Ожидаемый результат: Когда пользователь в Москве начнет вводить «Алексей Иванов», система с большей вероятностью предложит в Suggest именно этого юриста с уточняющими атрибутами («Адвокат по недвижимости, Москва» и фото), основываясь на географической близости (Claim 7) и четких дискриминаторах.
Вопросы и ответы
Что такое «Clustered Resources» и почему это важно для SEO?
Clustered Resources — это набор всех ресурсов (страниц, изображений, профилей), которые Google связал с конкретным человеком (сущностью). Это важно, потому что при выборе сущности в Suggest поиск выполняется именно по этому кластеру, а не по всему интернету. Для SEO это означает, что необходимо помочь Google правильно атрибутировать ваш контент и профили к вашей сущности, чтобы они попали в этот кластер и участвовали в поиске по ней.
Как Google определяет, кого из людей с одинаковыми именами показать в подсказках первым?
Патент описывает несколько ключевых факторов для приоритезации. Во-первых, используется глубокая персонализация: система анализирует Social Affinity Score (насколько вы близки или часто взаимодействовали с этим человеком), ваши социальные связи (Social Circles), вашу историю поиска и ваше местоположение. Во-вторых, учитывается глобальная популярность и известность человека.
Какие данные Google использует для различения людей в подсказках?
Патент явно упоминает использование различающей информации (distinguishing information). К ней относятся: географическое местоположение человека, его профессия (occupation), организация (organization), а также визуальные индикаторы, такие как фотографии профиля. Эта информация чаще всего извлекается из Social Profiles или кластеризованных ресурсов.
Патент много говорит о Social Profiles и Social Circles. Актуально ли это после закрытия Google+?
Детали реализации, привязанные к Google+, устарели. Однако базовые принципы остались актуальными. Вместо Google+ источниками данных о сущностях и их атрибутах теперь служат Knowledge Graph, профессиональные социальные сети, авторитетные сайты и структурированные данные. Принцип использования близости (Affinity) и популярности для ранжирования подсказок также сохранился, но рассчитывается на основе других сигналов.
Как я могу повлиять на то, какая информация отображается рядом с моим именем в Autocomplete?
Необходимо обеспечить консистентность ваших данных во всех ключевых источниках, которые Google использует для формирования сущностей. Убедитесь, что ваше имя, должность, компания и местоположение указаны одинаково и актуально. Также критически важно использовать единую профессиональную фотографию во всех профилях, так как она используется как визуальный дискриминатор.
Что такое «Individual Identifier»? Это только имя?
Нет, не только. Individual Identifier — это любой термин в запросе, который может указывать на человека. Патент уточняет, что это может быть имя, описание профессии (например, «software engineer»), название организации или комбинация этих факторов (например, «john doe example corporation»).
Происходит ли этот процесс до или после выполнения поиска?
Ключевой момент патента (Claim 1) заключается в том, что идентификация сущностей и предоставление дифференцированных подсказок происходит до выполнения основного поиска (prior to execution of the search query). Это функция механизма Suggest, направленная на уточнение интента пользователя на самом раннем этапе.
Что делать, если Google путает меня с другим человеком с тем же именем?
Необходимо активно работать над консолидацией вашей сущности. Убедитесь, что вы консистентно используете уникальные дискриминаторы (ваша профессия, компания, город) и фотографию на всех платформах. Используйте структурированные данные (Schema.org/Person) на вашем сайте, чтобы четко указать ваши атрибуты. Это поможет Clustering Engine отделить ваши ресурсы от ресурсов другого человека.
Что такое Social Affinity Score и могу ли я его улучшить?
Social Affinity Score — это оценка близости между двумя людьми, основанная на их взаимодействии (просмотры профилей, общение, общие круги). Как SEO-специалист, вы не можете напрямую манипулировать этим показателем. Однако повышение общей авторитетности сущности и стимулирование взаимодействия с ее контентом и профилями косвенно увеличивает вероятность показа в персонализированных подсказках.
Как этот патент связан с Knowledge Graph?
Патент описывает практическое применение данных, которые агрегируются в Knowledge Graph. Сущности (Entities), Clustered Resources и информация из профилей являются частью графа знаний. Патент описывает, как эти данные используются в реальном времени в интерфейсе Autocomplete для disambiguation и направления пользователя к нужной сущности в графе.