Google создает персонализированный индекс контактов пользователя, собирая данные из почты, социальных сетей и календаря. Система распознает естественные вопросы о людях (например, «Где живет Боб?») и предоставляет прямые ответы, используя этот индекс. Результаты ранжируются на основе истории взаимодействия, близости отношений и публичной авторитетности контакта.
Описание
Какую задачу решает
Патент решает проблему сложности и фрагментации поиска информации о людях, которых знает пользователь. Данные (адреса, дни рождения, места работы) часто разбросаны по разным сервисам (почта, календарь, контакты телефона, социальные сети). Изобретение направлено на создание унифицированного доступа к этой информации через естественные поисковые запросы (natural language, people-related question).
Что запатентовано
Запатентована система для ответов на вопросы, связанные с людьми, путем использования персонализированной структуры данных (data structure), которая хранит информацию о контактах пользователя. Система определяет, является ли запрос вопросом о человеке, ищет ответ в этой структуре данных и выборочно предоставляет персонализированный ответ, ранжируя его на основе множества сигналов, включая историю взаимодействия и авторитетность контакта.
Как это работает
Система работает в двух основных фазах:
- Создание индекса (Офлайн): Система собирает данные из различных источников пользователя (почта, соцсети, календарь и т.д.) и создает унифицированную структуру данных (персонализированный индекс контактов).
- Обработка запроса (Онлайн):
- Система получает запрос на естественном языке.
- Определяет, что это people-related question.
- Преобразует запрос в структурированный формат (например, Имя: Боб, Атрибут: Адрес).
- Ищет совпадения в персонализированном индексе.
- Ранжирует найденные контакты, используя различные метрики (частота общения, географическая близость, публичная авторитетность).
- При достижении порога уверенности система смешивает персонализированный ответ с общими результатами поиска.
Актуальность для SEO
Высокая. Описанные механизмы лежат в основе функций «Персональные результаты» в поиске Google и работы Google Assistant. Интеграция персональных данных для предоставления прямых ответов и персонализированного опыта является ключевым направлением развития поисковых систем.
Важность для SEO
Прямое влияние на традиционное органическое SEO низкое (Оценка 3/10). Патент описывает ранжирование персональных данных пользователя, а не публичных веб-страниц. Однако он имеет важное стратегическое значение: он демонстрирует сложные механизмы понимания сущностей (людей) и их атрибутов, включая расчет публичной авторитетности (Authority Score), что перекликается с принципами E-E-A-T. Кроме того, такие персонализированные ответы занимают место на SERP, потенциально снижая видимость стандартных органических результатов.
Детальный разбор
Термины и определения
- Authority Score (Оценка авторитетности)
- Метрика для ранжирования контакта, основанная на публичном профиле человека (public profile), таком как профиль в социальной сети или упоминания в новостных документах.
- Data structure (Структура данных / Персонализированный индекс)
- База данных (индекс), ассоциированная с конкретным пользователем, хранящая данные о людях, с которыми он связан. Содержит поля Name, Attribute, Type, Value.
- General search results (Общие результаты поиска)
- Стандартные результаты поиска (веб, картинки, новости и т.д.), полученные в ответ на запрос, в отличие от персонализированных результатов.
- Interaction Score (Оценка взаимодействия)
- Метрика для ранжирования контакта, основанная на количестве взаимодействий пользователя с этим человеком (количество писем, звонков, упоминаний в календаре, связей в разных сервисах).
- Location Score (Оценка местоположения)
- Метрика для ранжирования контакта, основанная на географическом расстоянии между текущим местоположением пользователя и местоположением (текущим, домашним или рабочим адресом) контакта.
- People-related question (Вопрос, связанный с людьми)
- Запрос, который система идентифицирует как попытку найти информацию о контактах пользователя (например, «Где живет Боб?»).
- Restructured search query (Реструктурированный поисковый запрос)
- Преобразование запроса на естественном языке в структурированный формат, соответствующий полям индекса (например, {name:»john doe» attribute: «address» type: «home»}).
- Tag Score (Оценка тега/категории)
- Метрика для ранжирования контакта, основанная на категории отношений, присвоенной пользователем (например, семья, друг, коллега). Члены семьи получают более высокий балл.
- Temporal Score (Временная оценка)
- Метрика для ранжирования контакта, основанная на давности взаимодействия пользователя с этим человеком (недавние поиски, звонки, письма, события в календаре).
Ключевые утверждения (Анализ Claims)
Claim 1 (Независимый пункт): Описывает основной метод обработки запроса.
- Система получает поисковый запрос от пользователя.
- Определяет, что запрос является people-related question.
- Используя персонализированную data structure (индекс контактов пользователя), идентифицирует набор людей, релевантных запросу.
- Определяет, следует ли предоставлять информацию об этом наборе людей.
- Выборочно предоставляет пользователю либо первый документ (содержащий ответ на вопрос и идентифицирующий как минимум одного человека из набора), либо второй документ (исключающий эту информацию).
Claim 3 и 4 (Зависимые): Детализируют механизм ранжирования и выбора контакта, если найдено несколько релевантных людей (например, несколько людей с именем Боб).
Система генерирует оценки (scores) для каждого человека в наборе и выбирает по крайней мере одного человека на основе этих оценок. Генерация оценки (Claim 4) базируется как минимум на одном из следующих факторов:
- Категория, указанная пользователем (Tag Score).
- Географическое расстояние (Location Score).
- Давность взаимодействия (Temporal Score).
- Количество взаимодействий (Interaction Score).
- Оценка авторитетности (Authority Score).
- Наличие фотографии человека в структуре данных (Photo Score).
Claim 5 и 6 (Зависимые): Детализируют процесс принятия решения о показе персонализированного ответа.
Claim 5: Система генерирует оценку для каждого человека, сравнивает наивысшую оценку с пороговым значением (threshold) и решает предоставить информацию, если порог превышен.
Claim 6: Система также выполняет общий поиск (general search). Решение о предоставлении персонализированной информации принимается на основе как сгенерированных оценок контактов, так и информации, относящейся к общим результатам поиска.
Где и как применяется
Изобретение затрагивает несколько этапов поиска, используя данные из персонализированного индекса для предоставления прямых ответов.
INDEXING – Индексирование (Персонализированное)
На этом этапе происходит создание и обновление data structure. Система получает информацию о контактах пользователя из различных сетевых источников (network-based sources), таких как контакты телефона, аккаунт электронной почты, календарь, социальные сети, записи голосовых коммуникаций (Claim 16, 17).
QUNDERSTANDING – Понимание Запросов
Система анализирует входящий запрос, чтобы определить, является ли он people-related question (используя обученную модель). Если да, запрос преобразуется (restructuring the search query) в структурированный формат для поиска по персонализированному индексу.
RANKING – Ранжирование (Персонализированное)
Система ищет совпадения в data structure и ранжирует найденные контакты. Ранжирование использует сложную модель оценки, включающую Tag Score, Location Score, Temporal Score, Interaction Score, Authority Score и Photo Score.
METASEARCH – Метапоиск и Смешивание
Основной этап применения. Система сравнивает оценки персонализированных результатов с порогом и/или с оценками общих результатов поиска (general search results). Принимается решение о показе персонализированного блока. Происходит смешивание (Blending) персонализированного ответа с общей выдачей.
Входные данные:
- Поисковый запрос пользователя (часто на естественном языке).
- Персонализированная структура данных (индекс контактов).
- Данные о текущем контексте пользователя (например, местоположение для расчета Location Score).
- Публичные данные о контактах (для расчета Authority Score).
Выходные данные:
- Документ с результатами поиска, который может включать специальный блок с персонализированным ответом (имя контакта и запрошенная информация) или исключать его.
На что влияет
- Специфические запросы: Влияет на информационные запросы о конкретных людях или группах людей, известных пользователю («адрес Боба», «кто из моих знакомых работает в Google»).
- Конкретные типы контента: Влияет на отображение персональных данных (контакты, адреса, события) в результатах поиска.
- Языковые и географические ограничения: Работает в рамках языков, для которых обучена модель распознавания people-related questions.
Когда применяется
- Триггеры активации: Активируется, когда система с высокой вероятностью определяет, что запрос направлен на получение информации о контактах пользователя.
- Условия применения: Пользователь должен быть авторизован и дать разрешение на сбор и использование своих персональных данных для создания data structure.
- Пороговые значения: Применяется, только если наивысшая оценка персонализированного результата превышает установленный порог уверенности (Claim 5), и/или если этот результат конкурентоспособен по сравнению с общими результатами поиска (Claim 6).
Пошаговый алгоритм
Процесс А: Генерация персонализированного индекса (Офлайн)
- Идентификация источников: Определение источников данных пользователя (Email, Calendar, Social Network и т.д.).
- Сбор данных: Извлечение информации о людях из этих источников.
- Нормализация и Ассоциация: Сопоставление данных о людях и сохранение их в data structure в формате Атрибут/Тип/Значение.
- Ассоциация с пользователем: Привязка созданной структуры данных к аккаунту пользователя.
Процесс Б: Обработка запроса (Онлайн)
- Получение запроса: Система получает запрос от пользователя.
- Классификация запроса: Определение, является ли запрос people-related question. Если нет, выполняется стандартный поиск.
- Реструктуризация запроса: Преобразование запроса на естественном языке в структурированный формат (Restructured search query).
- Поиск по индексу: Сравнение реструктурированного запроса с данными в персонализированном индексе пользователя. Идентификация набора релевантных людей.
- Параллельный поиск: Выполнение общего поиска для получения general search results.
- Ранжирование контактов: Расчет оценок для каждого найденного человека на основе комбинации сигналов:
- Tag Score (отношения)
- Location Score (расстояние)
- Temporal Score (давность общения)
- Interaction Score (частота общения)
- Authority Score (публичная авторитетность)
- Photo Score (наличие фото)
- Выбор лучшего результата: Выбор контакта(ов) с наивысшей оценкой.
- Принятие решения (Thresholding): Сравнение наивысшей оценки с порогом и/или с оценками general search results. Определение, нужно ли показывать персонализированный ответ.
- Формирование ответа: Если решено показывать, формируется документ, включающий персонализированный ответ и общие результаты. В ответ может включаться вычисленная информация (например, возраст контакта).
- Предоставление результатов: Отправка документа пользователю.
Какие данные и как использует
Данные на входе
Патент фокусируется на использовании персональных данных пользователя и контекстных сигналов для ранжирования.
- Пользовательские данные (Private Data): Это основные данные для индекса. Включают данные из: аккаунта электронной почты (контакты, содержание писем), аккаунта текстовых сообщений, контактов телефона, календаря, записей голосовых коммуникаций, социальных сетей (списки друзей, содержание постов).
- Контентные факторы (Персональные): Имена, никнеймы, адреса, номера телефонов, email, места работы, учебные заведения, дни рождения контактов.
- Поведенческие факторы: История взаимодействия пользователя с контактом (частота и давность коммуникаций, поисков, совместных событий).
- Географические факторы: Текущее местоположение пользователя и текущее или сохраненное местоположение контакта.
- Внешние факторы (Public Data): Публичные профили контактов в социальных сетях, новостные документы, связанные с контактом (используются для расчета Authority Score).
Какие метрики используются и как они считаются
Система использует взвешенную комбинацию нескольких метрик для расчета итоговой оценки (Total Score) для каждого контакта:
- Tag Score: Основан на типе отношений. Более близкие отношения (семья) получают более высокий балл, чем дальние (бывший коллега).
- Location Score: Обратно пропорционален географическому расстоянию между пользователем и контактом.
- Temporal Score: Основан на давности взаимодействия. Недавние взаимодействия повышают оценку.
- Interaction Score: Основан на общем количестве взаимодействий и количестве платформ, через которые пользователь связан с контактом.
- Authority Score: Основан на анализе публичного профиля человека. Более известные и уважаемые публично люди получают более высокий балл.
- Photo Score: Повышает оценку, если в индексе сохранена фотография контакта.
- Threshold (Порог): Минимальное значение Total Score, необходимое для показа персонализированного результата.
Выводы
- Персонализация через интеграцию данных: Патент демонстрирует способность Google создавать глубоко персонализированный индекс (Personal Knowledge Graph), интегрируя данные из разрозненных источников пользователя (почта, календарь, соцсети) в единую структуру.
- Сложное ранжирование персональных сущностей: Ранжирование контактов не ограничивается простым совпадением имени. Используется сложная модель, учитывающая силу отношений (Tag Score), контекст (Location Score) и историю взаимодействия (Temporal и Interaction Scores).
- Использование публичной авторитетности (Authority Score): Критически важный вывод для SEO. Google рассчитывает Authority Score для людей на основе их публичных профилей и упоминаний в новостях, и использует эту оценку даже при ранжировании персональных контактов. Это подтверждает важность публичной авторитетности экспертов (E-E-A-T).
- Понимание естественного языка и реструктуризация запросов: Система активно преобразует естественный язык в структурированные запросы к базе данных, что подчеркивает важность NLP в современном поиске.
- Конкуренция за пространство на SERP: Персонализированные ответы являются формой прямого ответа (Direct Answer) и конкурируют с традиционными органическими результатами за видимость на странице выдачи.
Практика
Best practices (это мы делаем)
Хотя патент описывает работу с персональными данными, из него можно извлечь стратегические уроки, особенно касающиеся Authority Score.
- Развитие публичной авторитетности ключевых сотрудников (E-E-A-T): Поскольку система использует Authority Score, основанный на публичных профилях и новостных документах, для оценки важности людей, необходимо работать над публичной репутацией экспертов компании. Это включает ведение профессиональных социальных сетей и публикации в авторитетных изданиях.
- Учет персонализации при анализе SERP: SEO-специалисты должны понимать, что для авторизованных пользователей выдача может содержать персонализированные блоки, смещающие органические результаты. Анализ трафика и позиций должен учитывать этот фактор.
- Фокус на сущностях (Entities): Патент подтверждает фокус Google на понимании сущностей (в данном случае – людей) и связей между ними. Стратегия должна быть направлена на четкое представление ключевых сущностей компании (включая авторов и руководство) в публичном пространстве.
Worst practices (это делать не надо)
- Попытки оптимизации под персональные результаты: Бесполезно пытаться оптимизировать контент для попадания в этот блок, так как он формируется исключительно из приватных данных пользователя (data structure), к которым у SEO-специалиста нет доступа.
- Игнорирование авторитетности авторов: Недооценка важности публичного профиля авторов и экспертов. Authority Score показывает, что Google активно оценивает и использует эти сигналы.
Стратегическое значение
Патент подчеркивает стратегический сдвиг поиска в сторону ассистивного и гипер-персонализированного опыта. Для Google пользователь и его личный граф контактов являются важной частью общего информационного пространства. Стратегическое значение для SEO заключается в подтверждении того, что оценка авторитетности людей (Authority Score) является реально вычисляемой метрикой, основанной на публичных данных. Это напрямую поддерживает стратегии, основанные на развитии E-E-A-T.
Практические примеры
Сценарий: Повышение ранжирования контакта за счет Authority Score
Этот пример демонстрирует, как работа над публичным профилем может повлиять даже на персональный поиск.
- Ситуация: Пользователь ищет контакт своего знакомого: «телефон Джона». У пользователя есть два знакомых Джона: Джон А (коллега) и Джон Б (эксперт в индустрии).
- Действия SEO/PR: Компания Джона Б активно работала над его E-E-A-T: он ведет авторитетный блог, часто упоминается в новостях и имеет сильный профессиональный профиль в соцсетях.
- Обработка в Google: Система рассчитывает метрики для обоих Джонов.
- Джон А имеет более высокий Interaction Score (общаются чаще).
- Джон Б имеет значительно более высокий Authority Score (из-за публичной деятельности).
- Результат: В зависимости от весовых коэффициентов в алгоритме, Джон Б может быть показан выше Джона А, так как его высокая публичная авторитетность компенсирует меньшую частоту личного общения. Система предполагает, что пользователь с большей вероятностью ищет контакт более авторитетного человека.
Вопросы и ответы
Влияет ли этот патент на ранжирование моего сайта в органическом поиске?
Напрямую нет. Патент описывает механизм создания и ранжирования персонализированного индекса контактов пользователя, основанного на его личных данных (почта, календарь и т.д.). Он не описывает алгоритмы ранжирования публичных веб-страниц. Ваш сайт не может попасть в этот персонализированный блок, если он уже не сохранен в контактах пользователя.
Что такое «Authority Score» и как он связан с E-E-A-T?
Authority Score — это метрика, используемая для оценки публичной авторитетности человека. Она рассчитывается на основе его публичного профиля, например, профиля в социальной сети или упоминаний в новостных документах. Это напрямую связано с компонентом «Authority» (Авторитетность) в E-E-A-T, подтверждая, что Google алгоритмически оценивает репутацию и известность людей как сущностей.
Стоит ли мне работать над «Authority Score» моих сотрудников?
Да, стратегически это важно. Хотя в данном патенте Authority Score используется для ранжирования личных контактов, сам факт его существования и методы расчета (на основе публичных данных) подтверждают важность развития публичной авторитетности экспертов и авторов компании для улучшения общих сигналов E-E-A-T сайта.
Могут ли эти персонализированные ответы вытеснить мой сайт из топа?
Да, это возможно. Если система решает показать персонализированный ответ, он часто размещается в верхней части SERP или на видном месте. Это увеличивает конкуренцию за видимое пространство на странице выдачи и может сместить стандартные органические результаты ниже, уменьшая их CTR.
Как Google определяет, какой контакт показать, если у пользователя несколько людей с одинаковым именем?
Система использует сложную модель ранжирования, основанную на 6 ключевых метриках: Tag Score (близость отношений), Location Score (географическая близость), Temporal Score (давность общения), Interaction Score (частота общения), Authority Score (публичная авторитетность) и Photo Score. Контакт с наивысшей суммарной оценкой будет показан первым.
Что такое «реструктуризация запроса» в контексте этого патента?
Это процесс преобразования запроса на естественном языке в структурированный формат, понятный базе данных. Например, запрос «Какой домашний адрес у Джона Доу?» преобразуется в структуру вида: Имя: «Джон Доу», Атрибут: «Адрес», Тип: «Домашний». Это позволяет системе точно искать информацию в персонализированном индексе.
Откуда Google берет данные для этого персонализированного индекса?
Данные собираются из различных источников, связанных с аккаунтом пользователя (при наличии разрешения). К ним относятся контакты телефона, аккаунт электронной почты (включая содержание писем), календарь, социальные сети (списки друзей, посты) и записи голосовых коммуникаций.
Применяется ли этот механизм ко всем запросам?
Нет. Сначала система должна классифицировать запрос как people-related question (вопрос, связанный с людьми). Если классификация успешна и система находит релевантный ответ в персональном индексе, который превышает порог уверенности, только тогда механизм активируется для показа ответа.
Что означают Temporal Score и Interaction Score?
Они оба связаны с историей общения, но измеряют разные аспекты. Temporal Score фокусируется на давности (когда в последний раз вы общались с человеком), повышая баллы за недавние контакты. Interaction Score фокусируется на количестве (как часто вы общаетесь в целом и на скольких платформах вы связаны), повышая баллы за частые и многоканальные взаимодействия.
Каково стратегическое значение этого патента для SEO?
Стратегическое значение заключается в понимании того, как глубоко Google анализирует сущности (Entities) и связи между ними. Патент демонстрирует работу с Персональным Графом Знаний (Personal Knowledge Graph) и подтверждает алгоритмический расчет авторитетности людей. Это укрепляет необходимость стратегий, ориентированных на сущности и E-E-A-T.