
Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.
Патент решает проблему ранжирования документов в условиях крайней разреженности данных о взаимодействии (data sparsity), особенно в контексте Access Restricted Documents (документов с ограниченным доступом), таких как электронные письма или личные файлы. Традиционные методы ранжирования, основанные на CTR для конкретной пары (Запрос, Документ), неэффективны в персональном поиске, так как конкретный личный документ пользователя мог никогда ранее не появляться в выдаче и не получать кликов. Изобретение позволяет оценить релевантность документа, даже если прямые данные о взаимодействии с ним отсутствуют.
Запатентована система ранжирования, которая переносит анализ взаимодействий с уровня (Запрос, Документ) на уровень (Признак Запроса, Признак Документа). Система агрегирует данные о прошлых взаимодействиях множества пользователей с другими (и недоступными текущему пользователю) документами, которые имеют те же признаки, что и оцениваемый документ. Это позволяет использовать коллективный опыт взаимодействия с похожими по структуре или типу документами для ранжирования конкретного личного документа пользователя.
Система работает в два этапа:
Query Features и Document Features). Затем вычисляется Past Interaction Measure (мера прошлого взаимодействия) для пар признаков, показывающая, насколько часто документы с признаком D получали клики по запросам с признаком Q.Query Features и Document Features релевантных документов. Для каждого документа рассчитывается Query Dependent Measure путем агрегации заранее вычисленных Past Interaction Measures. Этот показатель используется как сигнал ранжирования.Высокая для персонального поиска. Эффективный поиск по личным данным (Email, Drive) является критически важным. Описанный механизм, позволяющий использовать агрегированные и анонимизированные данные о поведении пользователей для улучшения качества персональной выдачи, является ключевым компонентом современных систем поиска по личным корпусам данных.
Влияние на традиционное SEO (публичный веб-поиск) минимальное (4/10), так как патент сфокусирован на Access Restricted Documents. Однако он имеет критическое значение для "SEO электронных писем" (Email Marketing). Патент объясняет, как Google ранжирует транзакционные и маркетинговые письма в поиске Gmail. Компании могут использовать эти знания для оптимизации структуры писем (особенно полей From и Subject), чтобы повысить их видимость в персональном поиске получателей.
Category features (категория), Structural features (структурные признаки, например, контент в полях From/Subject, шаблоны, тип файла) и N-gram features.Past Interaction Measures для всех пар признаков, релевантных данному запросу и документу.Past Interaction Measures между признаками запросов и признаками документов. Строится путем трансформации модели Query-Document Model в пространство признаков.Claim 1 (Независимый пункт): Описывает метод ранжирования электронного письма (email) на основе агрегированных данных о взаимодействии.
Document Features для email. Уточняется, что признаки включают контент из полей From и/или Subject.Query Features для запроса.Query Dependent Measure для email на основе мер прошлых взаимодействий между этими признаками в графе.non-accessible documents (т.е. личными документами других пользователей), недоступными текущему пользователю.Query Dependent Measure для определения характеристики представления (ранжирования).Claim 11 (Независимый пункт): Обобщает метод Claim 1 для поиска по personal corpus (личному корпусу), содержащему Access Restricted Documents.
Механизм идентичен: использование взаимодействий на уровне признаков, полученных из недоступных документов других пользователей, для ранжирования документов текущего пользователя.
Claim 14 (Независимый пункт): Описывает более общий метод ранжирования, но использующий тот же принцип.
Система генерирует Query Dependent Measure для документа, основываясь на взаимодействиях с другими документами, которые отличаются от оцениваемого документа и ограничены non-accessible documents, недоступными пользователю.
Изобретение применяется в системах персонального поиска (Gmail, Google Drive) и объединяет офлайн-анализ данных и онлайн-ранжирование.
INDEXING – Индексирование и извлечение признаков
На этом этапе из Access Restricted Documents (например, писем) извлекаются Document Features (структурные, категориальные, N-граммы). Строится Document-Feature Model.
(Офлайн-процессы)
Система анализирует логи прошлых запросов и взаимодействий. Строится Query-Feature Model и Query-Document Model. Основной этап офлайн-обработки – генерация Query Feature - Document Feature Model. Вычисляются и сохраняются Past Interaction Measures для пар признаков.
QUNDERSTANDING – Понимание Запросов (Онлайн)
В реальном времени определяются Query Features входящего запроса.
RANKING – Ранжирование (Онлайн)
Основной этап применения патента в реальном времени. Система извлекает Document Features релевантных документов и использует заранее построенную Query Feature - Document Feature Model для расчета Query Dependent Measure и, опционально, Query Independent Measure. Эти меры используются как ranking signals для определения порядка выдачи.
Входные данные:
Access Restricted Documents).Query Feature - Document Feature Model (содержащая Past Interaction Measures).Выходные данные:
Query Dependent Measure и/или Query Independent Measure для документов.Access Restricted Documents: электронные письма (emails), сообщения чатов, личные файлы, календарные записи, контакты.templates) в контенте.Процесс А: Офлайн-генерация Модели Признаков
Document Features, которые встречаются у порогового количества пользователей или документов.Query Features, которые встречаются в пороговом количестве запросов.Past Interaction Measure для пары (QF, DF). Мера основана на количестве прошлых взаимодействий (например, кликов) с любыми документами, имеющими признак DF, когда они были показаны в ответ на любые запросы, имеющие признак QF. Это включает трансформацию Query-Document Model в пространство признаков.Past Interaction Measure в ассоциации с парой (QF, DF) в Query Feature - Document Feature Model (например, как вес ребра в графе).Процесс Б: Онлайн-ранжирование
Query Features (QF) для запроса и Document Features (DF) для релевантного документа.Query Dependent Measure для документа. Это делается путем агрегации (например, суммирования) всех Past Interaction Measures из Модели Признаков для всех пар (QF, DF), применимых к текущему запросу и документу.Query Independent Measure для документа. Это делается путем агрегации мер взаимодействия для всех DF документа с признаками запросов, не имеющими признаков текущего запроса.Query Dependent Measure и/или Query Independent Measure в качестве сигналов ранжирования. Они могут комбинироваться с базовой оценкой релевантности (например, на основе совпадения ключевых слов) для получения итогового балла.Система использует данные, агрегированные по большому количеству пользователей и их личных документов (non-accessible documents).
templates) в полях или теле документа.clicked to observed fraction), время доступа к документу (document access counts), движения курсора (cursor tracking), сенсорные жесты (touch gestures).Features). Это позволяет обобщать данные о поведении пользователей.Structural Features, такие как поля From, Subject и шаблоны (templates) в электронных письмах. Это указывает на то, что узнаваемая и консистентная структура документа является сильным сигналом полезности.Access Restricted Documents других пользователей (non-accessible documents) для улучшения ранжирования. Это демонстрирует способность Google извлекать глобальные паттерны поведения из частных корпусов данных, соблюдая пороговые значения для анонимизации.Поскольку патент напрямую влияет на ранжирование контента в системах персонального поиска (в частности, Gmail, как указано в Claim 1), рекомендации применимы в первую очередь к Email-маркетингу и транзакционным письмам. Влияния на публичный веб-поиск патент не оказывает.
Structural Features. Если пользователи часто ищут и открывают письма с определенной структурой темы от определенного отправителя, этот паттерн усиливается в модели.Category features также используются в модели. Четкий контент и использование микроразметки (Schema.org for Email) могут способствовать правильной категоризации.Past Interaction Measures для признаков, связанных с вашим брендом и шаблонами.Document Features. Это ослабляет сигналы взаимодействия, связанные с вашими письмами.Past Interaction Measures для этих признаков.Патент имеет низкое стратегическое значение для публичного SEO. Однако он подтверждает важность анализа поведения пользователей на агрегированном уровне и использования этих данных для улучшения качества поиска. Для бизнеса это означает, что пользовательский опыт (User Experience) и полезность контента, отправляемого по email, напрямую влияют на его видимость в персональном поиске. Стратегия должна быть направлена на создание максимально полезных, структурированных и узнаваемых коммуникаций.
Сценарий: Ранжирование подтверждения заказа в Gmail
Document Feature: (From: *@exampleurl.com AND Subject Template: "PURCHASE CONFIRMATION - [#]"). Он также определил Query Feature: (N-gram: "book order"). Система вычислила высокую Past Interaction Measure между этими признаками, так как многие пользователи часто кликали на такие письма по таким запросам.Past Interaction Measure из модели и рассчитывает высокую Query Dependent Measure для письма.Влияет ли этот патент на ранжирование моего сайта в публичном поиске Google?
Напрямую – нет. Патент сфокусирован на ранжировании Access Restricted Documents, то есть на персональном поиске (Gmail, Google Drive). Он решает проблему нехватки данных о кликах для личных документов. Механизмы и сигналы, описанные в патенте, предназначены для работы с частными корпусами данных.
Как этот патент влияет на Email-маркетинг?
Он имеет критическое значение для видимости ваших писем в поиске Gmail. Патент объясняет, что письма ранжируются не только по совпадению ключевых слов, но и на основе того, как миллионы пользователей взаимодействуют с письмами, имеющими схожие структурные признаки (Structural Features) – например, похожую тему или того же отправителя. Оптимизация структуры писем повышает их шансы быть найденными получателями.
Что такое Structural Features (Структурные признаки) в контексте email?
Это признаки, основанные на структуре письма. В патенте явно выделяются контент в поле From (Отправитель), контент в поле Subject (Тема), а также их комбинация. Также к ним относятся шаблоны (templates) – например, система может распознать шаблон "Подтверждение заказа [#]" как отдельный признак.
Что такое Query Dependent Measure?
Это показатель, который оценивает релевантность документа конкретному запросу на основе признаков. Он рассчитывается путем суммирования мер прошлых взаимодействий (Past Interaction Measures) для всех пар (Признак Запроса, Признак Документа), присутствующих в данном запросе и документе. Чем выше эта мера, тем выше будет ранжироваться документ.
Использует ли Google мои личные письма для обучения этой системы?
Да, система обучается на агрегированных и анонимизированных данных из личных документов пользователей. Однако она анализирует взаимодействия с признаками, а не содержание конкретного письма. В патенте указано, что в модель включаются только те признаки, которые встречаются у порогового числа пользователей, что обеспечивает анонимность.
Как можно улучшить ранжирование моих транзакционных писем, исходя из этого патента?
Ключевая рекомендация – консистентность и узнаваемость. Используйте одно и то же имя отправителя (поле From) и стандартизированные, информативные шаблоны для тем писем (поле Subject). Если пользователи положительно взаимодействуют с этими шаблонами (часто ищут и открывают их), система научится высоко ранжировать такие письма по релевантным запросам.
Что такое Query Independent Measure и зачем она нужна?
Это мера общей полезности или популярности признаков документа, независимо от текущего запроса. Например, если письма от определенного отправителя очень часто открываются пользователями при поиске по любым запросам, у этого отправителя (как признака) будет высокая Query Independent Measure. Это помогает продвигать в выдаче документы с "полезными" признаками.
Как система определяет признаки (Features) документа?
Система извлекает несколько типов признаков. Это могут быть структурные признаки (поля From/Subject, шаблоны), категориальные признаки (определенные с помощью классификаторов, например, "Путешествия" или "Финансы") и контентные признаки (N-граммы из текста документа).
Почему этот механизм необходим, если можно просто искать по ключевым словам?
Поиск только по ключевым словам часто дает неоптимальные результаты в персональном поиске. Например (как показано в патенте), письмо с подтверждением заказа может не содержать слов из запроса в теме, но быть самым релевантным результатом. Описанный механизм позволяет системе понять семантическую связь между запросом и документом через агрегированные данные о поведении пользователей.
Может ли этот механизм использоваться для ранжирования документов с небольшим количеством кликов в публичном веб-поиске?
Теоретически, метод обобщения взаимодействий через признаки может быть полезен для ранжирования публичных документов (решение проблемы "холодного старта"). Однако в данном патенте фокус сделан на Access Restricted Documents и использовании данных из недоступных корпусов (non-accessible documents). Применение к публичному вебу в патенте не является основным объектом изобретения.

Поведенческие сигналы

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Поведенческие сигналы
SERP

Поведенческие сигналы
Персонализация
Семантика и интент

Персонализация
Поведенческие сигналы
Свежесть контента

Local SEO
SERP
Ссылки

SERP
EEAT и качество
Поведенческие сигналы

Семантика и интент
Поведенческие сигналы
Knowledge Graph

Семантика и интент
Поведенческие сигналы
Персонализация

SERP
Семантика и интент
Ссылки

Персонализация
Поведенческие сигналы
Антиспам

Семантика и интент
Поведенческие сигналы
EEAT и качество

Поведенческие сигналы
Персонализация
Семантика и интент

Семантика и интент
Поведенческие сигналы

Индексация
SERP
Персонализация
