SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков

RANKING SEARCH RESULTS DOCUMENTS (Ранжирование документов в результатах поиска)
  • US10394832B2
  • Google LLC
  • 2016-10-24
  • 2019-08-27
  • Поведенческие сигналы
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.

Описание

Какую проблему решает

Патент решает проблему ранжирования документов в условиях крайней разреженности данных о взаимодействии (data sparsity), особенно в контексте Access Restricted Documents (документов с ограниченным доступом), таких как электронные письма или личные файлы. Традиционные методы ранжирования, основанные на CTR для конкретной пары (Запрос, Документ), неэффективны в персональном поиске, так как конкретный личный документ пользователя мог никогда ранее не появляться в выдаче и не получать кликов. Изобретение позволяет оценить релевантность документа, даже если прямые данные о взаимодействии с ним отсутствуют.

Что запатентовано

Запатентована система ранжирования, которая переносит анализ взаимодействий с уровня (Запрос, Документ) на уровень (Признак Запроса, Признак Документа). Система агрегирует данные о прошлых взаимодействиях множества пользователей с другими (и недоступными текущему пользователю) документами, которые имеют те же признаки, что и оцениваемый документ. Это позволяет использовать коллективный опыт взаимодействия с похожими по структуре или типу документами для ранжирования конкретного личного документа пользователя.

Как это работает

Система работает в два этапа:

  • Офлайн-обработка: Система анализирует логи взаимодействий в персональном поиске (например, Gmail) по всем пользователям. Она строит модели, связывающие запросы и документы с их признаками (Query Features и Document Features). Затем вычисляется Past Interaction Measure (мера прошлого взаимодействия) для пар признаков, показывающая, насколько часто документы с признаком D получали клики по запросам с признаком Q.
  • Онлайн-ранжирование: Когда пользователь вводит запрос, система определяет его Query Features и Document Features релевантных документов. Для каждого документа рассчитывается Query Dependent Measure путем агрегации заранее вычисленных Past Interaction Measures. Этот показатель используется как сигнал ранжирования.

Актуальность для SEO

Высокая для персонального поиска. Эффективный поиск по личным данным (Email, Drive) является критически важным. Описанный механизм, позволяющий использовать агрегированные и анонимизированные данные о поведении пользователей для улучшения качества персональной выдачи, является ключевым компонентом современных систем поиска по личным корпусам данных.

Важность для SEO

Влияние на традиционное SEO (публичный веб-поиск) минимальное (4/10), так как патент сфокусирован на Access Restricted Documents. Однако он имеет критическое значение для "SEO электронных писем" (Email Marketing). Патент объясняет, как Google ранжирует транзакционные и маркетинговые письма в поиске Gmail. Компании могут использовать эти знания для оптимизации структуры писем (особенно полей From и Subject), чтобы повысить их видимость в персональном поиске получателей.

Детальный разбор

Термины и определения

Access Restricted Document (Документ с ограниченным доступом)
Электронный документ, доступный ограниченной группе пользователей (например, электронное письмо, личный файл). Противопоставляется публично доступным документам.
Document Features (Признаки документа)
Характеристики документа. Включают Category features (категория), Structural features (структурные признаки, например, контент в полях From/Subject, шаблоны, тип файла) и N-gram features.
Document-Feature Model (Модель Документ-Признак)
Двудольный граф, моделирующий отношения между документами и их признаками.
Non-accessible documents (Недоступные документы)
Документы других пользователей, которые недоступны текущему пользователю. Используются как источник данных для генерации обобщенных мер взаимодействия.
Past Interaction Measure (Мера прошлого взаимодействия)
Показатель, связанный с парой (Признак Запроса, Признак Документа). Отражает частоту взаимодействий (например, кликов) с документами, обладающими данным признаком, когда они были показаны в ответ на запросы, обладающие соответствующим признаком запроса.
Query Dependent Measure (Запросозависимая мера)
Показатель для конкретного документа в ответ на конкретный запрос. Вычисляется путем агрегации Past Interaction Measures для всех пар признаков, релевантных данному запросу и документу.
Query Features (Признаки запроса)
Характеристики запроса. Включают N-граммы, сущности (Entities), категории сущностей, грамматические признаки.
Query Feature - Document Feature Model (Модель Признак Запроса - Признак Документа)
Ключевая модель патента. Двудольный граф, хранящий Past Interaction Measures между признаками запросов и признаками документов. Строится путем трансформации модели Query-Document Model в пространство признаков.
Query Independent Measure (Запросонезависимая мера)
Показатель для документа, отражающий общую популярность или полезность его признаков, независимо от текущего запроса (на основе взаимодействий с запросами, не имеющими признаков текущего запроса).
Query-Document Model (Модель Запрос-Документ)
Двудольный граф, моделирующий прямые взаимодействия (клики, показы) между конкретными запросами и конкретными документами на основе логов поиска.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает метод ранжирования электронного письма (email) на основе агрегированных данных о взаимодействии.

  1. Генерация графа (Модели Признак Запроса - Признак Документа).
  2. Получение запроса от пользователя.
  3. Идентификация релевантных документов (включая email).
  4. Идентификация Document Features для email. Уточняется, что признаки включают контент из полей From и/или Subject.
  5. Идентификация Query Features для запроса.
  6. Генерация Query Dependent Measure для email на основе мер прошлых взаимодействий между этими признаками в графе.
  7. Ключевое условие: Меры основаны на взаимодействиях соответствующих пользователей с другими документами, имеющими эти признаки. При этом эти другие документы ограничены non-accessible documents (т.е. личными документами других пользователей), недоступными текущему пользователю.
  8. Использование Query Dependent Measure для определения характеристики представления (ранжирования).

Claim 11 (Независимый пункт): Обобщает метод Claim 1 для поиска по personal corpus (личному корпусу), содержащему Access Restricted Documents.

Механизм идентичен: использование взаимодействий на уровне признаков, полученных из недоступных документов других пользователей, для ранжирования документов текущего пользователя.

Claim 14 (Независимый пункт): Описывает более общий метод ранжирования, но использующий тот же принцип.

Система генерирует Query Dependent Measure для документа, основываясь на взаимодействиях с другими документами, которые отличаются от оцениваемого документа и ограничены non-accessible documents, недоступными пользователю.

Где и как применяется

Изобретение применяется в системах персонального поиска (Gmail, Google Drive) и объединяет офлайн-анализ данных и онлайн-ранжирование.

INDEXING – Индексирование и извлечение признаков
На этом этапе из Access Restricted Documents (например, писем) извлекаются Document Features (структурные, категориальные, N-граммы). Строится Document-Feature Model.

(Офлайн-процессы)
Система анализирует логи прошлых запросов и взаимодействий. Строится Query-Feature Model и Query-Document Model. Основной этап офлайн-обработки – генерация Query Feature - Document Feature Model. Вычисляются и сохраняются Past Interaction Measures для пар признаков.

QUNDERSTANDING – Понимание Запросов (Онлайн)
В реальном времени определяются Query Features входящего запроса.

RANKING – Ранжирование (Онлайн)
Основной этап применения патента в реальном времени. Система извлекает Document Features релевантных документов и использует заранее построенную Query Feature - Document Feature Model для расчета Query Dependent Measure и, опционально, Query Independent Measure. Эти меры используются как ranking signals для определения порядка выдачи.

Входные данные:

  • Запрос пользователя.
  • Релевантные документы (Access Restricted Documents).
  • Query Feature - Document Feature Model (содержащая Past Interaction Measures).

Выходные данные:

  • Query Dependent Measure и/или Query Independent Measure для документов.
  • Итоговый рейтинг документов.

На что влияет

  • Конкретные типы контента: Наибольшее влияние оказывается на Access Restricted Documents: электронные письма (emails), сообщения чатов, личные файлы, календарные записи, контакты.
  • Структурные факторы: Алгоритм сильно зависит от структурных признаков документов, таких как поля From и Subject в электронных письмах, а также от использования узнаваемых шаблонов (templates) в контенте.

Когда применяется

  • Условия работы: Алгоритм применяется при поиске по персональному корпусу данных (Personal Search).
  • Триггеры активации: Активируется для ранжирования документов, для которых недостаточно или отсутствуют прямые данные о взаимодействии (кликах) по конкретному запросу. Он используется как дополнительный сигнал ранжирования.
  • Ограничения (Пороги): Признаки (запроса или документа) включаются в модель, только если они встречаются пороговое количество раз или у порогового количества пользователей, что обеспечивает анонимность и статистическую значимость.

Пошаговый алгоритм

Процесс А: Офлайн-генерация Модели Признаков

  1. Выбор признаков документа: Идентификация и отбор Document Features, которые встречаются у порогового количества пользователей или документов.
  2. Выбор признаков запроса: Идентификация и отбор Query Features, которые встречаются в пороговом количестве запросов.
  3. Инициализация итерации по парам: Выбор пары (Признак Запроса QF, Признак Документа DF).
  4. Генерация меры взаимодействия: Расчет Past Interaction Measure для пары (QF, DF). Мера основана на количестве прошлых взаимодействий (например, кликов) с любыми документами, имеющими признак DF, когда они были показаны в ответ на любые запросы, имеющие признак QF. Это включает трансформацию Query-Document Model в пространство признаков.
  5. Сохранение меры: Сохранение Past Interaction Measure в ассоциации с парой (QF, DF) в Query Feature - Document Feature Model (например, как вес ребра в графе).
  6. Завершение итераций: Повторение шагов 3-5 для всех выбранных пар признаков.

Процесс Б: Онлайн-ранжирование

  1. Получение запроса: Система получает запрос от пользователя.
  2. Идентификация релевантных документов: Поиск документов в личном корпусе, соответствующих запросу.
  3. Извлечение признаков: Идентификация Query Features (QF) для запроса и Document Features (DF) для релевантного документа.
  4. Генерация запросозависимой меры: Расчет Query Dependent Measure для документа. Это делается путем агрегации (например, суммирования) всех Past Interaction Measures из Модели Признаков для всех пар (QF, DF), применимых к текущему запросу и документу.
  5. Генерация запросонезависимой меры (Опционально): Расчет Query Independent Measure для документа. Это делается путем агрегации мер взаимодействия для всех DF документа с признаками запросов, не имеющими признаков текущего запроса.
  6. Ранжирование: Использование Query Dependent Measure и/или Query Independent Measure в качестве сигналов ранжирования. Они могут комбинироваться с базовой оценкой релевантности (например, на основе совпадения ключевых слов) для получения итогового балла.
  7. Предоставление результатов: Формирование поисковой выдачи на основе итогового ранжирования.

Какие данные и как использует

Данные на входе

Система использует данные, агрегированные по большому количеству пользователей и их личных документов (non-accessible documents).

  • Структурные факторы: Критически важные данные. Используются признаки, основанные на структуре документов. Для email это: контент поля From (например, домен отправителя), контент поля Subject, а также ко-встречаемость контента в этих полях. Также используются шаблоны (templates) в полях или теле документа.
  • Контентные факторы: N-граммы из тела документа или его полей.
  • Поведенческие факторы (Агрегированные): Логи прошлых взаимодействий пользователей с результатами поиска. Учитываются показы (observations) и взаимодействия (interactions/clicks). Взаимодействия могут включать клики (clicked to observed fraction), время доступа к документу (document access counts), движения курсора (cursor tracking), сенсорные жесты (touch gestures).
  • Системные/Метаданные: Категории документов (например, Финансы, Путешествия, Подтверждения заказов), типы файлов.

Какие метрики используются и как они считаются

  • Past Interaction Measure: Мера взаимодействия между признаком запроса и признаком документа. В патенте приводится формула для расчета веса ребра

Выводы

  1. Ранжирование в условиях разреженности данных: Патент предлагает конкретный механизм для преодоления data sparsity в персональном поиске. Если данных о кликах по документу нет, система опирается на коллективный опыт взаимодействия с похожими документами.
  2. Переход от Документов к Признакам (Feature Generalization): Ключевая идея — абстрагирование от конкретных документов и запросов к их признакам (Features). Это позволяет обобщать данные о поведении пользователей.
  3. Важность структурных признаков: Патент особо выделяет Structural Features, такие как поля From, Subject и шаблоны (templates) в электронных письмах. Это указывает на то, что узнаваемая и консистентная структура документа является сильным сигналом полезности.
  4. Использование агрегированных личных данных: Система явно использует данные из Access Restricted Documents других пользователей (non-accessible documents) для улучшения ранжирования. Это демонстрирует способность Google извлекать глобальные паттерны поведения из частных корпусов данных, соблюдая пороговые значения для анонимизации.
  5. Фокус на персональном поиске: Описанные механизмы и сигналы специфичны для среды персонального поиска и не влияют напрямую на ранжирование в публичном веб-поиске Google.

Практика

Best practices (это мы делаем)

Поскольку патент напрямую влияет на ранжирование контента в системах персонального поиска (в частности, Gmail, как указано в Claim 1), рекомендации применимы в первую очередь к Email-маркетингу и транзакционным письмам. Влияния на публичный веб-поиск патент не оказывает.

  • Оптимизация полей From и Subject: Используйте консистентные, узнаваемые и информативные поля From (Имя отправителя) и Subject (Тема письма). Эти поля являются ключевыми Structural Features. Если пользователи часто ищут и открывают письма с определенной структурой темы от определенного отправителя, этот паттерн усиливается в модели.
  • Использование четких шаблонов (Templates): Применяйте консистентные шаблоны для транзакционных писем (подтверждения заказов, уведомления о доставке). Система идентифицирует эти шаблоны как признаки. Четкий шаблон повышает вероятность того, что письмо будет высоко ранжироваться по релевантным запросам (например, "номер заказа").
  • Сегментация и категоризация писем: Помогайте Google правильно классифицировать ваши письма. Category features также используются в модели. Четкий контент и использование микроразметки (Schema.org for Email) могут способствовать правильной категоризации.
  • Стимулирование положительного взаимодействия: Создавайте полезный контент, который пользователи захотят найти снова. Высокий уровень взаимодействия (клики в поиске Gmail) с вашими письмами улучшает Past Interaction Measures для признаков, связанных с вашим брендом и шаблонами.

Worst practices (это делать не надо)

  • Частая смена имени отправителя или структуры темы: Если вы постоянно меняете формат поля From или структуру тем для однотипных уведомлений, системе сложнее идентифицировать консистентные Document Features. Это ослабляет сигналы взаимодействия, связанные с вашими письмами.
  • Неинформативные или "спамные" темы писем: Использование тем, которые не отражают содержание или выглядят как спам, приведет к низкому уровню взаимодействия. Это негативно скажется на Past Interaction Measures для этих признаков.
  • Игнорирование структуры документа: Отправка неструктурированного контента затрудняет извлечение полезных признаков и снижает эффективность описанного механизма ранжирования.

Стратегическое значение

Патент имеет низкое стратегическое значение для публичного SEO. Однако он подтверждает важность анализа поведения пользователей на агрегированном уровне и использования этих данных для улучшения качества поиска. Для бизнеса это означает, что пользовательский опыт (User Experience) и полезность контента, отправляемого по email, напрямую влияют на его видимость в персональном поиске. Стратегия должна быть направлена на создание максимально полезных, структурированных и узнаваемых коммуникаций.

Практические примеры

Сценарий: Ранжирование подтверждения заказа в Gmail

  1. Ситуация: Пользователь ищет в Gmail номер своего заказа, вводя запрос "book order number". У него есть письмо от "Store@ExampleURL.com" с темой "PURCHASE CONFIRMATION - A15FFX" (Пример 353C в патенте).
  2. Проблема традиционного ранжирования: В теме письма нет слов "book" или "number". Традиционный поиск по ключевым словам может ранжировать это письмо ниже других писем, где эти слова есть в теме (например, письмо 185B на FIG. 6).
  3. Применение патента (Офлайн): Google проанализировал миллиарды писем. Он определил Document Feature: (From: *@exampleurl.com AND Subject Template: "PURCHASE CONFIRMATION - [#]"). Он также определил Query Feature: (N-gram: "book order"). Система вычислила высокую Past Interaction Measure между этими признаками, так как многие пользователи часто кликали на такие письма по таким запросам.
  4. Применение патента (Онлайн): Система идентифицирует признаки в запросе пользователя и в его письме. Она извлекает высокую Past Interaction Measure из модели и рассчитывает высокую Query Dependent Measure для письма.
  5. Результат: Письмо "PURCHASE CONFIRMATION - A15FFX" получает значительное повышение в ранжировании и показывается на первой позиции (Пример 185A на FIG. 6 в патенте), несмотря на слабое совпадение ключевых слов в теме.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего сайта в публичном поиске Google?

Напрямую – нет. Патент сфокусирован на ранжировании Access Restricted Documents, то есть на персональном поиске (Gmail, Google Drive). Он решает проблему нехватки данных о кликах для личных документов. Механизмы и сигналы, описанные в патенте, предназначены для работы с частными корпусами данных.

Как этот патент влияет на Email-маркетинг?

Он имеет критическое значение для видимости ваших писем в поиске Gmail. Патент объясняет, что письма ранжируются не только по совпадению ключевых слов, но и на основе того, как миллионы пользователей взаимодействуют с письмами, имеющими схожие структурные признаки (Structural Features) – например, похожую тему или того же отправителя. Оптимизация структуры писем повышает их шансы быть найденными получателями.

Что такое Structural Features (Структурные признаки) в контексте email?

Это признаки, основанные на структуре письма. В патенте явно выделяются контент в поле From (Отправитель), контент в поле Subject (Тема), а также их комбинация. Также к ним относятся шаблоны (templates) – например, система может распознать шаблон "Подтверждение заказа [#]" как отдельный признак.

Что такое Query Dependent Measure?

Это показатель, который оценивает релевантность документа конкретному запросу на основе признаков. Он рассчитывается путем суммирования мер прошлых взаимодействий (Past Interaction Measures) для всех пар (Признак Запроса, Признак Документа), присутствующих в данном запросе и документе. Чем выше эта мера, тем выше будет ранжироваться документ.

Использует ли Google мои личные письма для обучения этой системы?

Да, система обучается на агрегированных и анонимизированных данных из личных документов пользователей. Однако она анализирует взаимодействия с признаками, а не содержание конкретного письма. В патенте указано, что в модель включаются только те признаки, которые встречаются у порогового числа пользователей, что обеспечивает анонимность.

Как можно улучшить ранжирование моих транзакционных писем, исходя из этого патента?

Ключевая рекомендация – консистентность и узнаваемость. Используйте одно и то же имя отправителя (поле From) и стандартизированные, информативные шаблоны для тем писем (поле Subject). Если пользователи положительно взаимодействуют с этими шаблонами (часто ищут и открывают их), система научится высоко ранжировать такие письма по релевантным запросам.

Что такое Query Independent Measure и зачем она нужна?

Это мера общей полезности или популярности признаков документа, независимо от текущего запроса. Например, если письма от определенного отправителя очень часто открываются пользователями при поиске по любым запросам, у этого отправителя (как признака) будет высокая Query Independent Measure. Это помогает продвигать в выдаче документы с "полезными" признаками.

Как система определяет признаки (Features) документа?

Система извлекает несколько типов признаков. Это могут быть структурные признаки (поля From/Subject, шаблоны), категориальные признаки (определенные с помощью классификаторов, например, "Путешествия" или "Финансы") и контентные признаки (N-граммы из текста документа).

Почему этот механизм необходим, если можно просто искать по ключевым словам?

Поиск только по ключевым словам часто дает неоптимальные результаты в персональном поиске. Например (как показано в патенте), письмо с подтверждением заказа может не содержать слов из запроса в теме, но быть самым релевантным результатом. Описанный механизм позволяет системе понять семантическую связь между запросом и документом через агрегированные данные о поведении пользователей.

Может ли этот механизм использоваться для ранжирования документов с небольшим количеством кликов в публичном веб-поиске?

Теоретически, метод обобщения взаимодействий через признаки может быть полезен для ранжирования публичных документов (решение проблемы "холодного старта"). Однако в данном патенте фокус сделан на Access Restricted Documents и использовании данных из недоступных корпусов (non-accessible documents). Применение к публичному вебу в патенте не является основным объектом изобретения.

Похожие патенты

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует атрибуты пользователей и показатели предвзятости (Bias Measures) для персонализации ранжирования
Google анализирует, как разные группы пользователей (сегментированные по атрибутам, таким как интересы или демография) взаимодействуют с документами. Система вычисляет «показатель предвзятости» (Bias Measure), который показывает, насколько чаще или реже определенная группа взаимодействует с документом по сравнению с общей массой пользователей. При поиске Google определяет атрибуты пользователя и корректирует ранжирование, повышая или понижая документы на основе этих показателей предвзятости.
  • US9436742B1
  • 2016-09-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google персонализирует рекомендации популярных запросов на основе истории поиска и браузинга пользователя
Google анализирует глобальные тренды поисковых запросов и сопоставляет их с индивидуальной историей пользователя (посещенные сайты, прошлые запросы, категории интересов). Если популярный запрос соответствует выявленным интересам пользователя, он будет рекомендован. Система также применяет фильтры, исключающие запросы, которые пользователь вводил недавно.
  • US9443022B2
  • 2016-09-13
  • Персонализация

  • Поведенческие сигналы

  • Свежесть контента

Популярные патенты

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче
Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.
  • US9418156B2
  • 2016-08-16
  • Local SEO

  • SERP

  • Ссылки

Как Google обучает ИИ-модели для автоматической оценки качества сайтов на основе данных асессоров и предвзятой выборки
Патент Google, описывающий фундаментальную методологию создания систем оценки качества сайтов. Google использует машинное обучение (например, SVM), чтобы найти корреляции между оценками асессоров и измеримыми сигналами сайта (PageRank, клики). Для повышения точности применяется метод «предвзятой выборки» (Biased Sampling): система намеренно собирает больше оценок для сайтов среднего качества («сложных случаев»), чем для очевидно плохих или хороших.
  • US8442984B1
  • 2013-05-14
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует структурированные данные (Schema) для отслеживания вовлеченности пользователей на уровне сущностей, а не только URL
Google может отслеживать поведение пользователей (например, время пребывания на странице и клики) и связывать его с конкретными сущностями (продуктами, людьми, темами), идентифицированными через структурированные данные, а не только с URL-адресом. Это позволяет агрегировать метрики вовлеченности для определенной темы на разных страницах и сравнивать эффективность сайтов.
  • US20140280133A1
  • 2014-09-18
  • Семантика и интент

  • Поведенческие сигналы

  • Knowledge Graph

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google использует блокировку сайтов пользователями для персонализации выдачи и как глобальный сигнал ранжирования (Remove List Score)
Google позволяет пользователям удалять нежелательные документы или целые сайты из своей поисковой выдачи. Система агрегирует эти данные о блокировках от множества пользователей и использует их как глобальный сигнал ранжирования — «Remove List Score» — для выявления низкокачественного контента и улучшения качества поиска для всех.
  • US8417697B2
  • 2013-04-09
  • Персонализация

  • Поведенческие сигналы

  • Антиспам

Как Google использует историю уточнений запросов для выявления и повышения авторитетных сайтов по широким запросам
Google анализирует последовательности запросов пользователей, чтобы понять, как они уточняют свои поисковые намерения. Если пользователи часто переходят от широкого или неточного запроса к более конкретному, который ведет на авторитетный ресурс, Google связывает этот ресурс с исходным широким запросом. Это позволяет показывать авторитетный сайт выше в выдаче, даже если пользователь сформулировал запрос неточно.
  • US8326826B1
  • 2012-12-04
  • Семантика и интент

  • Поведенческие сигналы

  • EEAT и качество

Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска
Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.
  • US8131754B1
  • 2012-03-06
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google использует поведение пользователей для определения синонимичности фраз в запросах, связанных с сущностями
Google анализирует поведение пользователей (клики по результатам поиска), чтобы определить, означают ли разные фразы одно и то же, когда они связаны с одним типом сущности (например, «достопримечательности в <Город>» против «места для посещения в <Город>»). Если пользователи кликают на одни и те же документы для разных фраз, система считает эти фразы эквивалентными, что помогает Google понимать синонимы и улучшать результаты поиска.
  • US10073882B1
  • 2018-09-11
  • Семантика и интент

  • Поведенческие сигналы

Как Google индексирует контент внутри мобильных приложений для показа в результатах поиска (App Indexing)
Google использует механизм для индексации контента, который пользователи просматривают в нативных мобильных приложениях. Система получает данные о просмотренном контенте и deep links напрямую от приложения на устройстве. Эта информация сохраняется в индексе (персональном или публичном) и используется для генерации результатов поиска, позволяя пользователям переходить к контенту внутри приложений напрямую из поисковой выдачи.
  • US10120949B2
  • 2018-11-06
  • Индексация

  • SERP

  • Персонализация

seohardcore