Как Google связывает документы на основе поведения пользователей, времени взаимодействия и контентной близости для персонализации поиска

SYSTEMS AND METHODS FOR DETERMINING AN ARTICLE ASSOCIATION MEASURE (Системы и методы определения меры ассоциации статей)

US8131754B1
Google LLC
2004-06-30
2012-03-06

Google использует систему для определения "меры ассоциации" между различными документами (статьями, веб-страницами, письмами). Ассоциация рассчитывается на основе того, насколько близко по времени пользователь взаимодействовал с этими документами, насколько похож их контент и совпадают ли метаданные (например, автор). Эти связи используются для понимания пути пользователя и персонализации последующих результатов поиска.

Какую проблему решает

Патент решает проблему извлечения и ранжирования информации, которая ментально связана для пользователя, но не обязательно связана явными ссылками или общей тематикой в традиционном понимании. Система стремится смоделировать неявные ассоциации, которые возникают у пользователя при взаимодействии с контентом (например, если пользователь распечатал два документа подряд). Цель — улучшить информационный поиск, позволяя системе находить и ранжировать контент на основе этих поведенческих и контекстуальных связей (время, контент, источник).

Что запатентовано

Запатентована система для вычисления Association Measure (меры ассоциации или показателя схожести) между двумя идентификаторами статей (Article Identifiers). Эта мера основывается на атрибутах (Attributes) статей или событий (Events), связанных с взаимодействием пользователя с этими статьями. Ключевые атрибуты включают время доступа (Association in Time), схожесть контента (Association in Content) и общие метаданные (Association in Metadata). Система фиксирует пользовательские взаимодействия как события и использует их для построения графа связанных документов.

Как это работает

Система работает путем непрерывного мониторинга и фиксации взаимодействий пользователя с контентом, регистрируя их как Events. Для пар статей система вычисляет Association Measure:

Ассоциация по времени: Если события, связанные с двумя статьями (например, просмотр или печать), происходят близко по времени, их ассоциация усиливается. Чем меньше разница во времени, тем выше показатель.
Ассоциация по контенту: Анализируется схожесть текста двух статей.
Ассоциация по метаданным: Проверяется совпадение авторов, организаций, получателей писем и т.д.

Эти отдельные показатели могут быть объединены с использованием весовых коэффициентов (w1, w2, w3) для получения общей меры ассоциации. В дальнейшем, при выполнении поиска, система может извлекать не только результаты, релевантные запросу, но и статьи, которые имеют высокую Association Measure с этими результатами.

Актуальность для SEO

Средняя/Высокая. Патент подан в 2004 году, и архитектура, описанная в примерах, относится к клиентскому поиску (например, Google Desktop Search). Однако базовые принципы — использование временной близости взаимодействий (co-visitation), поведенческих сигналов и контекста сессии для связывания контента — являются фундаментальными для современных систем персонализации, понимания пути пользователя (User Journey) и контекстного поиска Google. Упоминание корректировки весов на основе user interest measures (например, clickthrough) подтверждает актуальность для поведенческого анализа в SEO.

Важность для SEO

Патент имеет высокое значение для понимания того, как Google может анализировать поведение пользователей для персонализации выдачи и понимания связей между контентом. Хотя он не описывает прямой алгоритм ранжирования глобального веб-поиска, он раскрывает механизм построения поведенческого графа контента. Это критически важно для стратегий, направленных на оптимизацию пути пользователя, улучшение поведенческих факторов и понимание того, как взаимодействие с одним типом контента может повлиять на ранжирование другого.

Термины и определения

Article (Статья): Любая единица контента: веб-страница, документ (Word, PDF), электронное письмо, сообщение в мессенджере, аудио- или видеофайл.
Article Identifier (Идентификатор статьи): Уникальный идентификатор контента, например, URL, имя файла, путь к локальному файлу или иконка.
Association Measure (Мера ассоциации): Числовой показатель (также называемый association score или similarity measure), определяющий степень связанности или схожести между двумя статьями. Рассчитывается на основе атрибутов статей или связанных с ними событий.
Attributes (Атрибуты): Характеристики статьи или события. Включают время (создания, просмотра, редактирования), контент (текст) и метаданные/источник (автор, организация, получатель).
Event (Событие): Зафиксированное взаимодействие пользователя со статьей. Например, просмотр, печать, отправка, сохранение, добавление в закладки.
Association in Time (Ассоциация по времени): Метод расчета ассоциации, основанный на временной близости событий, связанных с двумя статьями. Меньшая разница во времени обычно дает более высокий балл.
Association in Content (Ассоциация по контенту): Метод расчета ассоциации, основанный на схожести содержания (текста) двух статей.
Association in Metadata (Ассоциация по метаданным): Метод расчета ассоциации, основанный на совпадении метаданных (автор, источник, получатель).
Combined Association Measure (Комбинированная мера ассоциации): Общий показатель ассоциации, полученный путем взвешенного суммирования различных типов мер ассоциации (время, контент, метаданные).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает базовый метод определения меры ассоциации, основанный строго на времени взаимодействия.

Система фиксирует множество событий (Events), которые являются взаимодействиями пользователя со статьями на клиентском устройстве, причем события генерируются разными приложениями.
Получается первый идентификатор статьи (Article 1) с атрибутом даты/времени (Time 1), связанным с первым событием.
Получается второй идентификатор статьи (Article 2) с атрибутом даты/времени (Time 2), связанным со вторым событием.
Определяется мера ассоциации (Association Measure) между Article 1 и Article 2 на основе Time 1 и Time 2.
Механизм определения: Рассчитывается разница между Time 1 и Time 2. Разница сравнивается с порогом (Threshold). Если разница превышает порог, мера ассоциации устанавливается равной первому значению. Если не превышает — второму значению.

Claim 6 (Зависимый): Расширяет Claim 1, добавляя учет контента. Мера ассоциации определяется также на основе первого атрибута контента (Content 1) и второго атрибута контента (Content 2).

Claim 7 (Зависимый): Расширяет Claim 1, добавляя учет метаданных. Мера ассоциации определяется также на основе первого атрибута метаданных (Metadata 1) и второго атрибута метаданных (Metadata 2). (Claims 11 и 12 уточняют, что метаданные могут включать автора или организацию).

Claim 10 (Зависимый): Описывает применение меры ассоциации в поиске (Associative Retrieval).

Система получает запрос.
Получает результаты поиска, которые включают первую статью (Article 1), но не включают вторую (Article 2).
Идентифицирует вторую статью (Article 2) как связанную с первой (Article 1) на основе меры ассоциации.
Отображает вторую статью вместе с полученными результатами поиска.

Claim 13 (Зависимый от 3): Описывает механизм комбинирования нескольких мер ассоциации.

Несколько мер ассоциации объединяются для создания комбинированной меры (Combined Association Measure).
Объединение происходит путем взвешивания каждой меры ассоциации в соответствии с весом, соответствующим типу этой ассоциации (например, вес для времени, вес для контента).

Где и как применяется

Изобретение затрагивает несколько этапов поиска, в основном связанных с индексированием поведения пользователя и персонализацией результатов.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна фиксировать пользовательские взаимодействия (Events) и извлекать атрибуты (время, контент, метаданные) из соответствующих статей. Вычисление Association Measure может происходить как на этапе индексирования (например, расчет схожести контента), так и на этапе выполнения запроса (например, расчет временной близости).

QUNDERSTANDING – Понимание Запросов
Система может использовать текущий контекст пользователя (недавние события) для генерации неявного запроса (implicit query). Понимание ассоциаций между статьями помогает лучше интерпретировать контекст сессии.

RANKING – Ранжирование / RERANKING – Переранжирование
Основное применение патента. Association Measure используется для извлечения и ранжирования связанных статей.

Associative Retrieval: В ответ на запрос система извлекает не только прямые результаты, но и статьи, ассоциированные с этими результатами (или ассоциированные с недавним контекстом пользователя).
Персонализация: Ранжирование может корректироваться на основе того, какие статьи пользователь недавно просматривал или с какими взаимодействовал, используя Association Measure для определения релевантности в текущем контексте.
Корректировка весов: Патент упоминает, что веса для комбинирования мер ассоциации (w1, w2, w3) могут корректироваться на основе user interest measures, таких как clickthrough. Это происходит на этапе ранжирования или переранжирования.

Входные данные:

Идентификаторы статей (Article Identifiers).
События взаимодействия пользователя (Events).
Атрибуты событий и статей (время, контент, метаданные).
(Опционально) Данные о поведении пользователей (clickthrough) для корректировки весов.

Выходные данные:

Association Measure между парами статей.
Ранжированный список связанных статей или событий в ответ на запрос.

На что влияет

Персонализация поиска: Наибольшее влияние оказывается на персонализированные результаты поиска, где система пытается предсказать потребности пользователя на основе его предыдущих действий.
Понимание сессии и пути пользователя (User Journey): Влияет на то, как система интерпретирует последовательность запросов и взаимодействий в рамках одной сессии.
Различные типы контента: Влияет на связывание разнородного контента (веб-страницы, документы, письма), если система имеет доступ к этим данным (например, через Chrome, Android, Gmail).

Когда применяется

Триггеры активации: Механизм ассоциативного поиска может активироваться при выполнении явного запроса пользователем или при генерации неявного запроса на основе текущего контекста (например, при просмотре статьи система ищет связанные с ней материалы).
Условия работы: Когда система имеет достаточно данных о событиях взаимодействия пользователя для расчета значимых Association Measures.
Временная близость: Ассоциация по времени активируется, когда разница во времени между двумя событиями не превышает определенного порога (maximum time difference threshold), например, одного часа.

Пошаговый алгоритм

Процесс А: Вычисление меры ассоциации (Может выполняться при индексировании или во время запроса)

Получение пары статей: Система выбирает первую и вторую статью (или связанные с ними события).
Извлечение атрибутов: Для каждой статьи/события извлекаются релевантные атрибуты (Время 1/Время 2, Контент 1/Контент 2, Метаданные 1/Метаданные 2).
Расчет ассоциации по времени:
1. Вычисляется разница во времени между событиями.
2. Разница сравнивается с порогом.
3. Рассчитывается показатель Association in Time (например, с использованием линейной, пороговой или экспоненциальной функции, где меньшая разница дает больший балл).
Расчет ассоциации по контенту: Вычисляется показатель схожести содержания (Association in Content).
Расчет ассоциации по метаданным: Вычисляется показатель совпадения метаданных (Association in Metadata).
Комбинирование показателей: Отдельные показатели объединяются с использованием весов (w1, w2, w3) для получения Combined Association Measure. Формула: $Overall = w1*Time + w2*Content + w3*Metadata$ .
Корректировка весов (Периодически): Веса w1, w2, w3 корректируются на основе пользовательского интереса (например, если пользователи часто кликают на результаты, предложенные из-за временной близости, вес w1 увеличивается).
Хранение: Association Measure сохраняется.

Процесс Б: Ассоциативный поиск (Во время запроса)

Получение запроса: Система получает явный или неявный запрос.
Первичный поиск: Выполняется поиск для получения начального набора результатов (статей или событий).
Поиск связанных элементов: Для каждого результата из начального набора система ищет связанные статьи/события, используя сохраненные Association Measures.
Расчет релевантности: Вычисляется оценка релевантности для связанных элементов.
Ранжирование и отображение: Связанные элементы ранжируются по оценке релевантности и отображаются пользователю (например, в отдельном блоке или смешанно с основными результатами).

Какие данные и как использует

Данные на входе

Система использует данные, связанные с взаимодействием пользователя и характеристиками контента.

Поведенческие факторы (User/Behavioral Factors): Критически важные данные. Фиксируются Events — действия пользователя (просмотр, печать, сохранение, отправка). Также используются данные об интересе пользователя (user interest measures), такие как clickthrough, для настройки весов системы.
Временные факторы (Temporal Factors): Метки времени (date-time attribute) для каждого события. Используются для расчета Association in Time.
Контентные факторы (Content Factors): Текст статей (content attribute). Используется для расчета Association in Content.
Структурные/Метаданные факторы (Metadata Factors): Атрибуты источника (source or metadata attributes), такие как автор, организация, получатель письма. Используются для расчета Association in Metadata.

Какие метрики используются и как они считаются

Association in Time Score: Рассчитывается на основе разницы во времени между двумя событиями. Может использоваться пороговое значение (например, 1 час). Функция расчета может быть линейной (чем ближе, тем выше балл), пороговой (1, если в пределах порога; 0, если за пределами) или экспоненциальной.
Association in Content Score: Метрика схожести контента (конкретные методы не детализированы в патенте).
Association in Metadata Score: Метрика совпадения метаданных.
Combined Association Measure: Взвешенная сумма отдельных показателей. $w1*Time + w2*Content + w3*Metadata$ .
Весовые коэффициенты (Weights w1, w2, w3): Значения, определяющие важность каждого типа ассоциации. Они могут корректироваться на основе поведенческих данных (clickthrough).

Поведение пользователя как основа для связи контента: Патент описывает механизм построения графа связей между документами, основанный не на гиперссылках, а на паттернах взаимодействия пользователя. Это позволяет системе понимать контекст и намерения пользователя глубже, чем при анализе отдельных запросов.
Временная близость (Co-visitation) как сильный сигнал ассоциации: Ключевым фактором является Association in Time. Если пользователь взаимодействует с двумя статьями в течение короткого промежутка времени (например, в пределах часа), система считает их тесно связанными. Это основа для анализа совместной посещаемости (co-visitation) в веб-поиске.
Кросс-контекстуальные связи: Система может связывать разнородный контент из разных источников (веб, почта, документы), если она имеет доступ к этим данным. Это подчеркивает важность экосистемы Google (Chrome, Gmail, Android) для сбора данных о поведении.
Адаптивное взвешивание на основе поведенческих факторов: Система не просто использует фиксированные веса для разных типов ассоциаций. Она адаптируется, изучая, какие типы ассоциаций (время, контент или метаданные) приводят к большему интересу пользователя (clickthrough), и увеличивает соответствующие веса. Это прямой механизм интеграции поведенческих факторов в ранжирование.
Персонализация через ассоциативный поиск: Описанный механизм Associative Retrieval позволяет системе активно предлагать контент, связанный с тем, что пользователь ищет или просматривает сейчас, что является основой для систем рекомендаций и персонализации выдачи.

Best practices (это мы делаем)

Оптимизация пути пользователя (User Journey) и контекста сессии: Проектируйте сайт так, чтобы способствовать длительным, тематически связанным сессиям. Если пользователь ищет "цифровые камеры", предложите ему сравнения, обзоры аксессуаров и руководства по фотографии. Это увеличивает вероятность того, что эти страницы будут иметь высокую Association in Time и Association in Content для этого пользователя.
Стимулирование немедленного взаимодействия: Используйте четкие призывы к действию (CTA) и эффективную внутреннюю перелинковку, чтобы побудить пользователя посетить связанные страницы сразу после входа на сайт. Быстрая последовательность кликов усиливает Association in Time между этими страницами.
Укрепление связей через метаданные (E-E-A-T): Последовательно используйте одних и тех же авторов и указывайте принадлежность к организации для тематически связанного контента. Это усиливает Association in Metadata, помогая системе связать контент на уровне сущностей (авторов/брендов).
Анализ поведенческих факторов и Clickthrough Rate (CTR): Поскольку веса ассоциаций корректируются на основе clickthrough, необходимо постоянно работать над повышением CTR и вовлеченности. Это подтверждает, что система отдает предпочтение контенту, который вызывает интерес у пользователей.

Worst practices (это делать не надо)

Тупиковые страницы и прерывание сессии: Создание страниц, которые не предлагают пользователю логического продолжения пути, приводит к коротким сессиям и быстрым уходам. Это минимизирует возможность формирования сильных Association in Time между вашим контентом.
Введение пользователя в заблуждение (Кликбейт): Использование заголовков, которые приводят к быстрому отказу (pogo-sticking). Хотя это и создает временную близость между вашим сайтом и SERP, негативный сигнал clickthrough (в контексте удовлетворенности) может привести к снижению весов ассоциации или пессимизации.
Игнорирование тематической целостности: Размещение несвязанного контента на одном сайте без четкой структуры. Это затрудняет формирование сильных Association in Content между страницами, даже если они посещаются последовательно.

Стратегическое значение

Патент подтверждает стратегическую важность анализа поведения пользователей для Google. Он демонстрирует, что Google не просто ранжирует документы по запросам, но и строит сложные модели ассоциаций на основе того, как пользователи потребляют контент во времени и контексте. Для SEO это означает, что оптимизация должна выходить за рамки отдельных страниц и фокусироваться на обеспечении когерентного, связанного и вовлекающего пользовательского опыта. Понимание Association in Time (co-visitation) также важно для анализа конкурентной среды и выявления сайтов, которые Google считает связанными.

Практические примеры

Сценарий: Оптимизация интернет-магазина для учета Association in Time

Ситуация: Пользователь заходит на страницу товара (Товар А) и проводит там 2 минуты, но затем уходит с сайта.
Применение патента (Негативное): Система фиксирует событие просмотра Товар А, но не фиксирует последующих связанных событий на этом же сайте. Association in Time с другими товарами низкая.
Оптимизация (Позитивное): На страницу Товара А добавляются блоки "С этим товаром часто покупают" и "Недавно просмотренные товары" с Товаром Б и Товаром В. Пользователь кликает на Товар Б через 30 секунд после загрузки Товара А.
Результат: Система фиксирует два события, близких по времени. Association in Time между Товаром А и Товаром Б увеличивается. Если этот паттерн повторяется у многих пользователей, система может начать чаще рекомендовать Товар Б при поиске Товара А или схожих запросов.

Описывает ли этот патент алгоритм PageRank или ссылочное ранжирование?

Нет. Этот патент фокусируется исключительно на поведенческих, временных и контентных ассоциациях между документами. Он описывает построение графа связей на основе того, как пользователи взаимодействуют с контентом (Events), а не на том, как сайты ссылаются друг на друга. Это механизм для понимания пользовательского контекста и персонализации.

Патент подан в 2004 году и упоминает клиентские устройства. Актуален ли он для современного веб-SEO?

Да, он актуален. Хотя примеры могут казаться устаревшими (эпоха Google Desktop Search), базовые принципы — использование временной близости (Association in Time), схожести контента и метаданных для связывания документов на основе поведения пользователя — являются фундаментом современных систем персонализации и анализа пути пользователя (User Journey) в Google. Сбор данных о поведении сейчас происходит через Chrome, Android и другие сервисы.

Что такое "Ассоциация по времени" (Association in Time) и как она влияет на SEO?

Association in Time означает, что если два документа часто просматриваются пользователями в течение короткого промежутка времени, система считает их связанными. В SEO это проявляется как анализ совместной посещаемости (co-visitation). Если пользователи часто переходят с вашего сайта на сайт конкурента (или наоборот) в рамках одной сессии, Google может считать эти сайты тематически или функционально связанными.

Как я могу улучшить "Ассоциацию по времени" для страниц моего сайта?

Необходимо стимулировать пользователя к просмотру нескольких связанных страниц за одну сессию. Используйте эффективную внутреннюю перелинковку, блоки рекомендаций ("Читайте также", "Похожие товары"), и четкие призывы к действию. Цель состоит в том, чтобы создать логичный и вовлекающий путь пользователя, минимизируя тупиковые страницы.

Патент упоминает, что веса ассоциаций корректируются на основе "clickthrough". Что это значит для SEO?

Это прямое подтверждение использования поведенческих факторов. Если система предлагает связанный контент (например, на основе временной близости), и пользователи активно кликают на него (высокий clickthrough), система увеличивает вес этого типа ассоциации. Это подчеркивает важность оптимизации CTR и релевантности предлагаемого контента для обучения алгоритмов Google.

Что такое "Ассоциация по метаданным" и как она связана с E-E-A-T?

Association in Metadata связывает документы на основе общих атрибутов, таких как автор или организация. Это напрямую пересекается с принципами E-E-A-T. Если авторитетный автор публикует несколько статей по теме, система свяжет их через метаданные автора. Это помогает Google идентифицировать и кластеризовать контент, созданный экспертами.

Может ли этот механизм связать мой сайт с некачественными ресурсами?

Теоретически, да. Если пользователи часто посещают ваш сайт и некачественный ресурс в рамках одной сессии (например, при поиске "бесплатных" версий того, что вы предлагаете платно), может возникнуть Association in Time. Однако система также учитывает Association in Content и Metadata, а также общие сигналы качества, что должно нивелировать нежелательные ассоциации для авторитетных сайтов.

Используется ли этот механизм для генерации блоков "Люди также ищут" (People Also Ask) или рекомендаций?

Описанные принципы лежат в основе таких функций. Associative Retrieval — это процесс поиска контента, связанного с текущим интересом пользователя. Блоки рекомендаций и связанные запросы часто генерируются на основе анализа того, какой еще контент пользователи потребляли (Association in Time и Content) в рамках схожих поисковых сессий.

Какой тип ассоциации важнее: время, контент или метаданные?

Патент не устанавливает фиксированного приоритета. Он предлагает адаптивную систему взвешивания (w1, w2, w3), где важность каждого фактора может меняться в зависимости от контекста и обратной связи от пользователей (clickthrough). В разных ситуациях приоритеты могут смещаться: например, для новостей время может быть критичнее, а для научных статей — метаданные (автор).

Как этот патент влияет на стратегии контент-маркетинга?

Он подчеркивает важность создания кластеров контента (Hub and Spoke model). Создание серии тесно связанных статей, которые пользователи будут потреблять последовательно, усиливает их взаимную ассоциацию по времени и контенту. Это укрепляет тематический авторитет и улучшает пользовательский опыт, что положительно оценивается системой.

Как Google выборочно индексирует действия пользователя на локальном устройстве, основываясь на поведении и частоте событий

Анализ патента Google, описывающего инфраструктуру для клиентского поиска (например, Google Desktop). Система фиксирует действия пользователя (события) с контентом (статьями) и решает, индексировать ли их, используя критерии, основанные на частоте событий, доступных ресурсах и предполагаемых интересах пользователя (имплицитно выведенных из его поведения).

US8346777B1
2013-01-01

Индексация
Local SEO
Поведенческие сигналы

Как Google автоматически категоризирует локальный контент и историю пользователя для контекстного поиска по неявным запросам

Патент Google, описывающий технологию для локального (Desktop) или персонализированного поиска. Система отслеживает взаимодействие пользователя с контентом (события) и использует «схемы событий» для автоматической категоризации файлов, электронных писем и истории просмотров. Эти категории затем используются для предоставления релевантных результатов в ответ на неявные запросы, генерируемые системой на основе текущего контекста пользователя.

US7788274B1
2010-08-31

Персонализация
Поведенческие сигналы
Local SEO

Как Google ранжирует персональные документы (письма, файлы), используя обобщенные данные о взаимодействии на уровне признаков

Google решает проблему ранжирования личных документов (например, электронных писем), для которых нет истории кликов. Вместо анализа кликов по конкретному документу система анализирует взаимодействие на уровне признаков. Она агрегирует данные о том, как миллионы пользователей взаимодействуют с документами, имеющими схожие признаки (например, структуру темы письма или отправителя), и использует эти данные для ранжирования похожих документов в вашем личном поиске.

US10394832B2
2019-08-27

Поведенческие сигналы
Персонализация

Как Google использует данные о поведении пользователей внутри документов (время чтения разделов, закладки) для улучшения ранжирования

Google может собирать и анализировать данные о том, как пользователи взаимодействуют с электронными документами (например, PDF, DOC, HTML). Система отслеживает, какие разделы или страницы просматриваются дольше всего или добавляются в закладки. Эта агрегированная информация используется для повышения в ранжировании документов, чьи ключевые слова находятся в наиболее используемых (и, следовательно, ценных) разделах.

US8005811B2
2011-08-23

Поведенческие сигналы
SERP

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)

Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.

US8055655B1
2011-11-08

Поведенческие сигналы
Персонализация

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR

Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.

US10922326B2
2021-02-16

Knowledge Graph
SERP
Семантика и интент

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска

Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.

US8583675B1
2013-11-12

Поведенческие сигналы
SERP
Семантика и интент

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования

Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.

US8862572B2
2014-10-14

Поведенческие сигналы
Ссылки

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы

Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.

US9129029B1
2015-09-08

Local SEO
Поведенческие сигналы
Свежесть контента

Как Google использует клики пользователей в поиске по картинкам для понимания содержания изображений и улучшения таргетинга

Google анализирует поведение пользователей в поиске по картинкам для идентификации содержания изображений. Если пользователи ищут определенный запрос (идею) и массово кликают на конкретное изображение в результатах, система связывает это изображение с данным запросом (концепцией). Эти данные используются для улучшения ранжирования в поиске картинок и для предложения релевантных ключевых слов рекламодателям, загружающим схожие изображения.

US11409812B1
2022-08-09

Поведенческие сигналы
Семантика и интент
SERP

Как Google использует историю поиска и ссылки с предпочитаемых пользователем сайтов для персонализации выдачи

Google может персонализировать результаты поиска, используя историю запросов или просмотров пользователя для создания набора предпочтений (Document Bias Set). Если документы из этого набора, особенно те, которые также признаны глобально качественными, ссылаются на результаты поиска, эти результаты переранжируются (повышаются или понижаются) в соответствии с весами предпочтений пользователя.

US8538970B1
2013-09-17

Персонализация
Поведенческие сигналы
SERP

Как Google использует интерактивные визуальные цитаты для генерации и уточнения ответов в мультимодальном поиске (SGE/Lens)

Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. Этот ответ сопровождается «визуальными цитатами» (исходными изображениями). Если пользователь видит, что цитата визуально не соответствует запросу, он может её отклонить. Система удалит текст этого источника и перегенерирует ответ, повышая его точность.

US20240378237A1
2024-11-14

Мультимедиа
EEAT и качество
Семантика и интент

Как Google идентифицирует и верифицирует локальные бизнесы для показа карт и адресов в органической выдаче

Google использует этот механизм для улучшения органических результатов. Система определяет, связана ли веб-страница с одним конкретным бизнесом. Затем она верифицирует ее локальную значимость, проверяя, ссылаются ли на нее другие топовые результаты по тому же запросу. Если страница верифицирована, Google дополняет стандартную «синюю ссылку» интерактивными локальными данными, такими как адреса и превью карт.

US9418156B2
2016-08-16

Local SEO
SERP
Ссылки

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий

Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.

US11157488B2
2021-10-26

Индексация
Поведенческие сигналы
Семантика и интент

Как Google определяет структурно похожие запросы (sibling queries) для автоматического обучения NLP-моделей

Google использует метод для идентификации "родственных запросов" (sibling queries) — запросов с одинаковой структурой интента, но разными переменными (например, "погода в Москве" и "погода в Париже"). Система сравнивает шаблоны использования этих запросов в логах, основываясь на поведении пользователей, чтобы понять их взаимосвязь без традиционного NLP. Это позволяет автоматически генерировать масштабные наборы данных для обучения ИИ.

US11379527B2
2022-07-05

Семантика и интент
Поведенческие сигналы