SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю поиска и браузинга для персонализации выдачи и создания неявного "Избранного"

SYSTEMS AND METHODS FOR COMBINING SETS OF FAVORITES (Системы и методы объединения наборов избранного)
  • US20060224608A1
  • Google LLC
  • 2005-03-31
  • 2006-10-05
  • Персонализация
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google записывает историю поиска и просмотров пользователя для персонализации результатов. Система определяет "предпочтительные сайты" на основе частоты посещений, кликов и времени на сайте, повышая их в выдаче для этого пользователя. Патент также описывает объединение предпочтений пользователя с предпочтениями других людей для формирования комбинированного рейтинга.

Описание

Какую проблему решает

Патент решает задачу улучшения поискового опыта пользователя путем интеграции его прошлых действий (поисковых запросов, кликов по результатам и рекламе, истории браузинга) в процесс ранжирования. Он устраняет проблему универсальной выдачи, которая не учитывает индивидуальные предпочтения и историю взаимодействий пользователя с контентом. Система направлена на автоматическое определение "избранных" или "предпочтительных" сайтов пользователя без необходимости их явного указания.

Что запатентовано

Запатентована система мониторинга, записи и анализа активности пользователя для персонализации поиска и создания наборов "предпочтительных местоположений" (Preferred Locations). Ключевым элементом изобретения является метод объединения набора предпочтительных сайтов пользователя с наборами предпочтений других пользователей или сообществ. Это позволяет внедрять социальные сигналы (коллаборативную фильтрацию) в процесс ранжирования и представления результатов.

Как это работает

Система работает путем мониторинга активности пользователя через Client Assistant (например, тулбар или расширение браузера) или серверное логирование. Эти данные (запросы, клики, просмотры, время пребывания) сохраняются в User Information Database. На основе этой истории вычисляются производные данные (Derived Data) и оценки (например, History Score), которые определяют предпочтения пользователя. При получении нового запроса стандартные результаты поиска переранжируются с учетом этих оценок: ранее посещенные сайты повышаются или помечаются. Система также может объединять предпочтения пользователя с предпочтениями его сообщества, используя весовые коэффициенты.

Актуальность для SEO

Средняя-Высокая. Базовые принципы персонализации на основе истории поиска и поведения пользователя остаются фундаментальными для современных поисковых систем. Механизмы логирования поведения (клики, stay-time) критически важны. Однако, специфические аспекты социальной персонализации (объединение "избранного" с другими пользователями), описанные в патенте, были более актуальны в прошлом (например, в эпоху Google+) и значительно менее заметны в основном поиске Google в 2025 году.

Важность для SEO

Патент имеет высокое значение для понимания механизмов персонализации поиска (7.5/10). Он демонстрирует, как поведенческие метрики (клики, повторные визиты, время пребывания на сайте) могут напрямую влиять на SERP для конкретного пользователя. Это подчеркивает стратегическую важность создания сайтов, на которые пользователи регулярно возвращаются, превращая их в Preferred Locations.

Детальный разбор

Термины и определения

Client Assistant (Клиентский помощник)
Локально работающая программа на клиенте (например, плагин или тулбар для браузера), предназначенная для мониторинга действий пользователя и передачи их в поисковую систему.
Derived Data (Производные данные)
Информация, полученная путем анализа Event-Based Data. Включает профили пользователей, агрегированные оценки для контента (ContentID), основанные на частоте, времени пребывания, свежести посещений и т.д.
Event-Based Data (Данные, основанные на событиях)
Сырые данные об активности пользователя. Включают типы событий: Query Event (запрос), Result Click Event (клик по результату), Ad Click Event (клик по рекламе), Browsing Event (просмотр страниц).
History Score (Оценка истории)
Ранговое значение, связанное с событием. Часто упоминается как значение, которое может периодически изменяться (уменьшаться) в зависимости от времени, прошедшего с момента записи события.
Preferred Locations (Предпочтительные местоположения)
Набор сайтов или страниц (включая лендинги рекламы), неявно определенных как "избранные" для пользователя на основе его истории посещений и поведения.
Query Session (Поисковая сессия)
Группа связанных запросов и действий (кликов), выполненных пользователем в течение одного ограниченного периода времени (браузинг-сессии).
Session Group (Группа сессий)
Объединение нескольких связанных Query Sessions из разных браузинг-сессий.
Stay-time (Время пребывания)
Оценка времени, которое пользователь провел на странице. Используется как показатель интереса пользователя к контенту при расчете Derived Data и ранжировании Preferred Locations.
User Information Database (База данных информации о пользователе)
Хранилище, содержащее записи об активности пользователей (Event-Based Data) и производную информацию (Derived Data).

Ключевые утверждения (Анализ Claims)

Патент содержит несколько независимых пунктов, описывающих разные аспекты системы.

Claim 1 (Независимый пункт): Описывает метод объединения наборов местоположений (социальная персонализация).

  1. Система получает запрос на список местоположений, удовлетворяющих условию.
  2. Идентифицируется первый набор ранее посещенных местоположений из истории пользователя (Набор 1), имеющих ранговые значения.
  3. Идентифицируется второй набор ранее посещенных местоположений (Набор 2, например, от другого пользователя или сообщества), также имеющих ранговые значения.
  4. Набор 1 и Набор 2 объединяются.
  5. Объединенный набор упорядочивается на основе соответствующих ранговых значений.

Claim 7 (Зависимый от 1): Детализирует процесс упорядочивания.

Упорядочивание включает применение первого весового коэффициента к Набору 1 и второго весового коэффициента к Набору 2. Это позволяет пользователю настраивать степень влияния чужих предпочтений на свой список.

Claim 12 (Независимый пункт): Описывает метод создания набора предпочтений для сообщества пользователей.

  1. Для каждого участника сообщества идентифицируется его набор ранее посещенных местоположений с ранговыми значениями.
  2. Эти наборы объединяются.
  3. К ранговым значениям в каждом наборе применяется соответствующий весовой коэффициент (например, основанный на доверии или важности участника в сообществе).
  4. Объединенный набор упорядочивается на основе взвешенных ранговых значений.

Claim 15 (Независимый пункт): Описывает базовый метод создания "избранного" (для одного пользователя).

  1. Идентификация набора ранее посещенных местоположений из журнала посещений, хранящегося на сервере, где каждое местоположение имеет ранговые значения.
  2. Упорядочивание этого набора на основе этих ранговых значений.

Где и как применяется

Изобретение в первую очередь затрагивает этапы ранжирования и переранжирования, используя отдельную инфраструктуру для сбора и хранения данных о поведении пользователей.

CRAWLING & INDEXING (Инфраструктура сбора пользовательских данных)
Хотя это не классическое сканирование веба, патент описывает инфраструктуру для сбора данных о поведении. Client Assistant или серверные логи собирают данные об активности (клики, запросы, просмотры) и передают их для хранения и индексации в User Information Database. На этом этапе вычисляются Derived Data и History Scores.

RANKING – Ранжирование
На этом этапе генерируется стандартный набор результатов для запроса.

RERANKING – Переранжирование (Персонализация)
Основное применение патента. Система использует данные из User Information Database для модификации стандартного набора результатов.

  1. Корректировка оценок: Ranking Scores результатов корректируются на основе истории пользователя. Ранее посещенные или кликнутые результаты повышаются. Результаты, которые были показаны, но не кликнуты, могут понижаться.
  2. Использование Preferred Locations: Сайты, классифицированные как предпочтительные (на основе частоты, stay-time и т.д.), получают дополнительное повышение.
  3. Социальное смешивание: Если активировано, система объединяет предпочтения пользователя с предпочтениями сообщества, используя весовые коэффициенты, и переранжирует выдачу.

METASEARCH – Метапоиск и Смешивание
Система может отображать результаты из истории поиска в отдельном блоке (например, "My Search History results") и добавлять аннотации к результатам в основной выдаче (например, дату последнего посещения).

Входные данные:

  • Исходный запрос пользователя.
  • Идентификатор пользователя (User ID) или клиента (Client ID).
  • Стандартный набор результатов поиска.
  • User Information Database (история событий, производные оценки, предпочтительные сайты пользователя и сообщества).

Выходные данные:

  • Персонализированный (переупорядоченный) SERP.
  • Аннотации к результатам (индикаторы посещения, частота).
  • Отдельные блоки с историческими результатами.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на запросы, по которым у пользователя есть релевантная история. Это особенно заметно при навигационных запросах или повторяющихся информационных потребностях, где пользователь уже нашел предпочтительный источник.
  • Конкретные типы контента: Влияет на все типы контента, включая веб-страницы, лендинги рекламы (Ad Click Event) и обзоры продуктов (Product Event).

Когда применяется

  • Условия применения: Алгоритм применяется, когда пользователь может быть идентифицирован (через логин или cookie) И у пользователя есть релевантная история поиска или браузинга, связанная с текущим запросом.
  • Триггеры активации: Получение поискового запроса от идентифицированного пользователя.
  • Исключения: Пользователь может отказаться от записи истории (unsubscribed) или временно приостановить ее (функция "snooze"). В этих случаях персонализация на основе истории не применяется или ограничена.

Пошаговый алгоритм

Процесс А: Персонализация результатов поиска

  1. Получение запроса: Система получает поисковый запрос от пользователя.
  2. Стандартный поиск: Запрос выполняется по стандартному репозиторию документов.
  3. Получение результатов: Система получает базовый набор результатов поиска.
  4. Корректировка на основе истории: Система обращается к User Information Database и корректирует результаты. Это включает:
    • Повышение результатов, которые пользователь ранее посещал или кликал. Величина повышения может зависеть от History Score, частоты, свежести визита и stay-time.
    • Понижение результатов, которые ранее были показаны пользователю, но не были кликнуты.
    • Добавление индикаторов (дата последнего визита, частота посещений).
    • Выделение топовых исторических результатов в отдельный блок.
  5. Предоставление ответа: Персонализированный набор результатов предоставляется пользователю.

Процесс Б: Объединение наборов избранного (Социальная персонализация)

  1. Идентификация Набора 1: Определяется набор предпочтительных местоположений пользователя (Preferred Locations) и их ранговые значения.
  2. Идентификация Набора 2: Определяется набор предпочтительных местоположений от других источников (другой пользователь, сообщество) и их ранговые значения.
  3. Идентификация весовых коэффициентов: Определяются веса, которые будут применены к Набору 1 и Набору 2 (могут быть заданы пользователем или системой).
  4. Объединение наборов: Наборы объединяются, при этом к ранговым значениям применяются весовые коэффициенты.
  5. Упорядочивание: Комбинированный набор сортируется на основе взвешенных ранговых значений.
  6. Предоставление ответа: Комбинированный набор предоставляется пользователю.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для персонализации.

  • Поведенческие факторы: Являются критически важными.
    • Поисковые запросы (Query Event).
    • Клики по результатам поиска (Result Click Event).
    • Клики по рекламе (Ad Click Event).
    • История браузинга (Browsing Event) – посещенные URL.
    • Частота посещений (Frequency).
    • Свежесть посещений (Recency) – дата последнего визита.
    • Время пребывания на сайте (Stay-time или dwell time).
  • Ссылочные факторы: PageRank упоминается как один из возможных критериев для ранжирования Preferred Locations.
  • Пользовательские факторы:
    • Идентификаторы: User ID (логин), Client ID (cookie).
    • Настройки подписки и приватности (subscription, snooze).
    • Явные модификации ранжирования пользователем (user-modified ranking values).
    • Аннотации или метки (Labels), добавленные пользователем к контенту.
    • Данные о сообществе или социальной сети (используются для объединения избранного).

Какие метрики используются и как они считаются

  • History Score: Оценка, связанная с событием. В патенте упоминается, что ее значение может уменьшаться по мере увеличения времени с момента события (time-decay).
  • Derived Scores (Оценки для ContentID): Метрики, вычисляемые для конкретных URL на основе анализа истории. Факторы включают:
    • Частота кликов/посещений за период времени.
    • Stay-time (время пребывания).
    • Время с момента последнего просмотра.
    • Негативное влияние, если контент был показан в выдаче, но пользователь его не выбрал.
    • Позитивное влияние, если пользователь посещает похожие сайты.
  • Visit Score (Оценка посещения): В одном из вариантов реализации это сумма оценок отдельных посещений (instance visit scores), где каждая оценка уменьшается со временем.
  • Weighting Factors (Весовые коэффициенты): Используются при объединении разных наборов Preferred Locations (например, своих и сообщества) для контроля их влияния на итоговый рейтинг.

Выводы

  1. Персонализация через историю поведения: Патент подтверждает, что Google детально записывает и использует историю поведения пользователя (запросы, клики, просмотры, stay-time) для модификации поисковой выдачи.
  2. Влияние на стандартное ранжирование: Персонализация применяется на этапе RERANKING и может существенно изменить порядок результатов для конкретного пользователя по сравнению со стандартной выдачей.
  3. Неявное определение предпочтений (Implicit Feedback): Система автоматически определяет Preferred Locations (избранные сайты) на основе неявных сигналов: частоты посещений, повторных визитов и времени пребывания (stay-time). Явное добавление в закладки не требуется.
  4. Учет негативного опыта: Патент явно указывает на возможность понижения (demotion) результатов, которые были ранее показаны пользователю, но не были кликнуты.
  5. Инфраструктура для социальной персонализации: Значительная часть патента посвящена механизмам объединения предпочтений разных пользователей и сообществ. Хотя этот аспект менее заметен сегодня, инфраструктура для использования социальных сигналов была заложена.
  6. Кросс-девайс трекинг: Система предусматривает объединение истории с разных устройств (Client IDs) под одним аккаунтом (User ID) для создания унифицированной истории пользователя.

Практика

Best practices (это мы делаем)

  • Фокус на вовлеченности и удовлетворенности пользователя: Стратегическая цель — стать Preferred Location для целевой аудитории. Это достигается через предоставление высококачественного контента, который полностью отвечает на запрос пользователя и стимулирует длительное пребывание на сайте (stay-time).
  • Оптимизация под высокий CTR и долгий клик (Long Click): Необходимо оптимизировать сниппеты для повышения кликабельности и обеспечивать отличный пост-клик опыт, чтобы избежать коротких кликов и возврата в выдачу (pogo-sticking). Это напрямую влияет на Derived Scores.
  • Стимулирование повторных визитов (Retention): Используйте брендинг, полезные инструменты, регулярные обновления контента, email-рассылки и другие методы удержания, чтобы увеличить частоту (frequency) и свежесть (recency) посещений. Чем чаще пользователь возвращается, тем выше вероятность повышения сайта в его персональной выдаче.
  • Построение бренда и узнаваемости: Работайте над узнаваемостью бренда, чтобы пользователи целенаправленно искали ваш сайт или предпочитали его в выдаче, генерируя позитивные поведенческие сигналы.

Worst practices (это делать не надо)

  • Использование кликбейта: Привлечение трафика обманными сниппетами приведет к коротким визитам (низкий stay-time). Система интерпретирует это как низкую удовлетворенность, что может привести к понижению сайта в персональной выдаче пользователя.
  • Игнорирование пост-клик оптимизации: Фокус исключительно на привлечении трафика без работы над качеством лендингов и пользовательским опытом приведет к негативным поведенческим сигналам.
  • Создание контента низкого качества: Если пользователи часто игнорируют ваш результат в выдаче (presented but not clicked), патент предполагает, что система может понизить его для этого пользователя в будущем.

Стратегическое значение

Патент является одним из фундаментальных документов, описывающих инфраструктуру персонализированного поиска Google. Он подтверждает, что поведенческие факторы играют ключевую роль в модификации выдачи для конкретного пользователя. Для SEO это означает, что стратегия не может заканчиваться на привлечении клика; оптимизация удовлетворенности пользователя и удержание аудитории являются необходимыми элементами для обеспечения долгосрочной видимости и превращения сайта в авторитетный источник (Preferred Location) для пользователей.

Практические примеры

Сценарий 1: Повышение за счет повторных визитов

  1. Действие пользователя: Пользователь ищет "советы по уходу за орхидеями", кликает на сайт OrchidExpert.com и проводит там 7 минут (высокий stay-time).
  2. Запись в системе: Google регистрирует Result Click Event и stay-time в User Information Database. Derived Score для OrchidExpert.com у этого пользователя повышается.
  3. Повторный запрос: Через неделю пользователь ищет "почему желтеют листья у орхидей".
  4. Результат (Персонализация): Несмотря на то, что OrchidExpert.com мог быть на 5 позиции в стандартной выдаче, для этого пользователя он поднимается на 1 позицию. Также рядом со сниппетом появляется индикатор "Вы посещали этот сайт [дата]".

Сценарий 2: Понижение из-за негативного опыта

  1. Действие пользователя: Пользователь ищет "купить билеты на поезд". В Топ-3 присутствует сайт CheapTickets.com.
  2. Негативный сигнал 1: Пользователь игнорирует CheapTickets.com и кликает на другие результаты. Система фиксирует (presented but not clicked).
  3. Негативный сигнал 2: При следующем поиске пользователь кликает на CheapTickets.com, но сразу возвращается в выдачу (низкий stay-time).
  4. Результат (Персонализация): При последующих запросах, связанных с билетами, система может понизить CheapTickets.com в персональной выдаче этого пользователя, так как Derived Score уменьшился из-за негативных сигналов.

Вопросы и ответы

Означает ли этот патент, что поведенческие факторы являются прямым фактором ранжирования?

Да, но с важным уточнением: они являются прямым фактором для персонализации выдачи конкретного пользователя. Патент описывает, как история кликов, частота посещений и stay-time используются для переранжирования стандартных результатов. Это не обязательно означает, что эти данные используются для глобального ранжирования, но для индивидуального пользователя их влияние критично.

Что такое "Stay-time" и как Google его измеряет?

Stay-time (время пребывания или Dwell Time) — это оценка времени, которое пользователь провел на странице после клика из поиска. Патент предлагает два метода измерения: с помощью Client Assistant (например, тулбара или браузера Chrome), который мониторит активность локально, или путем наблюдения за временем между кликами на странице результатов поиска (время от клика по результату до следующего действия в SERP).

Актуален ли сегодня социальный аспект патента (объединение "Избранного")?

В 2025 году этот аспект значительно менее актуален, чем во времена активного развития социальных функций в поиске (например, Google+). Прямое влияние социальных связей на основную поисковую выдачу сейчас минимально. Однако базовый механизм объединения разных наборов предпочтений с использованием весовых коэффициентов может применяться в других контекстах, например, в рекомендательных системах (Discover).

Как Google отслеживает пользователей на разных устройствах согласно патенту?

Патент описывает механизм ассоциации нескольких Client ID (идентификаторы конкретного браузера или устройства, часто cookie) с одним User ID (аккаунт пользователя). Когда пользователь входит в свой аккаунт на новом устройстве, система предлагает связать Client ID этого устройства с его User ID, что позволяет объединить историю поиска и браузинга в единый профиль.

Что произойдет, если пользователи видят мой сайт в выдаче, но не кликают на него?

Патент явно указывает, что если результат был показан пользователю, но не был кликнут (presented but not clicked), это может негативно повлиять на Derived Score этого результата для данного пользователя. Это может привести к понижению (demotion) сайта в будущих персональных выдачах этого пользователя по схожим запросам.

Как сделать свой сайт "Preferred Location"?

Система неявно определяет Preferred Locations на основе поведенческих сигналов. Чтобы стать предпочтительным сайтом, необходимо фокусироваться на трех ключевых метриках: частота посещений (Frequency), свежесть посещений (Recency) и время пребывания (Stay-time). Это требует высококачественного контента, отличного UX и стратегии удержания пользователей.

Что такое "Query Session" и зачем это нужно?

Query Session — это группа связанных запросов и кликов, совершенных за короткий промежуток времени. Группировка активности в сессии помогает системе лучше понять контекст и намерение пользователя. Это используется для анализа истории и может влиять на персонализацию, например, предлагая запросы, которые пользователь вводил сразу после аналогичного запроса в прошлой сессии.

Может ли пользователь контролировать эту персонализацию?

Да. Патент описывает механизмы подписки (subscription) и отказа (unsubscription) от записи различных типов данных (например, можно разрешить запись кликов по результатам, но запретить запись кликов по рекламе). Также упоминается функция "snooze", позволяющая временно приостановить запись истории. Кроме того, пользователи могут вручную удалять события из истории.

Влияет ли реклама (Ad Clicks) на органическую выдачу согласно патенту?

Патент не описывает прямого влияния кликов по рекламе на органическое ранжирование. Однако Ad Click Events записываются в ту же базу данных и могут использоваться для построения профиля пользователя (Derived Data). Кроме того, лендинги рекламы могут стать Preferred Locations, если пользователь часто на них переходит, что может улучшить их видимость в рамках персонализированных списков.

Что важнее для персонализации: частота визитов или время на сайте?

Патент не указывает точных весов, но упоминает оба фактора как важные компоненты для расчета Derived Scores и определения Preferred Locations. Высокая частота визитов указывает на лояльность, а длительное время пребывания (stay-time) используется как показатель интереса и качества контента. Оба фактора необходимы для эффективной персонализации.

Похожие патенты

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю браузера пользователя для персонализации и переранжирования результатов поиска
Google использует локально сохраненную историю посещений пользователя для изменения стандартной поисковой выдачи. Система отслеживает, какие документы пользователь посещал ранее, как часто и как долго. При последующих поисках ранее посещенные сайты агрессивно повышаются в выдаче или добавляются в нее, обеспечивая персонализированный результат, основанный на предыдущем поведении пользователя.
  • US7730054B1
  • 2010-06-01
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google отслеживает, анализирует и использует историю поведения пользователя для персонализации поиска и визуализации активности
Патент Google описывает инфраструктуру для сбора и анализа истории действий пользователя (запросы, клики по органике и рекламе, просмотры страниц). Система использует эти данные, включая метрики вовлеченности вроде «stay-time», для определения «предпочитаемых местоположений» и персонализации выдачи. Также описан метод графической визуализации объема этой активности.
  • US7694212B2
  • 2010-04-06
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google выбирает Sitelinks, анализируя визуальное расположение и структуру DOM навигационных меню
Google использует механизм для генерации Sitelinks путем рендеринга страницы и анализа DOM-структуры. Система определяет визуальное расположение (координаты X, Y) гиперссылок и группирует их на основе визуальной близости и общих родительских элементов. Sitelinks выбираются исключительно из доминирующей группы (например, главного меню), а ссылки из других групп игнорируются.
  • US9053177B1
  • 2015-06-09
  • SERP

  • Ссылки

  • Структура сайта

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)
Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.
  • US7979417B1
  • 2011-07-12
  • Ссылки

  • Краулинг

  • Техническое SEO

Как Google использует цепочки запросов и время взаимодействия для определения и ранжирования результатов, которые действительно нужны пользователям
Google анализирует последовательности запросов пользователей (цепочки запросов) и время между кликами и последующими запросами (время взаимодействия), чтобы определить удовлетворенность пользователя. Если пользователи часто переформулируют Запрос А в Запрос Б, прежде чем найти удовлетворительный результат, Google использует эти данные, чтобы ранжировать этот удовлетворительный результат выше по исходному Запросу А и предлагать Запрос Б в качестве связанного поиска.
  • US9342600B1
  • 2016-05-17
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google решает, показывать ли промежуточную страницу (превью) или направлять пользователя сразу на сайт при клике в Поиске по картинкам
Google анализирует, насколько хорошо веб-страница представляет выбранное изображение («image-centricity»). Если изображение на странице качественное, заметное и удовлетворяет интент пользователя (на основе статических и поведенческих данных), Google направляет трафик из Поиска по картинкам напрямую на сайт. В противном случае, Google показывает промежуточный экран (Image Overlay).
  • US9135317B2
  • 2015-09-15
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует данные о наведении курсора (Hover Data) для ранжирования изображений и борьбы с кликбейтными миниатюрами
Google использует данные о взаимодействии пользователя с миниатюрами в поиске по картинкам (наведение курсора) как сигнал интереса. Для редких запросов эти сигналы получают больший вес, дополняя недостаток данных о кликах. Система также вычисляет соотношение кликов к наведениям (Click-to-Hover Ratio), чтобы идентифицировать и понижать в выдаче «магниты кликов» — привлекательные, но нерелевантные изображения, которые собирают много наведений, но мало кликов.
  • US8819004B1
  • 2014-08-26
  • Поведенческие сигналы

  • Мультимедиа

  • SERP

Как Google предсказывает, какие сайты будут интересны пользователю на основе его контекста (местоположение, время, интересы) без поискового запроса
Google использует агрегированные данные о поведении пользователей для прогнозирования контента. Система анализирует контекст пользователя (местоположение, время, интересы, историю) и определяет, какие сайты посещают похожие пользователи в аналогичном контексте значительно чаще, чем пользователи в целом. Этот механизм позволяет предлагать релевантный контент без явного запроса (например, в Google Discover).
  • US9195703B1
  • 2015-11-24
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует персонализированный PageRank ссылающихся страниц для переоценки значимости анкорного текста
Google может персонализировать поисковую выдачу, изменяя вес анкорного текста ссылок. Вес ссылки зависит не от глобального PageRank ссылающейся страницы, а от её "персонализированного PageRank", рассчитанного на основе предпочтений пользователя (например, любимых сайтов или тематик). Это позволяет повышать в выдаче документы, на которые ссылаются авторитетные для конкретного пользователя источники.
  • US7260573B1
  • 2007-08-21
  • Персонализация

  • Ссылки

Как Google использует паттерны просмотра пользователей (co-visitation) для определения связанности документов и улучшения поиска
Google использует систему для определения того, насколько тесно связаны два документа, основываясь на агрегированных данных о поведении пользователей. Система рассчитывает вероятность того, что пользователь просмотрит Документ B в течение определенного времени после того, как Документ А был показан ему в результатах поиска. Эти данные используются для персонализации выдачи, предложения рекомендаций и улучшения релевантности на основе контекста сессии пользователя.
  • US8447760B1
  • 2013-05-21
  • Поведенческие сигналы

  • Персонализация

  • Семантика и интент

Как Google извлекает сущности из активности пользователя для запуска проактивных (имплицитных) поисковых запросов
Анализ патента Google, описывающего метод идентификации «именованных сущностей» (людей, тем, фраз) путем мониторинга действий пользователя, таких как электронная почта, просмотр веб-страниц и набор текста. Система использует эти сущности для проактивного запуска фоновых поисковых запросов (имплицитных запросов), релевантных текущему контексту пользователя, часто с использованием персонализированных данных.
  • US9009153B2
  • 2015-04-14
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

seohardcore