SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует историю браузера, закладки и поведение пользователей для персонализации результатов поиска в e-commerce

INTERFACE AND SYSTEM FOR PROVIDING PERSISTENT CONTEXTUAL RELEVANCE FOR COMMERCE ACTIVITIES IN A NETWORKED ENVIRONMENT (Интерфейс и система для обеспечения постоянной контекстной релевантности для коммерческой деятельности в сетевой среде)
  • US7089237B2
  • Google LLC
  • 2001-01-26
  • 2006-08-08
  • Поведенческие сигналы
  • Персонализация
  • SERP
  • Семантика и интент
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Система отслеживает поведение пользователей (клики, время на сайте, покупки) и их сохраненные закладки (content pointers) в сетевой среде. На основе этих данных создается персональная модель релевантности и иерархия предпочтений. Эта модель используется для дополнения запросов, переранжирования результатов поиска и предоставления рекомендаций, обеспечивая персонализированный опыт в e-commerce.

Описание

Какую проблему решает

Патент решает проблему дезорганизованных и неперсонализированных результатов поиска в сфере электронной коммерции (e-commerce), которую авторы называют "information furball". Стандартные поисковые системы не способны учитывать индивидуальные предпочтения пользователя (например, предпочтение одного магазина или бренда другому) и не адаптируются к меняющимся интересам пользователя. Изобретение направлено на создание системы, которая обеспечивает контекстуально релевантные результаты и рекомендации на основе поведения пользователя и его личной организации информации.

Что запатентовано

Запатентована система (Relevance Engine) и интерфейс (называемый SideCart), которые отслеживают поведение пользователя, управляют категоризированными указателями на контент (content pointers, т.е. закладками) и строят персонализированную модель релевантности (Relevance Model). Эта модель используется для дополнения поисковых запросов, фильтрации и переранжирования результатов в e-commerce на основе истории пользователя, его предпочтений и определенного им контекста.

Как это работает

Система работает через интерфейс (например, боковую панель в браузере), который отслеживает взаимодействие пользователя с контентом: историю просмотров, покупки, время пребывания на странице (dwell time) и повторные визиты. Пользователь также может сохранять и категоризировать content pointers. Фоновая система (Relevance Engine) использует эти данные для построения Relevance Model. При поиске или просмотре сайтов система использует эту модель для определения контекста, автоматического дополнения запросов (или даже выполнения поиска без ключевых слов – "One-click searching") и переранжирования результатов, отдавая приоритет предпочитаемым продавцам или релевантным категориям.

Актуальность для SEO

Средне-высокая. Хотя конкретная реализация интерфейса SideCart (подача заявки в 2001 году) может показаться устаревшей, лежащие в ее основе концепции крайне актуальны. Использование истории браузера, закладок (потенциально через синхронизацию данных пользователя), отслеживание поведения на разных сайтах и использование поведенческих метрик (время на сайте, покупки) для персонализации поиска являются фундаментальными аспектами современных поисковых систем, особенно в Google Shopping и коммерческих вертикалях.

Важность для SEO

Патент имеет значительное влияние на SEO (8/10). Он детально описывает механизмы сбора поведенческих данных и их использования для переранжирования результатов поиска. Это подтверждает, что Google рассматривает такие метрики, как dwell time, повторные визиты и фактические покупки, как сигналы релевантности и предпочтения. Это критически важно для стратегий SEO в e-commerce, ориентированных на пользовательский опыт (UX) и вовлеченность.

Детальный разбор

Термины и определения

Auto Classifier (Автоматический классификатор)
Компонент системы, который классифицирует неклассифицированные объекты контента в соответствии с информацией о категоризации, разработанной системой, и картой структуры репозитория.
Browsing Interaction Metric (Метрика взаимодействия при просмотре)
Агрегированная метрика, основанная на поведенческих факторах пользователя (время пребывания, повторные визиты, покупки и т.д.), используемая для адаптивной настройки модели релевантности.
Content Pointer (Указатель на контент)
Ссылка на информационный объект (например, веб-страницу или товар). Эквивалент закладки или избранного.
Context Relevant Hierarchy (Контекстно-релевантная иерархия)
Персонализированная иерархическая организация content pointers пользователя. Структура этой иерархии используется системой для определения контекста и релевантности.
Model Builder (Построитель модели)
Компонент, который определяет параметры релевантности, используемые для адаптивного информирования о поисковой или браузинговой активности пользователя.
Relevance Context (Контекст релевантности)
Контекст, определяемый на основе Relevance Model, истории взаимодействия пользователя и его предпочтений. Используется для организации и ранжирования результатов.
Relevance Engine (Движок релевантности)
Фоновая система, которая собирает, обрабатывает и дополняет коммерческую деятельность пользователя, предоставляя контекстную информацию.
Relevance Model (Модель релевантности)
Персонализированная модель, разработанная для пользователя или группы пользователей, которая содержит предпочтения, активность и атрибуты контента. Адаптивно переопределяет Context Relevant Hierarchy.
Relevance Processing (Обработка релевантности)
Компонent, который применяет Relevance Model к контенту, полученному из информационного репозитория, для фильтрации и ранжирования результатов.
SideCart
Название, данное реализации интерфейса в виде боковой панели браузера, который обеспечивает постоянный доступ к функциям системы.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод взаимодействия с информационным репозиторием.

  1. Выполняется приложение персонализированного интерфейса релевантности (personalized relevance interface application) внутри сетевого интерфейса (браузера).
  2. Интерфейс адаптивно поддерживает организованную коллекцию content pointers.
  3. Генерируется ключевое слово.
  4. Интерфейс оценивает ключевое слово и автоматически извлекает релевантные объекты.
  5. Извлеченные объекты организуются и отображаются в соответствии с Relevance Context, связанным как минимум с одним пользователем.

Claim 2 (Зависимый от 1): Уточняет источник контекста релевантности. Relevance Context определяется, по крайней мере частично, на основе исторических записей взаимодействия пользователя с объектами и сохраненных или выбранных пользователем предпочитаемых объектов.

Claim 3 (Зависимый от 1): Описывает механизм "поиска в один клик". Интерфейс автоматически генерирует ключевое слово из контента отображаемого в данный момент объекта (веб-страницы).

Claim 20 (Независимый пункт): Описывает комплексный метод адаптивного обучения и организации.

  1. Выполняется приложение персонализированного интерфейса релевантности, поддерживающее коллекцию content pointers.
  2. Создается контекстно-релевантная организация (context relevant organization), структурированная для содержания объектов, категоризированных в соответствии с метрикой релевантности пользователя.
  3. Пользователь просматривает и получает доступ к объектам.
  4. Интерфейс оценивает контент доступных объектов и автоматически извлекает дополнительные объекты.
  5. Доступные объекты назначаются на позицию в этой организации.
  6. Интерфейс адаптивно упорядочивает позицию доступных объектов в организации в соответствии с метрикой поведения пользователя при просмотре (browsing interaction behavior metric).

Claim 27 (Зависимый от 26, который зависит от 20): Явно определяет поведенческие метрики. Поведение пользователя выбирается из группы, состоящей из: времени пребывания пользователя на конкретном объекте (dwell time), количества повторных посещений (repeat visits), времени суток, времени года, системы, используемой для доступа к объекту, и количества покупок (number of purchases), совершенных на определенном веб-домене.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, но его основное применение связано с персонализацией на основе данных пользователя.

CRAWLING & INDEXING (Системные данные)
Система должна иметь доступ к репозиторию объектов (например, индексу веб-страниц или товаров).

INDEXING (Данные пользователя)
Это ключевой этап для данного патента. Система собирает и обрабатывает данные о поведении пользователя (метрики взаимодействия) и его категоризированные content pointers. На этом этапе Model Builder создает и обновляет Relevance Model и Context Relevant Hierarchy.

QUNDERSTANDING – Понимание Запросов
Relevance Model используется для дополнения запросов пользователя контекстуальными ключевыми словами или предпочтениями (например, предпочитаемыми брендами или магазинами). Система также может генерировать запросы автоматически на основе текущего контекста просмотра ("One-click searching").

RANKING / RERANKING – Ранжирование и Переранжирование
На этом этапе модуль Relevance Processing применяет Relevance Model к набору результатов поиска. Результаты фильтруются и переранжируются на основе контекста пользователя, его истории и предпочтений, определенных поведенческими метриками.

Входные данные:

  • Поведение пользователя (dwell time, клики, покупки, повторные визиты).
  • Сохраненные content pointers и их категории.
  • Контент текущей просматриваемой страницы.
  • Запрос пользователя (если есть).
  • Данные профиля пользователя (предпочтения по брендам, размерам и т.д.).

Выходные данные:

  • Переранжированный список результатов поиска.
  • Персонализированные рекомендации.
  • Автоматически категоризированные content pointers.
  • Обновленная Relevance Model.

На что влияет

  • Конкретные ниши или тематики: Наибольшее влияние оказывается на сферу электронной коммерции (e-commerce) и связанные с ней домены.
  • Специфические запросы: Влияет на коммерческие и транзакционные запросы, где предпочтения пользователя имеют большое значение.
  • Конкретные типы контента: Страницы товаров, каталоги, страницы брендов.

Когда применяется

  • Триггеры активации: Система непрерывно отслеживает поведение пользователя для построения модели. Функции переранжирования и рекомендаций активируются во время выполнения поисковых запросов или при просмотре коммерческих доменов (особенно при использовании функции "One-click searching" или просмотре рекомендаций).
  • Временные рамки: Модель строится и обновляется постоянно на основе исторических данных и текущей сессии.

Пошаговый алгоритм

Процесс А: Построение и обновление модели релевантности (Непрерывный процесс)

  1. Сбор данных: Система отслеживает взаимодействие пользователя с сетевым интерфейсом. Записываются поведенческие метрики (dwell time, покупки, повторные визиты, время суток, тип устройства).
  2. Управление контентом: Пользователь сохраняет content pointers. Система (Auto Classifier) или пользователь категоризирует их в Context Relevant Hierarchy.
  3. Извлечение контекста: Система анализирует структуру и содержание иерархии для понимания интересов пользователя.
  4. Моделирование релевантности: Model Builder использует собранные поведенческие метрики и данные иерархии для создания или обновления Relevance Model.
  5. Адаптивное переопределение: Позиции объектов в Context Relevant Hierarchy адаптивно перестраиваются на основе Browsing Interaction Metric. Модель постоянно уточняется.

Процесс Б: Поиск и рекомендация (В реальном времени)

  1. Триггер: Пользователь вводит запрос, выполняет "One-click search" или просматривает веб-страницу.
  2. Определение контекста: Система определяет текущий Relevance Context на основе Relevance Model и/или контента текущей страницы.
  3. Генерация/Дополнение запроса: Генерируется ключевое слово (автоматически из контента страницы или на основе ввода пользователя). Запрос может быть дополнен данными из Relevance Model (например, предпочитаемые бренды).
  4. Извлечение объектов: Система извлекает набор объектов из репозитория.
  5. Обработка релевантности: Модуль Relevance Processing применяет Relevance Model к извлеченным объектам. Результаты фильтруются и переранжируются на основе предпочтений пользователя и поведенческих метрик.
  6. Представление результатов: Результаты отображаются пользователю в интерфейсе в соответствии с новым ранжированием.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании данных, генерируемых пользователем, для персонализации.

  • Поведенческие факторы (Ключевые): Явно указаны: время пребывания на странице (dwell time), количество повторных посещений (repeat visits), количество покупок (number of purchases). Также упоминаются клики мышью, сохранение закладок, время доступа к странице.
  • Контентные факторы: Контент просматриваемой в данный момент страницы используется для определения контекста и автоматической генерации ключевых слов для поиска.
  • Структурные факторы: Персонализированная категориальная иерархия (Context Relevant Hierarchy), созданная пользователем или системой для организации content pointers.
  • Пользовательские факторы: Тип устройства, местоположение (может быть выведено), время суток, время года. Также используются явные данные профиля пользователя (предпочтения по размерам, цветам, брендам).

Какие метрики используются и как они считаются

  • Relevance Context: Выводится из исторических записей взаимодействия и предпочитаемых объектов (Claim 2).
  • Browsing Interaction Metric (Метрика взаимодействия при просмотре): Агрегированная метрика, основанная на поведенческих факторах (dwell time, покупки и т.д.). Используется для адаптивной настройки позиций в иерархии (Claim 20).
  • Preference Metrics (Метрики предпочтения): Присваиваются коммерческим сайтам на основе длительности взаимодействия, объема покупок и других коммерческих метрик.

Конкретные формулы или алгоритмы расчета весов в патенте не приводятся. Механизм полагается на адаптивное моделирование и классификацию.

Выводы

  1. Поведенческие сигналы являются прямыми входными данными для персонализации: Патент явно подтверждает, что время пребывания на сайте (dwell time), совершенные покупки и повторные визиты являются сигналами, используемыми для определения релевантности и предпочтений пользователя.
  2. Персонализация основана на отслеживании поведения на разных доменах: Система (Relevance Engine) собирает данные о поведении пользователя не только на одном сайте, но и во всей сетевой среде, что позволяет создать более полную Relevance Model.
  3. Система активно изучает предпочтения пользователя: Модель релевантности изучает предпочитаемые бренды, продавцов и категории товаров на основе взаимодействия пользователя и использует эти данные для переранжирования результатов и дополнения запросов.
  4. Контекст может переопределять ключевые слова: Система способна выводить намерение пользователя на основе его истории и контекста текущей страницы, даже без явного ввода ключевых слов (механизм "One-click searching").
  5. Организация пользовательских данных помогает системе понять релевантность: То, как пользователь организует свои данные (например, закладки в Context Relevant Hierarchy), помогает системе понять его взгляд на тематическую релевантность и структуру информации.

Практика

Best practices (это мы делаем)

  • Оптимизация вовлеченности и удовлетворенности пользователей (UX/CRO): Поскольку dwell time является явным сигналом, необходимо создавать контент и интерфейсы, которые удерживают пользователя на сайте, минимизируют отказы и обеспечивают положительный опыт взаимодействия.
  • Стимулирование конверсий и покупок: Совершенные покупки (number of purchases) являются сильным сигналом предпочтения. Оптимизация воронки продаж и обеспечение бесшовного процесса покупки напрямую влияют на оценку релевантности сайта для данного пользователя.
  • Построение лояльности к бренду и стимулирование повторных визитов: Повторные визиты (repeat visits) также являются явным сигналом. Стратегии удержания клиентов (email-маркетинг, программы лояльности) способствуют повышению релевантности сайта в персонализированной выдаче.
  • Обеспечение четкой тематической релевантности: Создание качественного контента, который пользователи захотят сохранить (добавить в закладки или content pointers), помогает системе классифицировать сайт как авторитетный источник в данной тематике.
  • Оптимизация UX на разных устройствах: Патент учитывает тип устройства, используемого для доступа. Необходимо обеспечивать качественный пользовательский опыт на всех платформах (десктоп, мобильные устройства).

Worst practices (это делать не надо)

  • Использование кликбейта и контента низкого качества: Контент, который приводит к низкому dwell time и высокому показателю отказов, будет негативно влиять на Relevance Model пользователя в отношении данного сайта.
  • Фокус только на ключевых словах без учета интента: Игнорирование намерения пользователя и его удовлетворенности приведет к плохим поведенческим сигналам, что снизит релевантность в персонализированной выдаче.
  • Плохой пост-покупочный опыт: Сложности с возвратом, доставкой или поддержкой снижают вероятность повторных покупок и визитов, ослабляя сигналы предпочтения.

Стратегическое значение

Этот патент подтверждает критическую важность пользовательского опыта (UX) и поведенческих факторов в современном SEO, особенно в e-commerce. Успех определяется не только привлечением трафика, но и вовлечением, конверсией и удержанием пользователей. Механизмы, описанные в патенте, лежат в основе персонализации поиска, что означает, что результаты выдачи будут значительно различаться между пользователями в зависимости от их истории и предпочтений. Долгосрочная стратегия должна фокусироваться на построении бренда, которому доверяют и к которому возвращаются.

Практические примеры

Сценарий: Персонализация выдачи по запросу с множественным интентом

  1. Запрос пользователя: "Java".
  2. Анализ стандартной системой: Стандартная система может показать смешанные результаты: остров Ява, язык программирования Java, кофе Java.
  3. Анализ системой Relevance Engine: Система анализирует Relevance Model пользователя.
  4. Кейс А (Программист): История пользователя включает длительное пребывание (dwell time) на сайтах по программированию, сохраненные content pointers в категории "Разработка ПО", недавние покупки книг по Java. Система переранжирует выдачу, поднимая вверх результаты по языку программирования.
  5. Кейс Б (Любитель кофе): История пользователя включает повторные визиты (repeat visits) на сайты кофейных брендов и покупки (purchases) в интернет-магазине Starbucks. Система переранжирует выдачу, поднимая вверх результаты, связанные с кофе, и отдавая предпочтение Starbucks.
  6. Результат: Два пользователя видят разную выдачу по одному и тому же запросу, адаптированную под их интересы и историю поведения.

Вопросы и ответы

Какие конкретно поведенческие факторы упоминаются в этом патенте?

Патент явно перечисляет (Claim 27) следующие факторы, используемые для определения релевантности: время пребывания пользователя на странице (dwell time), количество повторных посещений (repeat visits), количество совершенных покупок (number of purchases) на определенном домене. Также учитываются контекстуальные факторы: время суток, время года и тип устройства, используемого для доступа.

Насколько важны поведенческие факторы для SEO согласно этому патенту?

Они критически важны, особенно в e-commerce. Патент описывает Relevance Engine, который использует эти метрики для построения персонализированной Relevance Model. Эта модель напрямую используется для переранжирования результатов поиска. Если сайт демонстрирует плохие поведенческие сигналы (низкий dwell time, отсутствие повторных визитов), его релевантность для данного пользователя будет снижена.

Что такое "Content Pointers" и как они влияют на поиск?

Content Pointers – это, по сути, закладки или сохраненные ссылки на объекты (страницы, товары). Система не только учитывает факт сохранения ссылки, но и анализирует, как пользователь их организует (Context Relevant Hierarchy). Эта организация помогает системе понять контекст и тематические интересы пользователя, что используется для уточнения запросов и ранжирования.

Патент подан в 2001 году. Актуален ли он сейчас?

Хотя интерфейс (SideCart) может выглядеть устаревшим, базовые принципы отслеживания поведения, использования истории браузера и поведенческих метрик для персонализации поиска являются фундаментальными и высоко актуальными сегодня. Современные системы персонализации Google, вероятно, используют гораздо более сложные, но концептуально схожие механизмы для анализа данных пользователей (например, через Chrome, Android).

Что такое "One-click searching", описанный в патенте?

Это механизм (Claim 3), позволяющий системе инициировать поиск без ввода ключевых слов пользователем. Когда пользователь находится на определенной странице, система анализирует ее контент и сопоставляет его с Relevance Model пользователя, чтобы автоматически сгенерировать запрос и найти релевантные объекты или рекомендации. Это демонстрирует способность системы выводить интент из контекста.

Учитывает ли система поведение пользователя только на моем сайте?

Нет, это ключевой момент патента. Система предназначена для отслеживания поведения пользователя в сетевой среде в целом (кросс-доменное отслеживание). Она анализирует взаимодействие с различными коммерческими доменами, чтобы определить общие предпочтения пользователя (например, предпочитаемые магазины или бренды), а не только его активность на одном конкретном сайте.

Как система определяет предпочтения по брендам или магазинам?

Система определяет предпочтения путем анализа поведенческих метрик, связанных с конкретными доменами или брендами. Например, если пользователь часто посещает сайт определенного магазина (repeat visits), проводит там много времени (dwell time) и совершает покупки (purchases), система присваивает этому магазину высокий показатель предпочтения в Relevance Model пользователя.

Как этот патент влияет на стратегию контент-маркетинга?

Он подчеркивает необходимость создания контента, который действительно вовлекает пользователя и решает его задачи. Контент должен быть достаточно ценным, чтобы пользователь захотел его сохранить (создать Content Pointer) и вернуться к нему позже. Фокус смещается с простого привлечения клика на удержание внимания (повышение dwell time).

Что такое "Relevance Model"?

Это персонализированная модель данных, которая хранит информацию о предпочтениях, истории активности и контексте пользователя. Она адаптивно обновляется на основе Browsing Interaction Metric. Эта модель является ядром системы и используется для всех задач персонализации, включая дополнение запросов и переранжирование результатов.

Как SEO-специалисту использовать знание этого патента на практике?

Необходимо сместить фокус с традиционных факторов ранжирования на оптимизацию пользовательского опыта (UX) и конверсий (CRO). Важно анализировать и улучшать поведенческие метрики: увеличивать время на сайте, снижать показатель отказов, работать над удержанием клиентов и стимулировать повторные визиты и покупки. Это напрямую повлияет на релевантность сайта в персонализированной выдаче.

Похожие патенты

Как Google использует историю поиска и браузинга для персонализации выдачи и определения предпочтений пользователя
Google записывает и анализирует историю действий пользователя: запросы, клики по результатам и рекламе, посещенные страницы. Система группирует связанные действия в сессии, определяет "Предпочитаемые локации" на основе частоты и времени визитов (stay-time), и использует эту историю для изменения порядка ранжирования, повышая позиции ранее посещенных сайтов в персональной выдаче.
  • US20060224583A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует историю поиска и браузера для персонализации выдачи и определения предпочтений пользователя
Google записывает историю поиска, кликов по результатам и рекламе, а также посещенные сайты в централизованную базу данных пользователя. Эта информация используется для модификации поисковой выдачи: повышения позиций ранее посещенных сайтов, предложения связанных запросов и определения "предпочтительных местоположений" (избранного). Система позволяет пользователю контролировать сбор данных (подписка) и объединять историю с разных устройств.
  • US7747632B2
  • 2010-06-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю поиска и браузинга для персонализации выдачи и создания неявного "Избранного"
Google записывает историю поиска и просмотров пользователя для персонализации результатов. Система определяет "предпочтительные сайты" на основе частоты посещений, кликов и времени на сайте, повышая их в выдаче для этого пользователя. Патент также описывает объединение предпочтений пользователя с предпочтениями других людей для формирования комбинированного рейтинга.
  • US20060224608A1
  • 2006-10-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует историю браузера пользователя для персонализации и переранжирования результатов поиска
Google использует локально сохраненную историю посещений пользователя для изменения стандартной поисковой выдачи. Система отслеживает, какие документы пользователь посещал ранее, как часто и как долго. При последующих поисках ранее посещенные сайты агрессивно повышаются в выдаче или добавляются в нее, обеспечивая персонализированный результат, основанный на предыдущем поведении пользователя.
  • US7730054B1
  • 2010-06-01
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует закладки, историю посещений и поведение пользователей для персонализации поиска и таргетинга рекламы
Патент Google, описывающий фундаментальный механизм персонализации поиска. Система объединяет результаты из глобального индекса с результатами из персонального индекса пользователя (закладки, аннотации, история посещений). Ранжирование корректируется на основе явных оценок пользователя и неявных поведенческих сигналов (частота визитов, время на сайте). Эти же данные используются для таргетинга рекламы.
  • US7523096B2
  • 2009-04-21
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google анализирует распределение качества входящих ссылок для классификации и понижения сайтов в выдаче
Google использует систему для оценки качества ссылочного профиля сайта. Система фильтрует входящие ссылки (удаляя шаблонные и дублирующиеся с одного домена), группирует оставшиеся по качеству источника (например, Vital, Good, Bad) и вычисляет взвешенный «Link Quality Score». Если доля низкокачественных ссылок слишком велика, сайт классифицируется как низкокачественный и понижается в результатах поиска.
  • US9002832B1
  • 2015-04-07
  • Ссылки

  • Антиспам

  • SERP

Как Google использует клики пользователей для определения составных фраз (N-грамм) в запросах
Google анализирует, какие результаты поиска выбирают пользователи, чтобы понять, являются ли последовательные слова в запросе единой фразой (например, "Нью Йорк") или отдельными терминами. Если пользователи преимущественно кликают на результаты, содержащие эту последовательность как неразрывную фразу, система определяет ее как составную (Compound) и использует это знание для улучшения ранжирования и понимания запроса.
  • US8086599B1
  • 2011-12-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google кластеризует похожие страницы, анализируя, куда пользователи переходят дальше (Co-visitation)
Google анализирует навигационные пути пользователей для определения схожести документов. Если после просмотра Страницы А и Страницы Б пользователи часто переходят к одному и тому же набору последующих страниц, Google считает Страницу А и Страницу Б похожими и объединяет их в кластер. Этот механизм позволяет определять тематическую близость на основе поведения пользователей.
  • US8650196B1
  • 2014-02-11
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google рассчитывает авторитетность страниц на основе их близости к доверенным сайтам-источникам (Seed Sites)
Google использует метод ранжирования страниц, основанный на измерении «расстояния» в ссылочном графе от набора доверенных исходных сайтов (Seed Sites) до целевой страницы. Чем короче путь от доверенных источников до страницы, тем выше ее рейтинг авторитетности. Длина ссылки увеличивается (а ее ценность падает), если исходная страница имеет большое количество исходящих ссылок. Этот механизм позволяет эффективно рассчитывать показатели доверия (Trust) в масштабах всего веба.
  • US9165040B1
  • 2015-10-20
  • Ссылки

  • EEAT и качество

  • Антиспам

Как Google использует контекст текущей сессии и поведение похожих пользователей для персонализации и переранжирования выдачи
Google анализирует недавнюю активность пользователя (запросы и клики в рамках сессии), чтобы определить его краткосрочный интерес. Система сравнивает, как другие пользователи с таким же интересом взаимодействовали с результатами по текущему запросу, по сравнению с общим поведением. Если предпочтения статистически значимо различаются, Google переранжирует выдачу, повышая результаты, предпочитаемые «похожей» аудиторией, учитывая при этом время взаимодействия с контентом (Dwell Time).
  • US8972391B1
  • 2015-03-03
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google идентифицирует экспертов на основе их активности и позволяет фильтровать выдачу по их контенту
Google использует систему для идентификации людей (членов социальной сети), тесно связанных с темой запроса, на основе их активности (посты, взаимодействия, репосты) и квалификации. Система отображает этих людей в специальных блоках (Display Areas) рядом с результатами поиска, позволяя пользователям просматривать их профили или фильтровать выдачу, чтобы увидеть только контент, созданный, одобренный или прокомментированный этими экспертами.
  • US9244985B1
  • 2016-01-26
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
  • US7580929B2
  • 2009-08-25
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

seohardcore