SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта

SCORING SITE QUALITY (Оценка качества сайта)
  • US9195944B1
  • Google LLC
  • 2013-02-25
  • 2015-11-24
  • Поведенческие сигналы
  • Индексация
  • SERP
  • Техническое SEO
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.

Описание

Какую проблему решает

Патент решает задачу определения объективной, основанной на поведении пользователей, оценки качества сайта (Site Quality Score). Цель — создать независимый от запроса (query-independent) показатель полезности (usefulness) информации, представленной на ресурсах сайта. Этот показатель позволяет улучшить ранжирование, отдавая предпочтение сайтам, с которыми пользователи дольше взаимодействуют, и помогает принимать решения о сканировании и индексировании контента.

Что запатентовано

Запатентована система для определения оценки качества сайта на основе агрегированных измерений продолжительности визитов пользователей (durations of user visits) на ресурсы этого сайта. Ключевым элементом является вычисление статистического показателя, в частности, меры центральной тенденции (measure of central tendency — например, среднего или медианы) из этих измерений. Система использует различные источники данных о визитах, включая время от клика по результату поиска до возврата на страницу выдачи (Dwell Time).

Как это работает

Система собирает данные о продолжительности визитов пользователей на различные страницы сайта. Собранные данные проходят обработку: отбрасываются подозрительные визиты (используя User Model), слишком короткие визиты могут игнорироваться (ниже минимального порога), а слишком длинные — ограничиваться максимальным значением. Также применяется нормализация в зависимости от типа контента (например, видео или изображение). Из обработанного набора данных вычисляется статистический показатель (например, медиана), который становится Site Quality Score.

Актуальность для SEO

Высокая. Метрики вовлеченности пользователей и качество пользовательского опыта являются критически важными факторами ранжирования в Google. Использование поведенческих сигналов, таких как Dwell Time, для оценки качества сайта полностью соответствует современной стратегии Google по предоставлению полезного контента (Helpful Content) и оценке удовлетворенности пользователей.

Важность для SEO

Патент имеет критическое значение (9/10) для SEO. Он описывает конкретный механизм, как Google использует агрегированные поведенческие факторы для оценки качества всего сайта. Это подчеркивает важность оптимизации не только релевантности, но и пользовательского опыта, скорости загрузки и глубины проработки темы для удержания внимания пользователя. Если сайт не способен удовлетворить интент, его Site Quality Score будет низким, что негативно скажется на ранжировании всех его страниц и может повлиять на индексирование.

Детальный разбор

Термины и определения

Site (Сайт)
Коллекция интернет-ресурсов. Патент определяет сайт операционно: это могут быть ресурсы в определенном домене (например, example.com), поддомене (например, www.example.com), поддиректории (например, example.com/subdirectory/) или ресурсы, размещенные на определенном сервере.
Site Quality Score (Оценка качества сайта)
Метрика, рассчитываемая для сайта, представляющая меру его качества. Определяется на основе продолжительности визитов пользователей. Является независимым от запроса (query-independent) показателем полезности сайта.
Duration of user visit (Продолжительность визита пользователя)
Измерение времени, которое пользователь проводит на ресурсе. Может измеряться разными способами, например, как время между запросом одного ресурса и запросом следующего.
Dwell Time (Время пребывания)
Конкретный тип измерения продолжительности визита, явно указанный в Claims: время, которое проходит между кликом пользователя по результату поиска и возвращением пользователя на страницу результатов поиска.
Statistical Measure (Статистический показатель)
Значение, характеризующее набор данных о продолжительности визитов. Используется для расчета Site Quality Score.
Measure of Central Tendency (Мера центральной тенденции)
Тип статистического показателя. Примеры включают среднее арифметическое, геометрическое или гармоническое (mean), медиану (median) или моду (mode) продолжительности визитов.
Resource Type (Тип ресурса)
Классификация ресурса на основе его контента (например, изображение, видео, текст). Используется для нормализации измерений продолжительности визита.
User Model (Модель пользователя)
Модель, описывающая ожидаемое поведение пользователя. Используется для выявления подозрительного или неестественного поведения (например, аномальное распределение кликов, частоты кликов, подозрительные User Agents или возраст Cookies) и исключения таких данных из расчета.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод определения оценки качества сайта.

  1. Система получает измерения продолжительности визитов (measurements of durations) множества пользователей на множество ресурсов определенного сайта (домена, поддомена, директории).
  2. Измерения включают данные о времени, прошедшем между кликом пользователя по ссылке на ресурс в результатах поиска и возвратом пользователя на страницу результатов поиска (Dwell Time).
  3. Система определяет Site Quality Score для этого сайта на основе этих измерений.
  4. Определение оценки включает вычисление статистического показателя (statistical measure), который является мерой центральной тенденции (measure of central tendency).

Ядро изобретения — использование агрегированного Dwell Time (и других измерений продолжительности визита) и применение статистических методов (среднее/медиана) для вывода оценки качества на уровне всего сайта.

Claim 5 (Зависимый): Уточняет фильтрацию данных.

  • Система отбрасывает измерения продолжительности, которые ниже определенного порогового значения (specified threshold value).

Очень короткие визиты (быстрые отказы) могут не учитываться в расчете, так как предполагается, что пользователь не успел оценить контент.

Claim 6 (Зависимый): Уточняет обработку аномалий.

  • Система корректирует измерения, превышающие заранее определенное максимальное значение (pre-determined maximum value), устанавливая их равными этому максимальному значению.

Это защищает от искажения статистики из-за экстремально долгих сессий (например, открытых вкладок).

Claim 7 (Зависимый): Уточняет нормализацию по типу контента.

  • Система классифицирует ресурсы по типам (resource types) и корректирует измерения продолжительности на основе веса (weight), присвоенного типу этого ресурса.

Это позволяет учитывать, что взаимодействие с изображением обычно короче, чем с видео или лонгридом.

Claim 9 (Зависимый): Уточняет фильтрацию спама.

  • Система отбрасывает измерения, классифицированные как подозрительные с помощью модели пользователя (user model).

Это механизм защиты от накруток поведенческих факторов.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя данные о поведении пользователей для влияния на индексирование и ранжирование.

CRAWLING и INDEXING – Сканирование и Индексирование
В патенте прямо указано, что Site Quality Score может использоваться для определения того, являются ли ресурсы на сайте достаточно качественными для сканирования (crawled), обновления (refreshed) или добавления в индекс (added to an index). Indexing Engine может использовать эту оценку для приоритизации ресурсов.

RANKING – Ранжирование
Основное применение. Site Quality Score используется Ranking Engine как сигнал ранжирования. Оценка используется как независимый от запроса сигнал (query-independent measure) качества. Она может применяться как фактор (term) при расчете итоговых оценок ранжирования для ресурсов этого сайта.

Обработка данных (Data Processing)
Расчет Site Quality Score (включая сбор, фильтрацию, нормализацию и агрегацию данных о визитах), вероятно, происходит в офлайн или пакетном режиме компонентом Site Scoring Engine на основе собранных Site Data.

Входные данные:

  • Набор измерений продолжительности визитов (Dwell Time и другие) для ресурсов сайта.
  • Данные для фильтрации (IP адреса, cookies, User Agents, паттерны кликов).
  • Классификация ресурсов по типам (Resource Types).
  • Пороговые значения (минимум, максимум).

Выходные данные:

  • Site Quality Score для сайта (или домена/поддомена/директории).

На что влияет

  • Все типы контента и запросов: Поскольку оценка применяется на уровне сайта и является независимой от запроса, она влияет на все страницы сайта по всем типам запросов.
  • Нормализация контента: Влияние варьируется в зависимости от типа контента. Система нормализует данные, признавая, что ожидаемое время взаимодействия с видео отличается от времени взаимодействия с текстом или изображением.
  • Структура сайта: Патент позволяет применять оценку не только ко всему домену, но и к поддоменам или поддиректориям. Это означает, что качество разных разделов крупного сайта может оцениваться дифференцированно.

Когда применяется

  • Условия работы: Алгоритм применяется при наличии достаточного объема статистических данных о визитах пользователей на ресурсы сайта.
  • Частота применения: Расчет Site Quality Score происходит периодически по мере накопления новых данных о визитах (например, за день, неделю, месяц). Использование оценки происходит во время ранжирования или при планировании индексирования.
  • Пороговые значения: Применяются пороги для фильтрации данных: минимальная продолжительность визита и максимальная продолжительность визита (например, 5, 10, 30 минут). Эти пороги также могут зависеть от типа или длины ресурса.

Пошаговый алгоритм

Процесс расчета Site Quality Score

  1. Сбор данных о визитах: Система получает измерения продолжительности визитов пользователей на ресурсы определенного сайта за определенный период. Источники включают Dwell Time из SERP, данные браузеров, сетевой трафик, данные серверов.
  2. Фильтрация подозрительной активности: Применяется User Model для анализа поведения (паттерны кликов, частота кликов, User Agents, IP, cookies). Измерения, классифицированные как подозрительные (suspicious) или неестественные, отбрасываются.
  3. Фильтрация по порогам (Минимум): Измерения продолжительности визита, которые ниже установленного минимального порога, отбрасываются. Порог может зависеть от типа ресурса.
  4. Ограничение по порогам (Максимум): Измерения, превышающие установленное максимальное значение, корректируются до этого максимального значения (capping). Максимум также может зависеть от типа ресурса.
  5. Нормализация по типу контента (Опционально): Измерения корректируются на основе весов, присвоенных различным типам ресурсов (Resource Types). Например, продолжительность визита на страницу с видео может быть нормализована иначе, чем на страницу с изображением.
  6. Агрегация и расчет метрики: Из обработанного набора измерений вычисляется статистический показатель. Это мера центральной тенденции (measure of central tendency) — например, медиана или среднее значение (арифметическое, геометрическое, гармоническое) продолжительности визита.
  7. Определение Site Quality Score: Вычисленный статистический показатель становится оценкой качества сайта.
  8. Применение оценки: Site Quality Score сохраняется и используется Ranking Engine и Indexing Engine.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании поведенческих данных для оценки качества.

  • Поведенческие факторы: Это основные данные для алгоритма.
    • Продолжительность визита (Duration of user visit).
    • Dwell Time (время от клика в SERP до возврата в SERP).
    • Данные о кликах (позиции кликов, частота кликов в минуту/час/день) — используются для User Model.
  • Пользовательские факторы: Используются для фильтрации и валидации данных (User Model).
    • IP адреса.
    • Cookies (и их возраст).
    • User Agents.
  • Контентные/Структурные факторы: Используются для нормализации.
    • Тип ресурса (Resource Type): текст, изображение, видео.
    • Длина ресурса (например, количество слов для текста или длительность для видео) — может использоваться для установки порогов.

Какие метрики используются и как они считаются

  • Site Quality Score: Итоговая метрика качества сайта. Рассчитывается как статистический показатель (например, среднее или медиана) от обработанных измерений продолжительности визитов.
  • Минимальный порог продолжительности (Threshold Value): Пороговое значение времени. Визиты короче этого порога отбрасываются.
  • Максимальное значение продолжительности (Maximum Value): Предельное значение времени (например, 10 минут). Визиты длиннее этого значения ограничиваются им.
  • Веса типов ресурсов (Weights): Коэффициенты, используемые для корректировки измерений в зависимости от типа контента.
  • Метрики User Model: Внутренние метрики для оценки естественности поведения пользователя и классификации визитов как подозрительных.

Выводы

  1. Агрегированные поведенческие факторы как мера качества сайта: Патент подтверждает использование агрегированных данных о продолжительности взаимодействия пользователей (включая Dwell Time) для формирования оценки качества всего сайта (Site Quality Score). Это независимый от запроса сигнал.
  2. Важность удержания пользователя: Качество сайта напрямую коррелирует со способностью сайта удовлетворять информационные потребности пользователя и удерживать его внимание. Сайты, на которых пользователи проводят больше времени (в рамках разумных пределов), оцениваются выше.
  3. Сложная фильтрация и нормализация данных: Google не использует сырые данные. Система активно фильтрует шум: отбрасывает подозрительные визиты (защита от накруток с помощью User Model), игнорирует слишком короткие визиты и ограничивает слишком длинные. Это делает метрику надежной.
  4. Учет типа контента: Система понимает разницу в паттернах потребления разного контента. Время взаимодействия нормализуется в зависимости от типа ресурса (текст, видео, изображение), чтобы обеспечить справедливое сравнение.
  5. Влияние на Индексирование и Ранжирование: Site Quality Score используется двояко: как сигнал для ранжирования страниц сайта и как фактор для принятия решений о необходимости сканирования, обновления или индексирования ресурсов сайта. Низкое качество может привести к проблемам с индексацией.
  6. Гранулярность оценки: Оценка качества может рассчитываться не только для домена в целом, но и для отдельных поддоменов или директорий, что позволяет Google дифференцированно оценивать разные разделы крупных сайтов.

Практика

Best practices (это мы делаем)

  • Оптимизация удовлетворенности пользователя (Intent Satisfaction): Фокусируйтесь на полном удовлетворении интента пользователя. Контент должен быть исчерпывающим и полезным, чтобы у пользователя не было необходимости возвращаться в выдачу (минимизация Pogosticking). Это увеличивает Dwell Time.
  • Улучшение пользовательского опыта (UX) и скорости загрузки: Технические проблемы, медленная загрузка, навязчивая реклама или плохая навигация приводят к быстрым отказам и уменьшают продолжительность визита. Оптимизация Core Web Vitals и общего UX напрямую влияет на метрики, описанные в патенте.
  • Немедленное вовлечение: Оптимизируйте первый экран так, чтобы пользователь сразу понимал, что нашел нужное. Это критично, чтобы преодолеть минимальный порог продолжительности визита, упомянутый в патенте.
  • Повышение вовлеченности и глубины просмотра: Используйте качественную внутреннюю перелинковку, интерактивные элементы и разнообразные типы контента (видео, инфографика), чтобы мотивировать пользователя дольше оставаться на сайте.
  • Мониторинг поведенческих метрик: Анализируйте среднюю продолжительность сеанса и показатель отказов в системах аналитики как прокси-метрики для Dwell Time. Выявляйте зоны с низкой вовлеченностью и улучшайте их.

Worst practices (это делать не надо)

  • Использование кликбейта: Привлечение трафика с помощью заголовков, не соответствующих содержанию, приведет к коротким визитам (низкий Dwell Time). Это негативно скажется на Site Quality Score.
  • Создание поверхностного контента (Thin Content): Страницы, которые не дают достаточной информации по теме, не смогут удержать пользователя.
  • Игнорирование технических проблем и агрессивная реклама: Плохой технический опыт и элементы, мешающие потреблению контента (например, interstitials), ведут к быстрым отказам.
  • Попытки искусственного увеличения времени на сайте: Накрутка поведенческих факторов неэффективна. Патент описывает User Model для выявления подозрительной активности и неестественного поведения, которые фильтруются при расчете оценки.

Стратегическое значение

Этот патент подчеркивает стратегическую важность смещения фокуса с традиционных SEO-метрик на метрики качества и удовлетворенности пользователей. Site Quality, основанная на поведении, является мощным фактором ранжирования. Долгосрочная стратегия должна быть направлена на создание сайта, который обеспечивает как глубину контента, так и превосходный пользовательский опыт. Это также подтверждает, что Google способен оценивать качество на гранулярном уровне (поддомены, директории), что важно учитывать при работе с крупными порталами.

Практические примеры

Сценарий 1: Оптимизация статьи для увеличения Dwell Time

  1. Анализ: Информационная статья имеет высокий показатель отказов и низкое среднее время на странице. Пользователи быстро возвращаются в поиск.
  2. Действия:
    • Улучшить первый экран: Добавить краткое содержание (Table of Contents) и четкий, информативный вводный абзац.
    • Повысить читабельность и структурировать контент.
    • Добавить ценность: Включить сравнительные таблицы, инфографику и короткое релевантное видео.
    • Оптимизировать скорость загрузки страницы.
  3. Ожидаемый результат: Пользователи проводят больше времени за изучением контента. Агрегированные данные о продолжительности визитов улучшаются, что положительно влияет на Site Quality Score этого раздела сайта.

Сценарий 2: Улучшение качества раздела E-commerce

  1. Анализ: Основные товарные категории /catalog/ интернет-магазина имеют низкую продолжительность сессий по сравнению с блогом /blog/.
  2. Действия:
    • Улучшить страницы категорий: Добавить полезные фильтры, сортировки и краткие описания товаров.
    • Улучшить карточки товаров: Добавить качественные изображения, подробные описания, отзывы покупателей и видеообзоры.
  3. Ожидаемый результат: Пользователи проводят больше времени, выбирая товары. Google может рассчитать отдельный Site Quality Score для /catalog/ и, по мере улучшения метрик вовлеченности, повысить ранжирование страниц этого раздела.

Вопросы и ответы

Является ли этот патент подтверждением того, что Dwell Time является фактором ранжирования?

Да, это одно из самых прямых подтверждений. Claim 1 явно указывает на использование времени между кликом по результату поиска и возвратом к выдаче (Dwell Time) как источника данных для расчета Site Quality Score. Этот score затем используется для ранжирования ресурсов сайта и принятия решений об их индексировании.

Как Google защищается от накрутки времени пребывания на сайте?

Патент описывает несколько механизмов защиты. Во-первых, используется User Model для выявления неестественного поведения (аномальные паттерны кликов, подозрительные IP, User Agents, возраст Cookies). Во-вторых, система ограничивает максимальную учитываемую продолжительность визита (capping), чтобы экстремально долгие сессии не искажали статистику.

Как система обрабатывает очень короткие визиты (быстрые отказы)?

Патент предлагает отбрасывать измерения продолжительности, которые ниже определенного порога (specified threshold value). Считается, что пользователь не успел оценить контент за это время. Это означает, что быстрые отказы могут быть просто проигнорированы при расчете среднего/медианы, но большое их количество уменьшает общий объем положительных сигналов для сайта.

Как система учитывает разницу между страницей с коротким ответом и лонгридом или видео?

Патент предусматривает нормализацию данных. Система классифицирует ресурсы по типам (Resource Types) и может применять к ним разные веса или разные пороговые значения (минимальные и максимальные). Также упоминается возможность учета длины ресурса (например, количества слов или продолжительности видео) при установке порогов.

Может ли низкий Site Quality Score привести к проблемам с индексацией?

Да, в патенте прямо говорится, что Site Quality Score может использоваться для определения того, следует ли сканировать, обновлять или добавлять ресурсы сайта в индекс. Если качество сайта систематически низкое (пользователи не находят его полезным), Google может снизить приоритет его сканирования или исключить часть контента из индекса.

Если у меня крупный портал, будет ли плохой раздел тянуть вниз весь сайт?

Не обязательно. Патент определяет "сайт" гибко: это может быть домен, поддомен или поддиректория. Это предполагает, что Google может рассчитывать Site Quality Score гранулярно для разных разделов. Например, качественный блог на поддомене может иметь высокую оценку, даже если основной форум на домене имеет низкую вовлеченность.

Что означает "Мера центральной тенденции" в контексте расчета оценки?

Это статистический метод агрегации данных. На практике это означает, что Site Quality Score, скорее всего, рассчитывается как среднее (mean) или медиана (median) продолжительности всех валидных визитов на сайт. Использование медианы делает оценку более устойчивой к выбросам, чем простое среднее арифметическое.

Означает ли это, что показатель отказов (Bounce Rate) из Google Analytics используется Google для ранжирования?

Нет, патент не говорит об использовании данных сторонних систем аналитики. Google измеряет продолжительность визитов самостоятельно (через SERP, браузеры, сеть). Хотя высокий Bounce Rate в аналитике часто коррелирует с низким Dwell Time, Google полагается на собственные метрики.

Что важнее: среднее время на странице или средняя продолжительность сеанса?

Патент фокусируется на измерениях продолжительности визитов на отдельные ресурсы (user visits to resources), но агрегирует их для оценки сайта в целом. Это ближе к агрегированному Dwell Time. Однако система стремится оценить общую полезность сайта, поэтому любые действия, повышающие качественное взаимодействие пользователя с сайтом, будут полезны.

Применяется ли этот механизм только к данным из поиска Google?

Хотя основным примером является измерение Dwell Time из поиска, патент также упоминает возможность получения данных из других источников. Это могут быть данные от пользовательских устройств (например, браузеров или тулбаров), систем мониторинга сети (прокси, роутеры) или непосредственно с серверов, на которых размещены ресурсы.

Похожие патенты

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google персонализирует поисковую выдачу, анализируя историю кликов и поведение пользователя на сайте
Google использует механизм для персонализации поисковой выдачи на основе истории взаимодействия пользователя с результатами поиска. Система отслеживает, какие сайты пользователь выбирает, как долго он на них остается (Dwell Time), частоту и контекст выбора. Основываясь на этих данных, предпочитаемые пользователем ресурсы повышаются в ранжировании при его последующих запросах.
  • US9037581B1
  • 2015-05-19
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google нормализует поведенческие сигналы (Dwell Time), калибруя показатели «короткого» и «длинного» клика для разных категорий сайтов
Google использует механизм для устранения предвзятости в поведенческих сигналах, таких как продолжительность клика (Dwell Time). Поскольку пользователи взаимодействуют с разными типами контента по-разному, система определяет, что считать «коротким кликом» и «длинным кликом» отдельно для каждой категории (например, Новости, Недвижимость, Словари). Это позволяет более точно оценивать качество ресурса, сравнивая его показатели с нормами его конкретной ниши.
  • US8868565B1
  • 2014-10-21
  • Поведенческие сигналы

  • SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google использует поведенческие данные (Dwell Time) для оценки качества страниц и генерации превью в поиске
Google патентует систему "вспомогательного браузинга", которая активируется на странице результатов поиска (SERP) при проявлении интереса к ссылке. Система показывает текстовый сниппет и оценку интереса предыдущих пользователей, рассчитанную на основе имплицитных поведенческих сигналов, таких как время пребывания на странице (Linger Time/Dwell Time), повторные визиты и клики.
  • US7516118B1
  • 2009-04-07
  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google использует «Локальный авторитет» для переранжирования документов на основе их взаимосвязей внутри конкретной выдачи
Google может улучшить ранжирование, анализируя структуру ссылок внутри начального набора результатов поиска. Документы, на которые часто ссылаются другие высокорелевантные документы по этому же запросу («локальные эксперты»), получают повышение. Этот процесс включает строгие фильтры для обеспечения независимости этих ссылок-голосов.
  • US6526440B1
  • 2003-02-25
  • Ссылки

  • Антиспам

  • SERP

Как Google определяет географическую релевантность сайта по локали ссылающихся на него ресурсов и их аудитории
Google использует географические сигналы ссылающихся сайтов для определения локальной релевантности целевого домена. Система анализирует контент, технические данные и, что важно, географию аудитории ссылающихся ресурсов, чтобы вычислить «Link Based Locale Score». Эта оценка комбинируется с собственными сигналами сайта и используется для повышения позиций в релевантных географических регионах.
  • US8788490B1
  • 2014-07-22
  • Local SEO

  • Ссылки

  • SERP

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google персонализирует поиск, повышая в выдаче объекты, которые пользователь ранее явно отметил как интересные
Google использует механизм персонализации поисковой выдачи. Если пользователь явно отметил определенный объект (например, место, компанию, веб-страницу) как интересующий его, этот объект получит значительное повышение в ранжировании при последующих релевантных запросах этого пользователя. Уровень повышения зависит от степени интереса, указанной пользователем.
  • US20150242512A1
  • 2015-08-27
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс
Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.
  • US8255386B1
  • 2012-08-28
  • Индексация

  • Поведенческие сигналы

Как Google определяет свежесть документа, анализируя возраст ссылающихся страниц и динамику появления ссылок (Link Velocity)
Google использует методы для оценки свежести документа, когда дата его обновления неизвестна или ненадежна. Система анализирует даты обновления страниц, которые ссылаются на документ, а также историю появления и удаления этих ссылок (Link Velocity). Если на документ ссылаются недавно обновленные страницы или количество ссылок растет, он считается свежим.
  • US7797316B2
  • 2010-09-14
  • Свежесть контента

  • Ссылки

  • Техническое SEO

seohardcore