SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует данные о посещаемости, уникальных пользователях и длине URL для ранжирования документов

METHODS AND APPARATUS FOR EMPLOYING USAGE STATISTICS IN DOCUMENT RETRIEVAL (Методы и аппаратура для использования статистики использования при поиске документов)
  • US8001118B2
  • Google LLC
  • 2001-03-02
  • 2011-08-16
  • Поведенческие сигналы
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Фундаментальный патент Google, описывающий использование поведенческих факторов в ранжировании. Система рассчитывает Usage Score на основе частоты посещений и количества уникальных пользователей, фильтруя ботов и взвешивая данные по географии. Этот балл комбинируется с текстовой релевантностью (IR Score) и длиной URL (Path Length Score) для определения итоговой позиции документа.

Описание

Какую проблему решает

Патент решает ограничения традиционных методов ранжирования. Он указывает, что методы, основанные на терминах (term-based methods), подвержены манипуляциям со стороны веб-мастеров. Методы, основанные на ссылках (link-based methods), ставят новые страницы в невыгодное положение, так как у них меньше входящих ссылок. Изобретение направлено на улучшение определения важности документа путем включения объективных данных о взаимодействии пользователей (usage statistics).

Что запатентовано

Запатентована система для интеграции статистики использования в алгоритм ранжирования. Суть изобретения заключается в расчете Usage Score, который базируется на комбинации двух ключевых метрик: частоты посещений документа (Frequency of Visit, VF) и количества уникальных пользователей (Unique Users, UU), посетивших этот документ. Этот Usage Score используется для модификации итогового ранжирования.

Как это работает

Система собирает и обрабатывает данные об использовании документов:

  • Сбор данных: Фиксируется количество посещений и уникальные пользователи (по IP, cookies и т.д.).
  • Фильтрация: Удаляются посещения от автоматизированных агентов (ботов) или аффилированных лиц.
  • Взвешивание: Посещениям могут присваиваться разные веса в зависимости от характеристик пользователя или визита (например, географии, истории браузера).

Затем система рассчитывает Usage Score, комбинируя оценки VF и UU. В одном из вариантов также учитывается Path Length Score (оценка длины пути URL). Итоговый рейтинг определяется путем комбинирования этого Usage Score с традиционной оценкой релевантности (IR score).

Актуальность для SEO

Высокая (концептуально). Патент подан в 2001 году ключевыми инженерами Google (включая Джеффа Дина). Конкретные формулы и константы (например, MAXVF=2000), вероятно, устарели. Однако основная концепция — использование фильтрованных и взвешенных метрик вовлеченности пользователей в качестве прямого сигнала ранжирования — является фундаментальной для современных поисковых систем.

Важность для SEO

Патент имеет критическое стратегическое значение (9/10). Он формализует использование поведения пользователей как прямого фактора ранжирования. Это подтверждает, что релевантность определяется не только контентом и ссылками, но и тем, как реальные пользователи взаимодействуют с документом. SEO-стратегии должны быть направлены на привлечение качественного трафика и удовлетворение пользователей, а не на генерацию искусственных сигналов.

Детальный разбор

Термины и определения

Usage Statistics (Статистика использования)
Данные о взаимодействии пользователей с документом. Включают частоту посещений и количество уникальных пользователей.
Usage Score (Оценка использования)
Агрегированная оценка, рассчитываемая на основе Usage Statistics. Используется как фактор ранжирования.
IR Score (Information Retrieval Score)
Стандартная оценка релевантности документа запросу, основанная на анализе терминов (текстовая релевантность).
Frequency of Visit (VF) (Частота посещений)
Количество посещений документа за определенный период (например, месяц). Может быть абсолютным значением или изменением во времени.
Unique Users (UU) (Уникальные пользователи)
Количество уникальных хостов/IP/пользователей, которые обращались к документу за период.
MAXVF / MAXUU
Предопределенные константы для нормализации оценок VF и UU. В примере патента MAXVF=2000, MAXUU=400.
Path Length (PL) (Длина пути)
Метрика, основанная на структуре URL. В примере это количество символов "/" в пути документа.
Path Length Score (Оценка длины пути)
Оценка, основанная на PL. Более короткие пути получают более высокую оценку.
Filtering (Фильтрация)
Процесс очистки сырых данных. Например, удаление посещений автоматизированных агентов (ботов) или аффилированных лиц.
Weighting (Взвешивание)
Процесс присвоения разной значимости посещениям или пользователям на основе их характеристик (например, географии, истории браузера).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод организации документов.

  1. Идентификация документов, релевантных запросу.
  2. Доступ к usage information, которая включает ДВА компонента: (i) значение частоты посещений (frequency of visit value) за период времени и (ii) значение уникальных посещений (unique visit value).
  3. Определение Usage Score на основе комбинации обоих значений (i) и (ii).
  4. Организация документов, основанная, по крайней мере частично, на этих Usage Scores.

Ядром изобретения является обязательное использование как частоты посещений, так и количества уникальных пользователей.

Claim 5 (Зависимый от 1): Дополняет метод включением структурного фактора.

Система также определяет Path Length Score на основе пути документа и включает эту оценку в расчет итоговой оценки.

Claim 6 (Зависимый от 1): Детализирует метод расчета Usage Score.

Рассчитываются отдельные Frequency of Visit Score и Unique User Score с использованием максимальных значений (MAXVF, MAXUU), а затем они комбинируются.

Claims 8 и 9 (Зависимые от 1): Вводят понятие трендов.

Значения VF и UU могут представлять собой процентное изменение (percentage change) по сравнению с предыдущим периодом, что позволяет учитывать динамику популярности.

Claim 10 и 11 (Зависимые от 1): Описывают методы уточнения данных (Refining).

  • Claim 10: Статистика исключает визиты автоматизированных агентов (фильтрация ботов).
  • Claim 11: Значение частоты посещений может быть взвешено в зависимости от географического источника визита (гео-взвешивание).

Claim 12 (Зависимый от 1): Описывает комбинирование оценок.

Ранжирование основано на Usage Scores И на Information Retrieval scores (IR scores).

Где и как применяется

Изобретение затрагивает несколько этапов поиска.

CRAWLING & Data Acquisition (Сбор данных)
Система должна собирать Usage Statistics. Патент упоминает, что данные могут собираться на клиенте (браузер, тулбар), на серверах или на прокси.

INDEXING – Индексирование и извлечение признаков
Собранные данные об использовании обрабатываются (фильтрация, взвешивание) и ассоциируются с документами или сайтами в индексе. Также извлекается и сохраняется Path Length (PL).

RANKING – Ранжирование
Основной этап применения. После определения релевантных документов и их базовых IR scores, система рассчитывает или извлекает Usage Score для каждого документа. Затем Usage Score комбинируется с IR Score (и, возможно, Path Length Score) для определения итогового рейтинга.

Входные данные:

  • Набор релевантных документов и их IR Scores.
  • Обработанные данные VF и UU для каждого документа.
  • Структурные данные (Path Length).

Выходные данные:

  • Переупорядоченный список документов с итоговыми оценками ранжирования.

На что влияет

  • Все типы контента: Влияет на любой документ, для которого доступна статистика использования.
  • Новые и трендовые документы: Этот механизм помогает новым документам, которые еще не накопили ссылочную массу, но быстро набирают популярность. Возможность учета трендов (Claims 8, 9) усиливает этот эффект.
  • Сайты в целом: Патент упоминает возможность поддержания статистики на уровне сайта (site-by-site basis) и ассоциации её со всеми документами сайта.

Когда применяется

  • Условие применения: Алгоритм применяется во время процесса ранжирования.
  • Ограничения: Эффективность зависит от наличия достаточного объема Usage Statistics. Для редко посещаемых страниц влияние минимально (патент упоминает использование малых значений по умолчанию, если данные неизвестны).

Пошаговый алгоритм

Процесс А: Сбор и обработка данных (Офлайн или Непрерывно)

  1. Сбор сырых данных: Сбор информации о частоте посещений и количестве пользователей из различных источников.
  2. Фильтрация данных: Очистка данных от нежелательных визитов (автоматизированные агенты, аффилированные лица).
  3. Взвешивание данных: Применение весовых коэффициентов на основе характеристик визита или пользователя (география, история браузера).
  4. Агрегация и Индексация: Расчет обработанных метрик VF и UU (включая тренды) и их сохранение в индексе вместе с PL.

Процесс Б: Обработка запроса и Ранжирование (Реальное время)

  1. Получение запроса и первичная выборка: Идентификация документов и расчет их базовых IR Scores.
  2. Извлечение данных: Получение значений VF, UU и PL для каждого документа.
  3. Расчет субоценок: Вычисление Frequency of Visit Score, Unique User Score и Path Length Score с использованием нормализационных констант (MAXVF, MAXUU, K).
  4. Расчет Usage Score: Комбинирование субоценок (например, путем перемножения).
  5. Расчет итоговой оценки: Комбинирование Usage Score и IR Score (например, IRScore∗UsageScore\sqrt{IR Score} * Usage Score).
  6. Организация результатов: Сортировка документов на основе итоговых оценок.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы (Ключевые):
    • Частота посещений (Frequency of Visit, VF).
    • Количество уникальных пользователей (Unique Users, UU), идентифицируемых по IP, hostname или cookie.
  • Технические / Структурные факторы:
    • Длина пути (Path Length, PL): количество символов "/" в URL.
  • Географические факторы:
    • Географический источник визита (для взвешивания).
  • Пользовательские факторы:
    • Идентификация автоматизированных агентов (для фильтрации).
    • Информация о браузере, история посещений (browsing history), закладки (bookmarked items) (для взвешивания).

Какие метрики используются и как они считаются

Патент приводит конкретный пример реализации с формулами и константами:

  • Frequency of Visit Score (VF Score): Используется логарифмическое масштабирование.
    Формула: log2(1+log(VF)/log(MAXVF))log_2(1 + log(VF)/log(MAXVF)). (VF — визиты в месяц, MAXVF=2000).
  • Unique User Score (UU Score): Используется пороговое значение.
    • Если UU < 10: 0.5∗UU/100.5 * UU/10
    • Если UU >= 10: 0.5∗(1+UU/MAXUU)0.5 * (1 + UU/MAXUU)
    (UU — уникальные хосты/IP в месяц, MAXUU=400).
  • Path Length Score (PL Score): Предпочтение коротким URL.
    Формула: log(K−PL)/log(K)log(K-PL)/log(K). (PL — количество "/", K=20).
  • Usage Score: Комбинация оценок. В примере: VF Score * UU Score * PL Score.
  • Total Score (Итоговая оценка): Комбинация Usage Score и IR Score.
    Формула: IRScore∗UsageScore\sqrt{IR Score} * Usage Score.

Выводы

  1. Поведенческие факторы как прямой сигнал ранжирования: Патент четко устанавливает, что статистика использования (Usage Statistics) является прямым фактором, влияющим на позицию документа, наряду с текстовой релевантностью (IR Score).
  2. Защита от манипуляций через комбинацию метрик: Ключевым является требование использовать как частоту посещений (VF), так и количество уникальных пользователей (UU). Это предотвращает накрутку рейтинга одним пользователем. Для высокого Usage Score нужна широкая и вовлеченная аудитория.
  3. Важность качества трафика (Фильтрация и Взвешивание): Система активно дискриминирует трафик низкого качества. Фильтрация ботов (automated agents) является обязательной. Взвешивание позволяет предпочесть более ценных пользователей (например, на основе географии или истории), что делает сырые данные о трафике ненадежным индикатором.
  4. Влияние структуры URL (Path Length Score): Патент явно включает длину пути URL как компонент ранжирования. Формула log(K−PL)/log(K)log(K-PL)/log(K) математически предпочитает более короткие URL.
  5. Учет динамики популярности (Тренды): Система может учитывать изменение посещаемости во времени (Claims 8, 9), что позволяет быстрее реагировать на актуальный контент.
  6. Нормализация данных: Использование логарифмических шкал и констант (MAXVF, MAXUU) сглаживает экстремальные значения и нормализует данные для сравнения документов с разным уровнем популярности.

Практика

Best practices (это мы делаем)

  • Фокус на привлечении качественного и разнообразного трафика: Создавайте контент и используйте каналы дистрибуции (соцсети, рассылки), которые привлекают широкую аудиторию (высокий UU) и стимулируют взаимодействие (высокий VF). Это напрямую влияет на Usage Score.
  • Оптимизация структуры URL: Внедряйте плоскую архитектуру сайта и ЧПУ. Минимизируйте вложенность каталогов. Согласно Path Length Score, URL вида site.com/page/ предпочтительнее, чем site.com/category/subcat/2025/page/.
  • Создание вирального и трендового контента: Используйте возможность системы учитывать динамику популярности. Быстрое реагирование на тренды может дать буст в ранжировании, особенно для новых страниц, компенсируя недостаток ссылок.
  • Анализ качества аудитории: Учитывайте, что не весь трафик одинаково полезен. Патент предполагает взвешивание пользователей по географии или истории. Фокусируйтесь на привлечении целевой аудитории.
  • Мониторинг бот-трафика: Поисковая система активно игнорирует автоматизированный трафик при расчете Usage Score. Убедитесь, что ваша аналитика также корректно его фильтрует.

Worst practices (это делать не надо)

  • Покупка трафика и использование клик-ферм: Попытки манипулировать Usage Score с помощью искусственного трафика неэффективны. Система фильтрует ботов и требует наличия уникальных пользователей (UU).
  • Игнорирование структуры сайта: Создание глубоких, сложных URL-структур с множеством уровней вложенности негативно скажется на Path Length Score.
  • Фокус только на контенте и ссылках без учета UX: Создание страниц, которые технически релевантны (высокий IR Score), но неинтересны пользователям (низкий Usage Score), приведет к снижению итогового рейтинга, так как Usage Score выступает множителем.

Стратегическое значение

Этот патент является одним из фундаментальных документов, подтверждающих переход Google от чисто аналитических методов ранжирования (текст и ссылки) к включению эмпирических данных о поведении пользователей. Стратегическое значение заключается в необходимости комплексного подхода к SEO, где пользовательский опыт (UX), качество контента и общая маркетинговая стратегия играют решающую роль в генерации положительных поведенческих сигналов.

Практические примеры

Сценарий 1: Оптимизация структуры E-commerce сайта

  1. Ситуация: Страница товара находится по адресу shop.com/catalog/electronics/audio/headphones/model-z.html (PL=5).
  2. Действие: Реструктуризация URL для ключевых товаров на shop.com/products/model-z (PL=2).
  3. Ожидаемый результат: Улучшение Path Length Score, что положительно влияет на итоговый рейтинг страницы при прочих равных.

Сценарий 2: Быстрое ранжирование нового контента

  1. Ситуация: Опубликовано исследование на актуальную тему. У страницы пока нет обратных ссылок.
  2. Действие: Запуск активной дистрибуции через социальные сети, email-рассылку и отраслевые СМИ для генерации всплеска интереса.
  3. Ожидаемый результат: Страница получает высокие показатели VF и UU. Система рассчитывает высокий Usage Score, что позволяет исследованию быстро занять высокие позиции в поиске, компенсируя отсутствие ссылочного веса.

Вопросы и ответы

Как Google получает данные о посещаемости (Usage Statistics)?

Патент упоминает несколько возможных источников. Информация может собираться на клиентских устройствах (например, через браузер или тулбар), на серверах, которые хранят документы, или на промежуточных узлах, таких как веб-прокси. В современной экосистеме это часто реализуется через данные браузера Chrome (например, CrUX) и другие панели пользователей.

Заменяет ли Usage Score ссылочные факторы, такие как PageRank?

Нет, не заменяет. Патент описывает Usage Score как дополнение. В тексте указано, что ранжирование может основываться на Usage Score в комбинации с другими факторами, включая информацию о ссылках (link information) и текстовую релевантность (IR Score). Usage Score служит дополнительным измерением качества и популярности.

Как именно работает фактор длины URL (Path Length Score)?

Path Length Score рассчитывается на основе количества символов "/" в пути документа (PL). Используется формула log(K−PL)/log(K)log(K-PL)/log(K). Чем меньше PL (меньше вложенность URL), тем выше оценка. Это означает, что система предпочитает документы, расположенные ближе к корню сайта.

Насколько важна фильтрация ботов в этом патенте?

Она критически важна. Патент специально оговаривает (Claim 10), что при расчете статистики необходимо исключать визиты автоматизированных агентов. Это сделано для того, чтобы Usage Score отражал взаимодействие реальных людей и предотвращал манипуляции с помощью бот-трафика.

Что означает взвешивание пользователей по географии или истории браузера?

Это означает, что система может придавать больший вес посещениям от определенных пользователей. Например, визит из целевого региона может считаться более важным. Также упоминается использование истории браузера или закладок для определения значимости пользователя. Это позволяет системе фокусироваться на качественной, а не только количественной вовлеченности.

Почему система использует и частоту визитов (VF), и уникальных пользователей (UU)?

Использование обеих метрик обеспечивает надежную оценку популярности и защищает от накруток. Высокий VF при низком UU может означать, что небольшая группа людей часто обновляет страницу. Идеальный сценарий — высокий UU и высокий VF, что свидетельствует о широкой и вовлеченной аудитории.

Может ли этот механизм помочь новым сайтам ранжироваться быстрее?

Да, может. В патенте указано, что традиционные ссылочные методы ставят новые страницы в невыгодное положение. Механизм Usage Score позволяет новым документам, которые быстро набирают популярность и демонстрируют высокую вовлеченность пользователей, улучшить свои позиции, даже если у них еще мало входящих ссылок.

Применяется ли статистика использования на уровне всего сайта или только для отдельных страниц?

Патент в основном описывает применение на уровне документов. Однако он также упоминает возможность поддержания статистики использования на уровне сайта (site-by-site basis) и ассоциации этой информации с некоторыми или всеми документами этого сайта.

Как соотносятся Usage Score и IR score?

Они дополняют друг друга и перемножаются. IR score оценивает текстовую релевантность, а Usage Score — поведенческую релевантность (популярность). В предложенной формуле IRScore∗UsageScore\sqrt{IR Score} * Usage Score, Usage Score действует как множитель, усиливая ранжирование релевантного контента.

Может ли трафик из контекстной рекламы или социальных сетей влиять на органическое ранжирование согласно этому патенту?

Да, может. Патент не ограничивает источники трафика поисковой выдачей. Любые визиты, которые система может зафиксировать и верифицировать как качественные (не боты), вносят вклад в VF и UU. Таким образом, привлечение трафика через другие каналы может косвенно улучшить органические позиции за счет повышения Usage Score.

Похожие патенты

Как Google использует данные о поведении пользователей по похожим запросам для ранжирования новых или редких запросов
Google использует механизм для улучшения ранжирования запросов, по которым недостаточно данных о поведении пользователей (например, кликов). Система находит исторические запросы, семантически похожие на исходный, и «заимствует» их поведенческие данные. Степень сходства рассчитывается с учетом важности терминов, синонимов и порядка слов. Эти заимствованные данные используются для корректировки рейтинга документов по исходному запросу.
  • US9009146B1
  • 2015-04-14
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует историю поиска, поведение и многофакторные профили пользователей для персонализации поисковой выдачи
Google создает детальные профили пользователей на основе истории запросов, взаимодействия с результатами (клики, время просмотра) и анализа контента посещенных страниц. Эти профили (включающие интересы по терминам, категориям и ссылкам) используются для корректировки стандартных оценок ранжирования. Степень персонализации динамически регулируется уровнем уверенности системы в профиле (Confidence Score).
  • US9298777B2
  • 2016-03-29
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google классифицирует веб-страницы и персонализирует выдачу, используя историю запросов и поведенческие данные
Google использует итеративный метод для тематической классификации веб-страниц, не анализируя их контент напрямую. Система анализирует исторические логи запросов и данные о кликах. Классификация известных страниц переносится на запросы, в результатах которых они появляются, а затем классификация этих запросов переносится на новые страницы. Эти данные используются для построения профилей пользователей и персонализации поисковой выдачи.
  • US8185544B2
  • 2012-05-22
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует машинное обучение и поведенческие данные для прогнозирования полезности документов и решает, что включать в поисковый индекс
Google использует модель машинного обучения для определения, какие документы включать в поисковый индекс. Модель обучается на исторических данных о кликах и показах, чтобы предсказать будущую «оценку полезности» (Utility Score) документа. Документы ранжируются по этой оценке, а также с учетом других факторов (например, PageRank, стоимость индексации, свежесть, квоты), и лучшие из них попадают в индекс.
  • US8255386B1
  • 2012-08-28
  • Индексация

  • Поведенческие сигналы

Как Google использует закладки, историю посещений и поведение пользователей для персонализации поиска и таргетинга рекламы
Патент Google, описывающий фундаментальный механизм персонализации поиска. Система объединяет результаты из глобального индекса с результатами из персонального индекса пользователя (закладки, аннотации, история посещений). Ранжирование корректируется на основе явных оценок пользователя и неявных поведенческих сигналов (частота визитов, время на сайте). Эти же данные используются для таргетинга рекламы.
  • US7523096B2
  • 2009-04-21
  • Персонализация

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует время взаимодействия пользователя с сайтом (Dwell Time) для расчета оценки качества всего сайта
Google использует агрегированные данные о продолжительности визитов пользователей на сайт для расчета метрики качества этого сайта (Site Quality Score). Система измеряет время взаимодействия (включая Dwell Time — время от клика в выдаче до возврата обратно), фильтрует аномальные визиты и нормализует данные по типам контента. Итоговая оценка используется как независимый от запроса сигнал для ранжирования и принятия решений об индексировании.
  • US9195944B1
  • 2015-11-24
  • Поведенческие сигналы

  • Индексация

  • SERP

Как Google определяет ключевые аспекты (фасеты) сущности для организации и диверсификации поисковой выдачи
Google использует систему для автоматической идентификации различных «аспектов» (подтем или фасетов) сущности в запросе. Анализируя логи запросов и базы знаний, система определяет, как пользователи исследуют информацию. Затем эти аспекты ранжируются по популярности и разнообразию и используются для организации результатов поиска в структурированном виде (mashup), облегчая пользователю навигацию и исследование темы.
  • US8458171B2
  • 2013-06-04
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Как Google использует исторические данные о кликах (CTR) по категориям для определения доминирующего интента неоднозначных запросов
Google анализирует, на какие категории результатов пользователи кликали чаще всего в прошлом (CTR) по неоднозначному запросу (например, "Pool"). Система определяет доминирующие интенты, выявляя резкие перепады в CTR между категориями или используя иерархию категорий, и повышает в ранжировании результаты, соответствующие наиболее популярным интерпретациям.
  • US8738612B1
  • 2014-05-27
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует близость цитирований (ссылок) для кластеризации результатов поиска
Google может группировать результаты поиска, анализируя, как документы ссылаются друг на друга. Система оценивает силу связи между документами, проверяя контекстуальную близость общих цитирований. Ссылки, расположенные в одном предложении (co-citation) или абзаце, имеют значительно больший вес, чем ссылки, просто присутствующие в документе. Это позволяет формировать точные тематические кластеры, отсеивая группы со слабыми связями.
  • US8612411B1
  • 2013-12-17
  • Ссылки

  • SERP

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
  • US8583675B1
  • 2013-11-12
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google использует повторные клики, прямой трафик и время на сайте для расчета оценки качества домена и корректировки ранжирования
Google анализирует поведение пользователей на уровне домена (группы ресурсов) для вычисления модификатора ранжирования. Ключевые метрики включают долю повторных кликов (Repeat Click Fraction), долю прямого трафика (Deliberate Visit Fraction) и среднюю продолжительность визита (Average Duration). Эти данные используются для корректировки исходных оценок страниц сайта, понижая ресурсы с низкими показателями пользовательской лояльности и вовлеченности.
  • US9684697B1
  • 2017-06-20
  • Поведенческие сигналы

  • SERP

seohardcore