SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)

EVALUATING WEBSITE PROPERTIES BY PARTITIONING USER FEEDBACK (Оценка свойств веб-сайта путем сегментации пользовательского фидбека)
  • US8615514B1
  • Google LLC
  • 2010-02-03
  • 2013-12-24
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.

Описание

Какую проблему решает

Патент решает проблему низкой точности использования сырых, агрегированных поведенческих данных (например, общего CTR сайта) для оценки качества ресурса. Использование общих метрик делает систему уязвимой к шуму и манипуляциям: высокий CTR по неконкурентным, малопопулярным или нечетким запросам не обязательно свидетельствует о высоком качестве сайта. Изобретение предлагает метод контекстуализации пользовательского фидбека для получения более надежного сигнала качества сайта (Website Quality Score).

Что запатентовано

Запатентована система для расчета контекстуализированных оценок свойств сайта (например, качества, популярности, коммерциализации). Ключевым механизмом является анализ не общего объема пользовательского фидбека, а его распределения (distribution) и перекоса (skew) по различным сегментам (partitions). Эти сегменты определяются характеристиками запросов (например, их конкурентностью, популярностью или длиной), по которым сайт получал показы и клики.

Как это работает

Система работает путем сегментации данных о взаимодействии пользователей с результатами поиска:

  • Сбор данных: Собираются пары Документ-Запрос (D-Q pairs) и связанный с ними пользовательский фидбек (клики, показы).
  • Определение параметров: Выбирается свойство сайта для оценки (Property Parameter, например, Качество) и соответствующий параметр для сегментации (Partition Parameter, например, Конкурентность запроса или IR Score топа).
  • Сегментация (Partitioning): Все D-Q pairs сайта распределяются по сегментам (например, Низкая, Средняя, Высокая конкурентность).
  • Агрегация: Внутри каждого сегмента агрегируется фидбек (например, суммарное число кликов или CTR).
  • Анализ распределения (Skew): Система анализирует, в каких сегментах сконцентрированы клики (перекос распределения). Сайт считается качественным, если он получает значительную долю кликов в 'высокоценных' сегментах.
  • Ранжирование: Полученная оценка качества сайта используется как фактор ранжирования.

Актуальность для SEO

Высокая. Оценка качества на уровне всего сайта является краеугольным камнем современных алгоритмов Google (например, Helpful Content System, E-E-A-T). Этот патент описывает фундаментальный и устойчивый к шуму метод расчета оценки качества сайта на основе анализа паттернов пользовательского поведения. Понимание того, что не весь трафик одинаково полезен для репутации сайта, критически важно в 2025 году.

Важность для SEO

Патент имеет критическое значение для формирования SEO-стратегии. Он демонстрирует, что для Google важен не сам факт получения трафика, а контекст, в котором этот трафик получен. Трафик по конкурентным, популярным и четко сформулированным запросам вносит больший вклад в оценку качества сайта (Website Quality Score), чем трафик по малопопулярным или нечетким запросам. Это напрямую влияет на стратегию выбора ключевых слов и построения авторитетности ресурса.

Детальный разбор

Термины и определения

D-Q Pair (Document-Query Pair / Пара Документ-Запрос)
Фундаментальная единица анализа. Запись, связывающая конкретный документ (D) с конкретным запросом (Q), по которому этот документ был показан или выбран.
Distribution (Распределение)
Характеристика того, как агрегированный пользовательский фидбек распределен между различными сегментами (Partitions).
IR Score (Information Retrieval Score / Оценка информационного поиска)
Базовая оценка релевантности документа запросу. В патенте часто используется IR Score топового результата по запросу как индикатор качества/конкурентности самого запроса.
Partition Parameter (Параметр сегментации)
Характеристика запроса, документа или пары D-Q, используемая для разделения данных на группы (сегменты). Примеры: IR Score топового результата, длина запроса, популярность запроса.
Property Parameter (Параметр свойства)
Целевая метрика, которую система рассчитывает для веб-сайта. Примеры: Website Quality Score, Website Popularity, Website Commerciality.
Skew (Перекос / Асимметрия распределения)
Мера асимметрии распределения агрегированного фидбека. Ключевой показатель для оценки качества: перекос в сторону "высококачественных" сегментов указывает на высокое качество сайта.
User Feedback Data (Данные пользовательского фидбека)
Метрики, отражающие поведение пользователей: клики (click-count), показы (impression count), CTR (click-to-impression ratio). Могут взвешиваться по времени пребывания (click-duration/dwell time) и свежести (click-recency).

Ключевые утверждения (Анализ Claims)

Основными являются независимые пункты Claim 1, 12 и 23, которые описывают идентичный процесс.

Claim 1 (Независимый пункт): Описывает основной метод оценки качества сайта.

  1. Система получает множество пар Документ-Запрос (D-Q pairs), связанных с веб-сайтом. Каждая пара включает пользовательский фидбек.
  2. Каждая пара D-Q назначается в один из нескольких сегментов (partitions) на основе оценки информационного поиска (IR score) документа для соответствующего запроса. Каждый сегмент определен своим диапазоном IR score.
  3. Пользовательский фидбек агрегируется внутри двух или более сегментов.
  4. Определяется первое распределение (first distribution) агрегированного фидбека между этими сегментами.
  5. Вычисляется перекос (skew) этого распределения.
  6. Определяется показатель качества веб-сайта (indication of quality) на основе, как минимум, вычисленного перекоса распределения.
  7. Этот показатель качества предоставляется как входные данные для ранжирования документов с этого веб-сайта.

Ядром изобретения является использование перекоса (skew) распределения фидбека как меры качества сайта. Если фидбек смещен в сторону сегментов с высоким IR Score, это интерпретируется как высокое качество.

Зависимые пункты (например, 5, 7, 9, 11): Уточняют детали и альтернативы:

  • Claim 11: Уточняет, что используемый IR score может быть оценкой документа, ранжированного на первой позиции (top ranked document) по данному запросу.
  • Claim 5: Вводит возможность сегментации на основе длины соответствующего запроса (length of the respective query).
  • Claim 7 и 9: Вводят возможность сегментации на основе популярности (measure of popularity) и коммерциализации запроса (measure of commerciality).
  • Claim 6: Уточняет, что оценка качества сайта может базироваться на комбинации нескольких распределений (например, по IR score и по длине запроса).

Где и как применяется

Изобретение в основном применяется на этапе анализа данных и генерации сигналов качества, которые затем используются в ранжировании.

INDEXING – Индексирование и извлечение признаков (Offline/Batch Processing)
Это основной этап применения патента. Система анализирует исторические логи пользовательского поведения (Result Selection Logs) в офлайн-режиме. Процесс сегментации (partitioning), агрегации и анализа распределения (distribution analysis) выполняется здесь для вычисления Property Parameters (например, Website Quality Score). Эти оценки сохраняются в индексе и ассоциируются с соответствующими сайтами или доменами.

RANKING – Ранжирование
На этом этапе система использует предварительно рассчитанные Website Quality Scores. Ranking Engine или Rank Modifier Engine применяет эти оценки как один из сигналов ранжирования для корректировки позиций отдельных документов, принадлежащих данному сайту.

Входные данные:

  • Пары Документ-Запрос (D-Q Pairs).
  • User Feedback Data (клики, показы, CTR, время пребывания, актуальность клика).
  • Значения Partition Parameters для каждого запроса (например, IR score топового результата, длина запроса, популярность запроса).

Выходные данные:

  • Property Parameter (например, Website Quality Score), присвоенный веб-сайту.

На что влияет

  • Все типы контента и запросов: Механизм влияет на все сайты, по которым накоплено достаточное количество поведенческих данных для анализа распределения.
  • Оценка качества сайта (E-E-A-T): Этот механизм предоставляет конкретный способ количественной оценки качества и авторитетности сайта на основе реального поведения пользователей в различных контекстах.
  • Конкурентные ниши: Наибольшее влияние оказывается в тематиках, где доступен большой объем данных о поведении пользователей и где необходимо точно различать качество сайтов при схожей релевантности.

Когда применяется

  • Условие применения: Наличие достаточного объема статистически значимых данных о пользовательском фидбеке (кликах и показах) для конкретного веб-сайта.
  • Частота применения: Расчет и обновление оценок Website Quality Score происходит периодически в офлайн-режиме по мере накопления новых данных в логах. Применение рассчитанных оценок происходит в реальном времени на этапе ранжирования.

Пошаговый алгоритм

Процесс расчета оценки качества сайта (Website Quality Score) (Офлайн).

  1. Сбор данных: Из логов поисковой системы извлекаются D-Q pairs, связанные с ними User Feedback Data (клики, показы) и сопутствующие сигналы (IR scores, длина запросов и т.д.).
  2. Идентификация сайта: Из URL документов в D-Q pairs извлекается информация о домене или хосте (Site Key) для группировки всех данных, относящихся к оцениваемому сайту.
  3. Выбор параметров: Определяется цель анализа (например, расчет Website Quality Score) и выбирается соответствующий Partition Parameter (например, IR Score топового результата по запросу).
  4. Определение сегментов: Устанавливаются диапазоны значений для Partition Parameter, формирующие сегменты (например, IR 0-30, 31-50, 51-80, 81-100).
  5. Сегментация (Partitioning): Все D-Q pairs сайта распределяются по соответствующим сегментам на основе значения их Partition Parameter.
  6. Агрегация фидбека: Внутри каждого сегмента рассчитывается агрегированный пользовательский фидбек (например, суммарное количество кликов, общий CTR).
  7. Анализ распределения: Определяется распределение агрегированного фидбека между сегментами.
  8. Вычисление перекоса (Skew): Рассчитывается мера асимметрии (Skew) распределения. Система проверяет, смещен ли фидбек в сторону сегментов с высокими значениями Partition Parameter.
  9. Расчет оценки: На основе характеристик распределения и его перекоса выводится Website Quality Score. Например, концентрация кликов в сегментах с высокими значениями IR Score (перекос в сторону высоких значений) указывает на высокое качество сайта.
  10. Применение оценки: Рассчитанный Website Quality Score сохраняется и используется как входной сигнал для ранжирования документов этого сайта.

Какие данные и как использует

Данные на входе

Система использует преимущественно поведенческие факторы и характеристики запросов.

  • Поведенческие факторы (User Feedback Data): Ядро патента. Используются click-count (количество кликов), impression count (количество показов), CTR. Патент явно упоминает взвешивание кликов по длительности (click-duration или dwell time – 'long clicks' и 'short clicks') и актуальности (click-recency).
  • Технические факторы: URL документа используется для извлечения домена или хоста (Site Key).
  • Характеристики Запросов (используются как Partition Parameters):
    • Текст запроса (для расчета Query Length).
    • Частота запроса (для оценки Query Popularity).
    • Количество рекламы, таргетированной на запрос (для оценки Query Commerciality).
  • Системные данные (используются как Partition Parameters):
    • IR Scores. В частности, используется IR score топового результата по запросу как индикатор качества/конкурентности запроса.
    • Общее количество результатов поиска по запросу (индикатор конкурентности).

Какие метрики используются и как они считаются

Параметры сегментации (Partition Parameters): Используются для разделения данных на контекстные группы.

  • IR Score топового результата: Индикатор качества и конкурентности запроса. Высокий IR Score предполагает четкий запрос и наличие качественного контента в индексе.
  • Query Length (Длина запроса): Индикатор специфичности запроса. Запросы средней длины (например, 2-3 слова) часто считаются оптимальными.
  • Query Popularity (Популярность запроса): Частота или общий объем подачи запроса.

Параметры свойств (Property Parameters): Выходные метрики, рассчитываемые для сайта (например, Website Quality Score).

Методы вычислений: Оценка свойств сайта основывается на анализе распределения (distribution) агрегированного пользовательского фидбека. Ключевым методом является вычисление и анализ перекоса (skew) этого распределения (Claim 1). Конкретные формулы расчета итогового скоринга в патенте не приводятся, но указывается, что модели корреляции между распределением фидбека и свойствами сайта могут быть построены и обучены на основе эмпирических данных (например, с использованием сайтов с известными характеристиками качества).

Выводы

  1. Не все клики одинаково ценны: Патент четко устанавливает, что ценность пользовательского фидбека (клика) зависит от контекста запроса, по которому он был получен. Клик по популярному, конкурентному и четкому запросу весит больше, чем клик по нечеткому или малопопулярному.
  2. Качество сайта определяется его эффективностью в высокоценных контекстах: Для получения высокого Website Quality Score сайт должен демонстрировать хорошие поведенческие метрики (высокий CTR, много кликов) именно в тех сегментах (partitions), которые Google считает важными (например, сегменты с высоким IR Score топового результата или высокой популярностью запроса).
  3. "Skew" (Перекос) как ключевой индикатор качества: Ключевым механизмом оценки является анализ перекоса распределения фидбека. Сайт считается качественным, если его положительный фидбек смещен (имеет skew) в сторону "высококачественных" сегментов.
  4. Сегментация как метод фильтрации шума: Использование Partition Parameters позволяет отделить качественный трафик от 'мусорного' или нерепрезентативного при оценке сайта. Это делает поведенческие сигналы более надежными и устойчивыми к манипуляциям.
  5. Сайт-уровень оценки: Анализ проводится на уровне всего сайта путем агрегации данных по всем его документам (D-Q pairs). Полученная оценка влияет на ранжирование всех страниц сайта, даже тех, по которым мало индивидуальных поведенческих данных.

Практика

Best practices (это мы делаем)

  • Фокус на конкурентных и популярных запросах (Head/Body): Необходимо стремиться к получению высоких позиций и хорошего CTR по основным запросам тематики. Согласно патенту, успех в этих сегментах вносит наибольший вклад в Website Quality Score, так как эти запросы, вероятно, попадают в высокоценные сегменты (высокий IR Score топового результата, высокая популярность).
  • Построение тематического авторитета (Topical Authority): Создавайте контент, который всесторонне охватывает тему и хорошо отвечает на четко сформулированные запросы (оптимальная длина запроса, высокий IR Score). Это увеличивает вероятность получения качественного фидбека в нужных сегментах.
  • Оптимизация под удовлетворенность пользователя (Long Clicks): Патент прямо упоминает взвешивание кликов по длительности (click-duration). Необходимо обеспечивать высокую вовлеченность и длительное время взаимодействия с контентом (Dwell Time), минимизируя 'короткие клики' (short clicks).
  • Анализ качества трафика, а не только его объема: При анализе эффективности SEO нужно сегментировать трафик по предполагаемой популярности и конкурентности запросов (например, используя данные GSC), чтобы понять, какой трафик способствует росту авторитетности сайта.

Worst practices (это делать не надо)

  • Стратегия исключительно на НЧ и микро-НЧ трафике: Полагаться только на трафик по низкоконкурентным или малопопулярным запросам. Хотя это может приносить объем трафика, патент предполагает, что это слабо влияет на общую оценку качества сайта, если ресурс неэффективен по более конкурентным запросам.
  • Использование кликбейта и игнорирование интента: Генерация высокого CTR при низком времени пребывания (dwell time). Это формирует негативные поведенческие сигналы (короткие клики), которые могут быть пессимизированы при расчете взвешенного количества кликов.
  • Создание сайтов под нечеткие или обскурные запросы: Сайты, которые ранжируются только по запросам с низким IR Score топового результата, будут иметь низкий Website Quality Score, так как их клики будут сконцентрированы в низкоценных сегментах.
  • Манипуляции с CTR на "легких" запросах: Попытки искусственно завысить CTR на неконкурентных запросах будут неэффективны, так как система анализирует распределение (Skew), а не среднее значение.

Стратегическое значение

Этот патент подтверждает стратегическую важность построения авторитетных брендов и ресурсов, способных конкурировать за основную семантику ниши. Он предоставляет конкретный механизм, с помощью которого Google может количественно оценить качество сайта, используя поведенческие данные, отфильтрованные от шума. Это объясняет, почему фокус на E-E-A-T и удовлетворении пользователей является ключевым для долгосрочного успеха: качественные сайты естественным образом привлекают клики в высокоценных сегментах.

Практические примеры

Сценарий: Сравнение Нишевого Блога и Крупного Новостного Портала

Анализируется Website Quality Score. Используется Partition Parameter: Популярность Запроса (Query Popularity), разделенный на сегменты: Низкая, Средняя, Высокая.

  1. Сайт А (Нишевый Блог): Получает 10,000 кликов в месяц. Распределение: 80% кликов в сегменте 'Низкая популярность' (длинные, специфические запросы), 15% в 'Средняя', 5% в 'Высокая'.
  2. Сайт Б (Новостной Портал): Получает 10,000 кликов в месяц. Распределение: 10% кликов в сегменте 'Низкая популярность', 30% в 'Средняя', 60% в 'Высокая популярность' (горячие новости, основные события).
  3. Анализ: Система анализирует распределение. У Сайта А перекос (skew) в сторону низкоценных сегментов. У Сайта Б перекос в сторону высокоценных сегментов.
  4. Результат: Несмотря на одинаковый объем трафика, Сайт Б получит значительно более высокий Website Quality Score, основанный на этом механизме, так как он демонстрирует способность удовлетворять пользователей по популярным и важным запросам.

Вопросы и ответы

Означает ли этот патент, что трафик по длинному хвосту (long-tail) бесполезен?

Нет, он не бесполезен для привлечения посетителей. Однако патент предполагает, что трафик по низкоконкурентным или малопопулярным запросам вносит меньший вклад в расчет общего Website Quality Score. Для построения авторитетного ресурса критически важно также успешно конкурировать за более популярные и конкурентные запросы (Head и Body).

Какой "Partition Parameter" является наиболее важным для оценки качества?

Патент приводит несколько примеров, но особое внимание уделяет IR Score (Claim 1), в частности IR Score топового результата по запросу (Claim 11). Этот параметр служит хорошим индикатором качества и конкурентности запроса. Также важны популярность запроса (Claim 7) и длина запроса (Claim 5).

Как этот механизм связан с E-E-A-T?

Этот патент предоставляет один из возможных механизмов для количественной оценки E-E-A-T через анализ поведения пользователей. Авторитетные и экспертные сайты (High E-E-A-T) естественным образом чаще удовлетворяют пользователей по важным, конкурентным и популярным запросам. Это приводит к концентрации кликов в высокоценных сегментах и, как следствие, к высокому Website Quality Score.

Использует ли этот патент время пребывания на сайте (Dwell Time)?

Да, абсолютно. Патент явно упоминает возможность взвешивания кликов по их длительности (click-duration), различая 'long clicks' и 'short clicks'. Это означает, что для расчета агрегированного фидбека учитывается не только факт клика, но и последующая удовлетворенность пользователя контентом.

Этот алгоритм работает в реальном времени или офлайн?

Расчет Website Quality Score (сегментация, агрегация и анализ распределения) происходит офлайн в пакетном режиме путем анализа исторических логов. Однако применение этих рассчитанных оценок в качестве фактора ранжирования происходит в реальном времени при обработке поискового запроса.

Как SEO-специалист может проверить, в какие сегменты попадает трафик его сайта?

Google не предоставляет эти данные напрямую. Однако можно провести аппроксимацию, анализируя данные Google Search Console. Запросы можно сегментировать вручную по их предполагаемой популярности (частотности) и конкурентности (анализируя выдачу). Затем можно оценить, какую долю кликов приносят высококонкурентные запросы по сравнению с низкоконкурентными.

Что такое "перекос" (skew) распределения и почему он важен?

Перекос (Claim 1) – это мера асимметрии распределения данных. В контексте патента, если мы используем IR Score для сегментации, перекос в сторону высоких значений (концентрация кликов смещена к высоким IR Score) указывает на то, что сайт хорошо работает по качественным/конкурентным запросам. Это является индикатором высокого качества сайта.

Как сегментация по длине запроса (Query Length) влияет на стратегию?

Патент предполагает, что запросы средней длины (например, 2-3 слова) часто являются оптимальными – не слишком общими и не слишком специфичными. Концентрация кликов в этом сегменте положительно влияет на оценку качества. Это подчеркивает важность оптимизации под четкие, информативные запросы, а не только под отдельные ключевые слова или слишком длинные конструкции.

Применяется ли этот механизм к новым сайтам?

Нет. Механизм требует накопления достаточного объема пользовательского фидбека (User Feedback Data) по множеству D-Q pairs для проведения статистически значимого анализа распределения. Новые сайты не имеют достаточной истории для применения этого алгоритма.

Означает ли этот патент, что CTR является прямым фактором ранжирования?

Не совсем. Патент показывает, что CTR и другие поведенческие данные используются как входные данные для вычисления более сложных метрик качества сайта (Website Quality Score) офлайн. Именно эти производные метрики, основанные на анализе распределения (Skew), затем используются в ранжировании. Прямое использование "сырого" CTR в реальном времени не описывается.

Похожие патенты

Как Google использует вероятностные модели и анализ пользовательского выбора (кликов) для обучения систем ранжирования
Патент Google описывает метод эффективного ранжирования контента (видео или результатов поиска) с использованием парных сравнений. Система моделирует качество как вероятностное распределение и оптимизирует сбор данных. Этот механизм может применяться для интерпретации кликов в поисковой выдаче как сигналов предпочтения, учитывая позицию результата и доверие к пользователю.
  • US8688716B1
  • 2014-04-01
  • SERP

  • Поведенческие сигналы

Как Google использует распределение кликов в выдаче для определения брендовых (навигационных) и общих (тематических) запросов
Google анализирует поведение пользователей в поисковой выдаче для классификации интента запроса. Если клики сконцентрированы на одном результате (низкое разнообразие, высокая частота), запрос классифицируется как навигационный или брендовый (Data-Creator Targeting). Если клики распределены по разным сайтам, запрос считается общим (Content Targeting). Эта классификация используется для адаптации поисковой выдачи.
  • US20170068720A1
  • 2017-03-09
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google рассчитывает «сигнал конкурентоспособности» (Competition Signal) страниц на основе анализа кликов, показов и времени взаимодействия
Google оценивает качество страниц, анализируя их «победы» и «поражения» в поисковой выдаче. Система сравнивает, как часто пользователи выбирают данный URL вместо других и как долго они взаимодействуют с контентом по сравнению с конкурентами (Dwell Time). На основе этих данных рассчитывается корректирующий фактор, который повышает или понижает позиции страницы, отражая её относительную конкурентоспособность и удовлетворенность пользователей.
  • US9020927B1
  • 2015-04-28
  • Поведенческие сигналы

  • SERP

  • EEAT и качество

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google A/B тестирует и оптимизирует сниппеты (заголовки, описания, изображения) для повышения CTR
Google использует механизм для оптимизации отображения контента (сниппетов). Система показывает разные варианты заголовков, описаний или изображений для одной и той же ссылки разным пользователям или на разных платформах. Затем она измеряет кликабельность (CTR) каждого варианта и выбирает наиболее эффективный для дальнейшего использования, учитывая также тип устройства пользователя.
  • US9569432B1
  • 2017-02-14
  • SERP

  • Поведенческие сигналы

  • Персонализация

Популярные патенты

Как Google идентифицирует, связывает и индексирует концепции (фразы) для понимания тем документов
Фундаментальный патент Google, описывающий переход от индексирования слов к индексированию концепций (фраз). Система определяет «хорошие фразы» на основе частотности и их способности прогнозировать появление других фраз (Information Gain). Документы индексируются не только по содержащимся в них фразам, но и по наличию связанных фраз, что позволяет системе определять основные и второстепенные темы документа, а также контекстуально оценивать анкорный текст ссылок.
  • US7536408B2
  • 2009-05-19
  • Индексация

  • Семантика и интент

  • Ссылки

Как Google позволяет вебмастерам управлять весом и интерпретацией исходящих ссылок через атрибуты тега (Основа nofollow)
Google запатентовал механизм, позволяющий вебмастерам добавлять в теги ссылок () специальные пары "параметр=значение" (например, rel=nofollow или linkweight=0.5). Эта информация используется краулером и поисковой системой для изменения способа обработки ссылки, например, для корректировки передаваемого веса (PageRank) или блокировки ее учета.
  • US7979417B1
  • 2011-07-12
  • Ссылки

  • Краулинг

  • Техническое SEO

Как Google извлекает готовые ответы из авторитетных источников для формирования Featured Snippets
Google использует систему для предоставления прямых ответов на естественном языке (в виде абзацев или списков) на запросы с четким намерением. Система заранее анализирует авторитетные источники, извлекает пары «заголовок-текст», соответствующие популярным шаблонам вопросов, и сохраняет их в специальной базе данных. При получении соответствующего запроса система извлекает готовый ответ из этой базы и отображает его в выдаче.
  • US9448992B2
  • 2016-09-20
  • Семантика и интент

  • EEAT и качество

  • Индексация

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google определяет язык и языковую релевантность страницы, анализируя контекст входящих и исходящих ссылок
Google использует контекст входящих и исходящих ссылок для определения языковой релевантности ресурса. Система анализирует язык анкоров, URL, контент ссылающихся и целевых страниц, а также качество ссылок и тип страницы (например, «языковой шлюз»). Это позволяет точно идентифицировать релевантные языки, даже если на самой странице мало текста.
  • US9098582B1
  • 2015-08-04
  • Ссылки

  • Мультиязычность

  • Семантика и интент

Как Google выбирает сущность для Панели Знаний и решает, когда ее показывать, основываясь на топикальности SERP и CTR
Google использует этот механизм для решения двух задач: выбора наиболее релевантной сущности для Панели Знаний при неоднозначном запросе и определения необходимости показа самой панели. Система анализирует, насколько сущности соответствуют контенту топовых результатов поиска (Topicality Score). Показ панели активируется, если у органических результатов низкий CTR (что указывает на неудовлетворенность пользователей) или если у Google достаточно данных для ее заполнения.
  • US10922326B2
  • 2021-02-16
  • Knowledge Graph

  • SERP

  • Семантика и интент

Как Google вычисляет семантическую близость запросов, анализируя поведение пользователей при переформулировках
Google использует механизм для определения семантического расстояния между запросами (Generalized Edit Distance). Вместо подсчета изменений символов система анализирует исторические логи, чтобы понять, как пользователи переформулируют запросы. На основе этих данных вычисляется «стоимость» замены одного термина на другой с помощью Pointwise Mutual Information (PMI), что позволяет генерировать более релевантные подсказки и расширения запросов.
  • US8417692B2
  • 2013-04-09
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует время пребывания на странице (Dwell Time) для оценки качества и корректировки ранжирования
Google анализирует продолжительность визитов пользователей на страницы из результатов поиска (Dwell Time). Система рассчитывает метрику, сравнивающую количество «длинных кликов» (длительных визитов) с общим количеством кликов для конкретного документа по конкретному запросу. Этот показатель используется как сигнал качества, независимый от позиции в выдаче, для повышения или понижения документа в ранжировании.
  • US8661029B1
  • 2014-02-25
  • Поведенческие сигналы

  • SERP

Как Google использует личные интересы пользователя для понимания неопределенных запросов и персонализации рекомендаций
Google использует механизм для интерпретации неопределенных запросов или команд (например, «Я голоден» или «Мне скучно»), когда контекст неясен. Если система не может определить конкретное намерение пользователя только из текущего контента (например, экрана приложения), она обращается к профилю интересов пользователя (User Attribute Data) и его местоположению, чтобы заполнить пробелы и предоставить персонализированные рекомендации или выполнить действие.
  • US10180965B2
  • 2019-01-15
  • Персонализация

  • Семантика и интент

  • Local SEO

Как Google рассчитывает и показывает рейтинг легитимности сайтов и рекламодателей на основе их истории и активности
Google патентует систему для оценки и отображения «Рейтинга Легитимности» источников контента, включая сайты в органической выдаче и рекламодателей. Этот рейтинг основан на объективных данных: как долго источник взаимодействует с Google (история) и насколько активно пользователи с ним взаимодействуют (объем транзакций, клики). Цель — предоставить пользователям надежную информацию для оценки качества и надежности источника.
  • US7657520B2
  • 2010-02-02
  • SERP

  • EEAT и качество

  • Поведенческие сигналы

seohardcore