SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google снижает ценность кликов по результатам, полученным из слишком общих запросов

METHODS AND SYSTEMS FOR ADJUSTING A SCORING MEASURE BASED ON QUERY BREADTH (Методы и системы для корректировки показателя ранжирования на основе широты запроса)
  • US7925657B1
  • Google LLC
  • 2004-03-17
  • 2011-04-12
  • Поведенческие сигналы
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google использует механизм для корректировки показателей популярности (например, кликов) документа. Если документ получил клик в ответ на очень общий (широкий) запрос, ценность этого клика снижается. Это предотвращает искусственное завышение популярности документов, которые часто показываются по высокочастотным общим запросам, и повышает значимость кликов, полученных по более специфическим запросам.

Описание

Какую проблему решает

Патент решает проблему искусственного завышения показателей популярности (Popularity Measure) для документов, которые часто возвращаются в ответ на широкие (broad) запросы. Широкие запросы (например, состоящие из одного-двух слов) генерируют огромное количество показов и, соответственно, кликов. Документы, ранжирующиеся по таким запросам, часто являются более абстрактными и могут накапливать популярность, которая не отражает их истинную релевантность или качество в специфическом контексте. Это искажает данные о поведении пользователей и может привести к неоптимальному ранжированию в последующих запросах.

Что запатентовано

Запатентована система, которая корректирует (обычно снижает вес или de-weights) показатель популярности документа, основываясь на широте запроса (Query Breadth), в контексте которого этот показатель был получен. Если запрос был широким, то связанное с ним действие пользователя (например, клик) вносит меньший вклад в итоговый показатель популярности документа. Это позволяет более точно оценивать популярность, отдавая предпочтение взаимодействиям, произошедшим в контексте более узких и специфических запросов.

Как это работает

Система работает в несколько этапов:

  • Определение Популярности: Система фиксирует взаимодействие пользователя с результатом поиска (например, клик) в контексте определенного запроса (Query/Clicked Result Pair).
  • Оценка Широты Запроса (Query Breadth): Система оценивает, насколько широким или узким был исходный запрос. Это может определяться разными методами: количеством возвращенных результатов, длиной запроса, частотой использования запроса или скоростью снижения IR score (показателя релевантности) в топе выдачи.
  • Корректировка (De-weighting): Показатель популярности, полученный от этого взаимодействия, корректируется с учетом широты запроса. Чем шире запрос, тем меньше вес взаимодействия.
  • Агрегация: Скорректированные (De-weighted) показатели популярности сохраняются и используются для ранжирования в будущих поисковых запросах.

Актуальность для SEO

Высокая. Поведенческие факторы и качество трафика играют значительную роль в современном поиске. Механизмы, позволяющие Google отличать ценные сигналы от шума (например, случайных кликов по общим запросам), критически важны для поддержания качества выдачи. Этот патент описывает фундаментальный подход к нормализации поведенческих данных, который остается актуальным для оценки качества взаимодействия пользователя с контентом.

Важность для SEO

Патент имеет высокое значение (8/10) для SEO-стратегии. Он демонстрирует, что не все клики одинаково полезны для ранжирования. Клик, полученный по узкому, специфическому запросу, может иметь больший вес, чем клик по высокочастотному общему запросу. Это подчеркивает неэффективность стратегий, направленных исключительно на получение топа по самым общим "head terms", и подтверждает важность работы над релевантностью в рамках конкретных интентов и длиннохвостовых запросов.

Детальный разбор

Термины и определения

Popularity Measure (Показатель популярности)
Метрика, используемая для оценки популярности документа. Может быть зависимой от запроса (query-dependent), например, click-through ratio (отношение кликов к показам по конкретному запросу), или независимой (query-independent), например, общее количество кликов (click count).
Query Breadth (Широта запроса)
Мера того, насколько общим или специфическим является запрос. Широкие запросы обычно имеют меньше терминов, чаще используются и возвращают больше результатов.
Query Breadth Analyzer (Анализатор широты запроса)
Компонент поисковой системы, отвечающий за определение меры широты запроса.
IR Score (Information Retrieval Score)
Показатель релевантности документа запросу, используемый в информационном поиске.
IR Score Drop-off (Снижение IR Score)
Скорость, с которой снижается IR score от первого результата к последующим (например, к N-му результату) в выдаче. Медленное снижение (slow drop-off) указывает на широкий запрос, так как много документов имеют схожую высокую релевантность.
Query/Clicked Result Pair (Пара Запрос/Кликнутый результат)
Запись, связывающая конкретный поисковый запрос с документом, на который кликнул пользователь в результатах этого запроса.
De-weighting (Снижение веса, де-вейтинг)
Процесс уменьшения значения показателя популярности, основанный на мере широты запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод корректировки популярности.

  1. Система (server device) оценивает широту (breadth) поискового запроса.
  2. Идентифицируется взаимодействие пользователя (user interaction) с первым документом в наборе результатов, отвечающем этому запросу.
  3. Система изменяет рейтинг популярности (ranking of a popularity) первого документа на основе этого взаимодействия И широты запроса.
  4. Ключевое условие: Величина изменения рейтинга популярности уменьшается с увеличением широты поискового запроса. (Чем шире запрос, тем меньше влияние взаимодействия).
  5. Система делает этот рейтинг популярности доступным для ответа на последующие поисковые запросы.

Claim 2 (Зависимый от 1): Уточняет метод оценки широты. Широта оценивается на основе общего количества документов в наборе результатов.

Claim 3 (Зависимый от 1): Уточняет метод оценки широты. Широта оценивается на основе разницы в релевантности (differences in relevances) документов в наборе результатов. (Это относится к IR Score Drop-off).

Claim 5 (Зависимый от 1): Уточняет механизм изменения рейтинга. Изменение происходит путем взвешивания (weighting) взаимодействия пользователя на основе широты запроса.

Claims 7, 8, 9 (Зависимые от 1): Уточняют тип взаимодействия пользователя. Это может быть click count (Claim 7), click-through ratio (Claim 8) или взаимодействие, идентифицированное независимо от поискового запроса (Claim 9).

Где и как применяется

Изобретение затрагивает этапы сбора данных о поведении пользователей и последующее ранжирование.

CRAWLING (Data Acquisition) / INDEXING
На этих этапах система собирает данные, необходимые для расчета IR scores и индексирует документы. Это является предпосылкой для возможности расчета широты запроса (например, количества результатов или IR score drop-off).

RANKING – Ранжирование
Алгоритм напрямую влияет на этот этап. Предварительно рассчитанные и скорректированные показатели популярности (De-weighted Popularity Measure) используются как один из сигналов для определения итогового ранжирования документов в ответ на последующий запрос пользователя.

Офлайн-обработка данных (Log Processing)
Основная логика патента (расчет широты и корректировка популярности) применяется при обработке логов поисковой системы (например, в ночном пакетном процессе).

  1. Сбор данных: Система анализирует логи, содержащие Query/Clicked Result Pairs.
  2. Расчет широты: Для каждого запроса в логах Query Breadth Analyzer рассчитывает его широту.
  3. Корректировка популярности: Ranking Processor использует данные о широте для корректировки вклада каждого взаимодействия в итоговый показатель популярности документа.

Входные данные:

  • Логи поисковых запросов и кликов (Query/Clicked Result Pair).
  • Данные индекса (для определения количества результатов по запросу).
  • IR Scores документов для запросов (для расчета IR Score Drop-off).

Выходные данные:

  • Скорректированные показатели популярности (De-weighted Popularity Measure) для документов, сохраненные в Popularity DB.
  • Меры широты запросов, сохраненные в Query Breadth DB.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на ранжирование по широким, высокочастотным запросам (Head Terms). Документы, которые накапливают большую часть своей популярности из таких запросов, могут быть понижены по сравнению с документами, популярность которых основана на узких запросах.
  • Типы контента: Влияет на все типы контента, популярность которых измеряется через взаимодействие пользователей (клики, показы). Особенно затрагивает абстрактные или общие информационные страницы, которые часто релевантны широким запросам.

Когда применяется

Алгоритм применяется постоянно в процессе обработки логов пользовательского поведения и обновления показателей популярности.

  • Условия применения: Применяется к любому зафиксированному взаимодействию пользователя с результатом поиска (например, клику).
  • Триггеры активации: Активируется, когда система обрабатывает Query/Clicked Result Pair для обновления показателей популярности документа. Степень корректировки зависит от рассчитанной широты запроса.

Пошаговый алгоритм

Описан процесс корректировки показателя популярности на основе анализа логов.

  1. Получение данных о взаимодействии: Система извлекает запись из лог-файла, содержащую поисковый запрос и идентификатор результата, на который был совершен клик (Query/Clicked Result Pair).
  2. Определение исходной популярности: Система определяет показатель популярности для этой пары. Например, подсчитывает количество вхождений этой пары в логе (т.е. сколько раз этот результат был кликнут в ответ на этот запрос).
  3. Определение широты запроса: Query Breadth Analyzer определяет меру широты для данного запроса. Это может включать:
    • Подсчет общего количества возвращенных результатов.
    • Анализ длины или частоты запроса.
    • Расчет скорости снижения IR Score (например, вычисление отношения IRnIR1IR_{n}/IR_{1}).
  4. Снижение веса (De-weighting): Система корректирует показатель популярности, используя меру широты. Если запрос широкий (например, IR Score Drop-off медленный, отношение близко к 1), показатель популярности снижается. В одном из вариантов реализации для снижения веса популярность умножается на (1 - Мера широты).
  5. Сохранение скорректированного показателя: Скорректированный показатель популярности (De-weighted Popularity Measure) сохраняется в базе данных популярности.
  6. Использование в ранжировании: При обработке последующих поисковых запросов система использует этот скорректированный показатель для ранжирования результатов.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Основные данные, используемые в патенте.
    • Click count (Количество кликов): Сколько раз на документ кликнули.
    • Impression count (Количество показов): Сколько раз документ был показан пользователям.
    • Click-through ratio (CTR): Отношение кликов к показам.
    • Журналы запросов и кликов (Query/Clicked Result Pair).
    • Частота использования запроса: Как часто конкретный запрос задается пользователями.
  • Контентные/Системные факторы:
    • IR Scores: Показатели релевантности документов запросу.
    • Количество результатов: Общее число документов, найденных по запросу.
    • Длина запроса: Количество терминов в запросе.

Какие метрики используются и как они считаются

Система вычисляет Query Breadth, используя одну или несколько из следующих метрик:

  1. Количество результатов: Чем больше результатов возвращает запрос, тем он шире.
  2. Длина запроса: Чем меньше терминов в запросе, тем он шире. Может рассчитываться как отношение длины запроса к средней длине всех запросов.
  3. Частота запроса: Чем чаще используется запрос, тем он шире.
  4. IR Score Drop-off (Снижение IR Score): Скорость снижения релевантности в топе выдачи.
    • Рассчитывается как отношение IR Score N-го результата к IR Score первого результата: IRnIR1IR_{n}/IR_{1}.
    • Если отношение близко к 1, снижение медленное, запрос широкий.
    • Если отношение близко к 0, снижение быстрое, запрос узкий.

De-weighted Popularity Measure (Скорректированный показатель популярности):

  • Показатель популярности корректируется на основе широты. В одном из описанных примеров, если используется IR Score Drop-off, формула может выглядеть так:
  • Скорректированная Популярность = Исходная Популярность * (1 - (IRnIR1)(IR_{n}/IR_{1})).
  • При широком запросе (IRnIR1IR_{n}/IR_{1} близко к 1), множитель близок к 0, и популярность сильно снижается.

Выводы

  1. Не все клики имеют одинаковый вес: Патент явно утверждает, что вклад взаимодействия пользователя (например, клика) в показатель популярности документа должен зависеть от контекста запроса. Взаимодействия, произошедшие в рамках широких запросов, имеют меньшую ценность.
  2. Борьба с искусственной популярностью: Основная цель — предотвратить ситуацию, когда общие документы получают незаслуженно высокий рейтинг популярности только потому, что они часто показываются по высокочастотным, но неспецифическим запросам.
  3. Многофакторная оценка широты запроса: Google может определять широту запроса (Query Breadth) разными способами: по количеству результатов, длине запроса, частоте его использования и скорости снижения релевантности (IR Score Drop-off) в топе выдачи.
  4. Предпочтение специфичности: Система стимулирует ранжирование документов, которые доказали свою популярность в ответ на узкие, специфические запросы. Это повышает общую точность и полезность поисковой выдачи.
  5. Нормализация поведенческих сигналов: Этот механизм является способом нормализации поведенческих данных, позволяя отфильтровать шум от ценных сигналов о качестве и релевантности.

Практика

Best practices (это мы делаем)

  • Фокус на средне- и низкочастотных запросах (Long-Tail): Сосредоточьтесь на создании контента, который максимально точно отвечает на специфические запросы пользователей. Клики, полученные по таким запросам, вероятно, будут иметь больший вес при расчете показателей популярности, так как эти запросы будут классифицированы как узкие.
  • Повышение тематического авторитета через специфику: Развивайте глубину проработки темы, охватывая множество узких подтем и интентов, а не только самые общие аспекты. Это увеличивает вероятность получения высоковесомых кликов.
  • Оптимизация под конкретные интенты, а не только ключевые слова: Убедитесь, что контент решает конкретную задачу пользователя. Если страница ранжируется по широкому запросу, но не удовлетворяет интент большинства пользователей, низкий CTR в сочетании с широтой запроса может быть особенно негативным сигналом (как упомянуто в патенте: низкий CTR подразумевает, что результат не особенно релевантен вопросам пользователей).
  • Анализ качества трафика по запросам: Анализируйте, по каким запросам приходят пользователи и как они взаимодействуют с контентом. Если основной трафик идет по очень общим запросам с высоким показателем отказов, это может указывать на необходимость уточнения контента или пересмотра стратегии таргетинга.

Worst practices (это делать не надо)

  • Исключительная ставка на Head Terms: Построение стратегии исключительно вокруг ранжирования по самым высокочастотным и общим запросам (1-2 слова). Даже при достижении топа и получении большого количества кликов, вклад этих кликов в общую популярность сайта может быть снижен (de-weighted) из-за широты запросов.
  • Создание поверхностного контента для широких тем: Создание "обобщенных" статей, которые пытаются охватить слишком широкую тему без должной детализации. Такие страницы могут собирать показы по широким запросам, но их показатели популярности будут скорректированы в сторону уменьшения.
  • Игнорирование специфики и интента: Оптимизация страницы под ключевое слово без учета того, насколько специфичен интент, стоящий за ним.

Стратегическое значение

Патент подтверждает стратегию Google по уходу от простых количественных метрик к более сложным, контекстуально-зависимым оценкам. Поведенческие факторы являются важной частью ранжирования, но они проходят сложный процесс нормализации и взвешивания. Для SEO это означает, что качество взаимодействия и точность попадания в интент пользователя важнее, чем абсолютный объем трафика. Долгосрочная стратегия должна фокусироваться на построении репутации ресурса как лучшего ответа на конкретные, четко сформулированные потребности аудитории.

Практические примеры

Сценарий: Сравнение веса кликов для интернет-магазина электроники

  1. Ситуация А (Широкий запрос):
    • Запрос: "digital camera" (цифровая камера).
    • Характеристики: Очень высокая частота, миллионы результатов, медленное снижение IR Score. Google классифицирует его как очень широкий (Query Breadth = 0.95).
    • Действие: Пользователь кликает на результат магазина.
    • Результат: Вклад этого клика в популярность страницы снижается. Например, вес клика = 1 * (1 - 0.95) = 0.05.
  2. Ситуация Б (Узкий запрос):
    • Запрос: "buy canon powershot s100 silver" (купить canon powershot s100 серебристый).
    • Характеристики: Низкая частота, тысячи результатов, быстрое снижение IR Score. Google классифицирует его как очень узкий (Query Breadth = 0.1).
    • Действие: Пользователь кликает на результат магазина.
    • Результат: Вклад этого клика в популярность страницы почти не снижается. Например, вес клика = 1 * (1 - 0.1) = 0.9.
  3. Вывод для SEO: Для повышения показателей популярности, которые используются в ранжировании, магазину выгоднее получить 100 кликов по запросу Б (общий вес 90), чем 1000 кликов по запросу А (общий вес 50). Это стимулирует оптимизацию под конкретные модели и характеристики товаров.

Вопросы и ответы

Что такое "широта запроса" (Query Breadth) согласно патенту?

Это мера того, насколько общим или специфическим является запрос. В патенте предложено несколько методов ее измерения: количество возвращаемых результатов (чем больше, тем шире), длина запроса (чем короче, тем шире), частота использования запроса пользователями (чем чаще, тем шире) и скорость снижения показателя релевантности IR Score в топе выдачи (чем медленнее снижается, тем шире).

Как именно рассчитывается снижение IR Score (IR Score Drop-off)?

Один из предложенных методов — это расчет отношения показателя релевантности N-го документа к показателю релевантности первого документа (IRnIR1IR_{n}/IR_{1}). Если это отношение близко к 1 (например, 10-й документ почти так же релевантен, как и 1-й), это означает медленное снижение и широкий запрос. Если отношение близко к 0, это узкий запрос.

Означает ли это, что клики по высокочастотным запросам бесполезны для SEO?

Нет, они не бесполезны, но их вклад в показатели популярности документа (которые используются для ранжирования) может быть значительно снижен. Если запрос классифицирован как очень широкий, вес клика может быть близок к нулю. Это делает стратегию фокусировки только на самых общих запросах менее эффективной по сравнению с работой над специфическими запросами.

Какие показатели популярности корректируются этим методом?

Патент упоминает, что корректироваться могут как зависимые от запроса (query-dependent), так и независимые (query-independent) показатели. Конкретные примеры включают количество кликов (click count), количество показов (impression count) и соотношение кликов к показам (click-through ratio).

Как этот патент влияет на стратегию работы с семантическим ядром?

Он подчеркивает критическую важность проработки средне- и низкочастотных (Long-Tail) запросов. Для построения сильного профиля популярности необходимо обеспечивать высокую релевантность и получать клики именно по узким, специфическим запросам, так как вес этих кликов будет выше. Глубина проработки темы становится важнее широты охвата.

Может ли короткий запрос быть классифицирован как узкий?

Да. Хотя длина запроса является одним из индикаторов широты, патент признает, что короткие запросы могут быть узкими (например, уникальная фамилия, освещенная в СМИ). Поэтому Google может использовать комбинацию метрик, включая количество результатов и IR Score Drop-off, для более точной оценки широты, а не полагаться только на длину.

Когда происходит расчет и корректировка популярности?

В патенте описано, что этот процесс может происходить офлайн, например, во время пакетной обработки логов поисковой системы (nightly batch process). Система анализирует прошлые взаимодействия пользователей и обновляет показатели популярности, которые затем используются для ранжирования будущих запросов в реальном времени.

Как Google использует скорректированный показатель популярности?

Скорректированный (De-weighted) показатель популярности сохраняется в базе данных (Popularity DB) и используется как один из сигналов ранжирования при ответе на последующие поисковые запросы. Документы с более высоким скорректированным показателем популярности получат преимущество.

Влияет ли этот механизм на оценку качества контента?

Да, косвенно. Патент упоминает, что очень низкий click-through ratio подразумевает, что результат часто показывается по широким запросам, но не является особенно релевантным для пользователей. Механизм де-вейтинга помогает нормализовать эти данные, чтобы лучше понять истинную полезность контента в специфических контекстах.

Что делать, если мой сайт в основном ранжируется по широким запросам?

Необходимо диверсифицировать стратегию контента. Начните создавать более глубокий и специфический контент, который отвечает на узкие запросы в рамках вашей тематики. Это позволит накапливать показатели популярности с более высоким весом и улучшит общее восприятие вашего сайта поисковой системой как экспертного ресурса в конкретных областях.

Похожие патенты

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google приоритизирует локальное поведение пользователей над глобальной популярностью в международном поиске
Google использует систему для корректировки поискового ранжирования на основе местоположения и языка пользователя. Система приоритизирует данные о кликах от конкретной популяции пользователей (например, страны) над более широкими популяциями (например, глобальными данными). Глобальные сигналы популярности «понижаются» в весе, чтобы гарантировать более высокое ранжирование локально релевантных результатов, даже если они менее популярны в мировом масштабе.
  • US8694511B1
  • 2014-04-08
  • Local SEO

  • Поведенческие сигналы

  • SERP

Как Google использует графы уточнений запросов для бустинга документов и переписывания широких запросов
Google анализирует, как пользователи уточняют свои запросы, и строит «Граф Запросов». Этот граф используется двумя способами: 1) Для повышения ранжирования документов (особенно по заголовкам), которые точно соответствуют популярным кластерам запросов, даже если у них мало ссылок. 2) Для автоматического переписывания широкого запроса пользователя в его наиболее популярные конкретные уточнения и объединения результатов.
  • US20150169589A1
  • 2015-06-18
  • Семантика и интент

  • Свежесть контента

Как Google агрегирует поведенческие данные из похожих запросов для ранжирования редких и длиннохвостых запросов
Google использует механизм обобщения запросов для улучшения ранжирования, особенно когда исторических данных по исходному запросу недостаточно. Система создает варианты запроса (удаляя стоп-слова, используя синонимы, стемминг или частичное совпадение) и агрегирует данные о поведении пользователей (клики, dwell time) из этих вариантов. Это позволяет оценить качество документа для исходного запроса, используя статистику из семантически близких запросов.
  • US9110975B1
  • 2015-08-18
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Популярные патенты

Как Google автоматически определяет и отображает обратные ссылки (цитирования) между независимыми веб-страницами
Патент Google, описывающий фундаментальный механизм автоматического обнаружения ссылок между веб-страницами разных авторов. Когда система обнаруживает, что Страница B ссылается на Страницу A, она может автоматически встроить представление (например, ссылку) Страницы B в Страницу A при её показе пользователю. Это технология для построения и визуализации графа цитирований в Интернете.
  • US8032820B1
  • 2011-10-04
  • Ссылки

  • Индексация

  • Краулинг

Как Google использует историю поиска и браузинга пользователя для персонализации и изменения результатов выдачи
Google записывает историю поиска и просмотров пользователя для последующей персонализации выдачи. Система может повышать в ранжировании ранее посещенные сайты, добавлять в текущую выдачу релевантные результаты из прошлых похожих запросов, а также понижать сайты, которые пользователь ранее видел, но проигнорировал. Патент также описывает создание "предпочитаемых локаций" на основе частоты посещений и времени пребывания на сайте.
  • US9256685B2
  • 2016-02-09
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google находит, оценивает и показывает «интересные факты» о сущностях в поиске
Google идентифицирует «уникальные» или «интересные» факты о сущностях, анализируя документы, на которые ссылаются с использованием триггеров (например, «fun facts»). Система извлекает предложения, кластеризует их для поиска лучшей формулировки и оценивает качество факта на основе авторитетности источника, уникальности терминов и топикальности. Эти факты затем показываются в выдаче в виде специальных блоков.
  • US11568274B2
  • 2023-01-31
  • Knowledge Graph

  • Семантика и интент

  • EEAT и качество

Как Google предсказывает следующий запрос пользователя на основе контента текущей страницы и исторических данных
Google использует машинное обучение для анализа логов поведения пользователей, чтобы понять, что они ищут после посещения определенного контента. Система создает совместное векторное пространство (joint embedding) для документов и запросов, где близость отражает семантическую связь и вероятность совместной встречаемости. Это позволяет предлагать релевантные последующие запросы (query suggestions) в реальном времени, даже если ключевые слова для этих запросов на странице отсутствуют.
  • US9594851B1
  • 2017-03-14
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google определяет географическую релевантность веб-страницы, анализируя физическое местоположение её посетителей
Google анализирует физическое местоположение (используя GPS, IP и т.д.) пользователей, которые взаимодействуют с веб-страницей (например, совершают клик и долго её изучают). Агрегируя эти данные, система определяет географическую релевантность страницы («Центр») и область её популярности («Дисперсию»), даже если на самой странице нет адреса. Эта информация используется для повышения позиций страницы в поиске для пользователей, находящихся в этой области.
  • US9552430B1
  • 2017-01-24
  • Local SEO

  • Поведенческие сигналы

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google ранжирует контент на других языках, основываясь на поведении пользователей с одинаковыми языковыми настройками
Google использует статистику кликов (CTR), сегментированную по языковым предпочтениям пользователей, для корректировки ранжирования. Если пользователи, предпочитающие язык X, часто кликают на результат на языке Y, этот результат будет повышен в выдаче для других пользователей с предпочтением языка X. Это позволяет ранжировать контент, популярный у определенной языковой группы, независимо от языка самого контента.
  • US8375025B1
  • 2013-02-12
  • Мультиязычность

  • Поведенческие сигналы

  • Персонализация

Как Google использует навигационные запросы, консенсус кликов и анкорных текстов для определения глобального качества сайта
Google анализирует потоки запросов, чтобы определить, когда пользователи ищут конкретный сайт (навигационный интент). Если запрос явно указывает на документ (через подавляющее большинство кликов пользователей или доминирование в анкор-текстах), этот документ получает «баллы качества». Эти баллы используются как глобальный сигнал качества, повышая ранжирование сайта по всем остальным запросам.
  • US7962462B1
  • 2011-06-14
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google автоматически распознает сущности в тексте и связывает их в Knowledge Graph с помощью динамических поисковых ссылок
Google использует автоматизированную систему для поддержания связей между сущностями (объектами) в своем хранилище фактов (Knowledge Graph). Система сканирует текст, статистически определяет значимые фразы и сверяет их со списком известных объектов. При совпадении создается динамическая «поисковая ссылка» вместо фиксированного URL. Это позволяет Google постоянно обновлять связи по мере добавления новых знаний.
  • US8260785B2
  • 2012-09-04
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

seohardcore