SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует статистику поиска и кликов по разным вертикалям (Web, Картинки, Видео) для определения предпочтительного типа контента и ранжирования в Универсальном Поиске

MODIFYING SEARCH RESULT RANKING BASED ON CORPUS SEARCH STATISTICS (Модификация ранжирования результатов поиска на основе статистики поиска по корпусам)
  • US8359309B1
  • Google LLC
  • 2011-02-07
  • 2013-01-22
  • SERP
  • Поведенческие сигналы
  • Мультимедиа
  • Персонализация
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует, в каких вертикалях (корпусах) пользователи чаще ищут определенный запрос и на какие типы результатов они кликают в смешанной выдаче. Система вычисляет "Меру относительной релевантности" для каждого корпуса и использует её для повышения результатов из наиболее предпочтительного корпуса, учитывая язык, страну пользователя и актуальные тренды.

Описание

Какую проблему решает

Патент решает задачу определения того, какой тип контента или корпус (например, Web, Картинки, Новости, Видео) является наиболее релевантным для конкретного поискового запроса. Цель — улучшить качество смешанной выдачи (Универсальный Поиск/Universal Search), автоматически определяя предпочтения пользователей относительно формата контента на основе агрегированного поведения.

Что запатентовано

Запатентована система для вычисления Меры относительной релевантности (Measure of Relative Relevance) различных корпусов к запросу. Эта мера основывается на двух ключевых типах данных: статистике поиска (где пользователи ищут) и статистике кликов (на что они кликают в смешанной выдаче). Полученные показатели используются как сигнал для модификации ранжирования результатов из разных корпусов.

Как это работает

Система анализирует исторические данные, используя два основных механизма:

  • Ожидания (Relative Search Fraction - RSF): Сравнивается, насколько популярен запрос внутри одного корпуса по сравнению с другим (нормализовано по размеру корпусов). Это показывает, где пользователи ожидают найти ответ.
  • Удовлетворенность (CTR Ratios): В смешанной выдаче сравнивается CTR результатов из разных корпусов. Если пользователи чаще кликают на Картинки, чем на Веб-результаты, Картинки считаются более релевантными.

Система также сегментирует данные по языку и стране (Smoothing) и придает больший вес недавним данным (Exponential Moving Average), чтобы учитывать локальные особенности и тренды. Итоговая мера релевантности используется для бустинга результатов из предпочтительного корпуса.

Актуальность для SEO

Высокая. Смешанная выдача является стандартом современного поиска Google. Механизмы, определяющие, когда и как высоко ранжировать результаты из вертикальных поисков (Картинки, Видео, Новости), критически важны для формирования SERP. Описанные методы анализа статистики поведения пользователей для управления смешиванием остаются фундаментальными.

Важность для SEO

Патент имеет высокое стратегическое значение (8.5/10). Он описывает механизм, который определяет предпочтительный формат контента для запроса. Это напрямую влияет на SEO-стратегию: если агрегированное поведение пользователей указывает на предпочтение видео, текстовый контент будет иметь меньше шансов занять высокие позиции. Понимание этих принципов необходимо для эффективной оптимизации под Универсальный Поиск.

Детальный разбор

Термины и определения

Corpus (Корпус)
Коллекция контента с общими характеристиками (Вертикаль). Примеры: Web, Images, News, Video, Maps.
Base Corpus (Базовый корпус, CP1)
Основной корпус, доминирующий в выдаче (обычно Web), относительно которого происходит сравнение.
Under-represented Corpus (Второстепенный корпус, CP2)
Корпус, результаты которого показаны в меньшем количестве (например, блок Картинок в Веб-поиске).
Corpus Search Fraction (R(Q,CP))
Доля поиска. Популярность запроса Q внутри корпуса CP. Рассчитывается как: S(Q,CP)/S(CP)S(Q,CP) / S(CP) (Число поисков Q в CP / Общее число поисков в CP).
Relative Search Fraction (RSF)
Относительная доля поиска. Сравнение популярности запроса между корпусами: R(Q,CP2)/R(Q,CP1)R(Q, CP2) / R(Q, CP1).
OCTR и BaseCTR
Показатели кликабельности (CTR) для результатов из Второстепенного корпуса (OCTR) и Базового корпуса (BaseCTR) в смешанной выдаче.
Measure of Relative Relevance (Мера относительной релевантности)
Итоговый показатель для модификации ранжирования. Может основываться на RSF, отношении OCTR/BaseCTR или их комбинации.
Key (k)
Набор признаков для сегментации статистики, например, k=(Q, L, C) – Запрос, Язык, Страна.
Smoothing (Сглаживание)
Техника комбинирования статистики разной гранулярности (например, глобальной и локальной) для обеспечения надежности данных при их недостатке.
Exponential Moving Average (EMA)
Метод расчета метрик, придающий больший вес свежим данным для учета трендов.

Ключевые утверждения (Анализ Claims)

Основные независимые пункты патента (Claims 1, 9, 17) фокусируются на методе определения релевантности, основанном на анализе кликов (CTR) в смешанной выдаче с учетом контекста пользователя.

Claim 1 (Независимый пункт): Описывает метод расчета относительной релевантности на основе сравнения CTR разных корпусов с учетом языка.

  1. Система определяет количество показов и кликов для результатов из Базового корпуса (Base Corpus) в ответ на запрос Q.
  2. Система определяет количество показов и кликов для результатов из Второго корпуса (Second Corpus) для того же запроса Q. (Уточняется, что результатов из второго корпуса меньше).
  3. Ключевое условие сегментации: Эти данные собираются для поисков, инициированных пользователями, использующими определенный Язык (L) в разных странах.
  4. Вычисляется CTR для Базового корпуса (BaseCTR).
  5. Вычисляется CTR для Второго корпуса (OCTR).
  6. Вычисляется Мера относительной релевантности, основанная на отношении CTR Второго корпуса к CTR Базового корпуса (OCTR/BaseCTROCTR / BaseCTR).
  7. Эта мера передается в систему ранжирования для использования при обработке новых поисков.

Ядром изобретения является использование сравнительного CTR между разными типами контента в смешанной выдаче как прямого сигнала предпочтений пользователей для конкретного запроса и языкового контекста. Если пользователи систематически кликают на результаты из второго корпуса (например, Видео) чаще, чем на результаты из базового (Web), система повысит релевантность второго корпуса.

Claim 7 (Зависимый от 1): Уточняет механизм сглаживания данных по языку и стране.

Данные для расчета CTR берутся как из языковых (L), так и из страновых (C) сегментов. Итоговый расчет основывается на взвешенной комбинации (weighted combination) этих данных. Это позволяет системе комбинировать данные разной гранулярности (например, глобальные, языковые и страновые) для обеспечения статистической надежности метрик, особенно при недостатке данных в конкретном сегменте.

Где и как применяется

Изобретение затрагивает несколько этапов поиска, используя офлайн-анализ для влияния на онлайн-ранжирование.

INDEXING – Индексирование
Контент должен быть классифицирован и отнесен к соответствующим корпусам (Web, Images, News и т.д.).

QUNDERSTANDING (Офлайн-анализ)
Основная вычислительная работа происходит офлайн. Система анализирует Session Logs для расчета статистики RSF и CTR Ratios для множества запросов, языков и стран. Применяются механизмы EMA и Smoothing. Данные сохраняются в базе данных.

RANKING – Ранжирование (Онлайн)
Генерируются кандидаты из различных корпусов и рассчитываются их базовые IR scores.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование
Ключевой этап применения. При получении нового запроса система извлекает рассчитанную Меру относительной релевантности для разных корпусов. Эта мера используется для модификации (бустинга или понижения) базовых IR scores результатов перед их финальным смешиванием в единую выдачу (SERP).

Входные данные:

  • Запрос (Q), Язык (L), Страна (C).
  • Базовые IR scores результатов из разных корпусов.
  • База данных статистики по корпусам (RSF, CTR данные).

Выходные данные:

  • Скорректированные IR scores.
  • Финальный смешанный список результатов (Blended SERP).

На что влияет

  • Специфические запросы: Наибольшее влияние на запросы, где интент пользователя сильно склоняется к определенному типу медиа (визуальные, новостные, инструкционные запросы) или где интент неоднозначен.
  • Конкретные типы контента: Напрямую влияет на видимость и позиционирование блоков из вертикальных поисков (Картинки, Видео, Новости, Карты) в основной выдаче.
  • Языковые и географические ограничения: Предпочтения корпусов рассчитываются с учетом контекста (L/C), поэтому выдача для одного и того же запроса может сильно отличаться по составу корпусов в разных странах.

Когда применяется

  • Условия применения: Алгоритм применяется, когда система формирует смешанную (универсальную) выдачу и должна определить относительную важность результатов из разных корпусов.
  • Триггеры активации: Наличие в базе данных достаточного объема статистики (выше порога T) для данного запроса, позволяющей рассчитать надежные показатели RSF или CTR Ratios.

Пошаговый алгоритм

Процесс А: Офлайн-анализ и генерация статистики (Периодический)

  1. Сбор данных: Обработка логов сессий. Сбор данных о запросах (Q), корпусах (CP), показах, кликах, языке (L) и стране (C).
  2. Агрегация и Сегментация: Агрегация данных по ключам разной гранулярности: (Q), (Q, L), (Q, L, C).
  3. Расчет базовых метрик: Вычисление Corpus Search Fraction (R(Q,CP)) и CTR (OCTR, BaseCTR) для каждого сегмента.
  4. Применение временного взвешивания (EMA): Обновление метрик с использованием Exponential Moving Average для придания большего веса свежим данным и учета трендов.
  5. Сглаживание (Smoothing): Комбинирование статистики разной гранулярности для компенсации недостатка данных на детальных уровнях (например, если данных по стране мало, используются глобальные данные).
  6. Расчет относительной релевантности: Вычисление RSF и отношений CTR между корпусами.
  7. Фильтрация и Хранение: Фильтрация статистики ниже порога T и сохранение результатов в мастер-базе данных.

Процесс Б: Обработка запроса в реальном времени

  1. Получение запроса и контекста: Получение Q, L, C от пользователя.
  2. Генерация кандидатов: Поиск результатов в релевантных корпусах и расчет базовых IR scores.
  3. Извлечение статистики: Запрос к базе данных для получения показателей относительной релевантности для данного Q, L, C.
  4. Трансформация в бустинг-фактор: Преобразование показателей релевантности в множители для ранжирования (например, с помощью Squashing Function).
  5. Модификация ранжирования: Применение бустинг-факторов к базовым IR scores результатов в зависимости от их корпуса.
  6. Смешивание (Blending): Формирование итоговой смешанной выдачи на основе модифицированных оценок.

Какие данные и как использует

Данные на входе

Система полагается исключительно на поведенческие и контекстуальные данные, агрегированные из логов поиска.

  • Поведенческие факторы:
    • Количество поисков запроса в определенном корпусе (S(Q,CP)).
    • Общее количество поисков в корпусе (S(CP)).
    • Показы (Impressions) и Клики (Clicks) на результаты из разных корпусов в смешанной выдаче.
  • Пользовательские и Географические факторы: Язык (L) и Страна (C), используемые для сегментации всей статистики (Key k).
  • Временные факторы: Дата/время действий используются для расчета EMA и приоритизации свежих данных.

Какие метрики используются и как они считаются

  • Corpus Search Fraction (R(Q,CP)): Нормализованная популярность запроса внутри корпуса. R(Q,CP)=S(Q,CP)/S(CP)R(Q,CP) = S(Q,CP) / S(CP).
  • Relative Search Fraction (RSF): Сравнение популярности между корпусами. RSF=R(Q,CP2)/R(Q,CP1)RSF = R(Q, CP2) / R(Q, CP1).
  • CTR Ratio: Сравнение кликабельности в смешанной выдаче. OCTR/BaseCTROCTR / BaseCTR.

Методы обработки метрик:

  • Exponential Moving Average (EMA): Используется для учета временной динамики. Формула, описанная в патенте, учитывает количество недавних поисков (N) как меру значимости недавних изменений: R[d]←αNR[d−1]+(1−αN)(Sd(k)/Sd(k′))R_{[d]} \leftarrow \alpha^{N}R_{[d-1]} + (1-\alpha^{N})(S_{d}(k)/S_{d}(k')) (упрощенное представление для R(k,CP)).
  • Smoothing (Сглаживание): Используется для комбинирования данных разной гранулярности (например, глобальной и локальной) с использованием предопределенных констант (K) для взвешивания.
  • Squashing Function: Используется для преобразования RSF в бустинг-фактор, ограничивая максимальное влияние. Пример из патента: RSF∗J/(RSF+J−1)RSF*J / (RSF + J - 1), где J – константа.

Выводы

  1. Релевантность формата контента определяется поведением пользователей: Google активно измеряет и использует предпочтения пользователей относительно типа контента (корпуса) для конкретных запросов. Релевантность определяется не только темой, но и форматом подачи информации.
  2. Два ключевых сигнала: Ожидание и Удовлетворенность: Система различает, где пользователи ожидают найти информацию (измеряется через Relative Search Fraction) и что они фактически выбирают (измеряется через отношение CTR разных корпусов в смешанной выдаче).
  3. Критичность локализации и языка (Контекст): Статистика сегментируется по языку и стране. Поведение пользователей в одном регионе напрямую влияет на ранжирование в этом регионе. Механизм Smoothing обеспечивает надежность данных, комбинируя локальные и глобальные тренды при необходимости.
  4. Адаптация к трендам (Свежесть): Использование Exponential Moving Average позволяет системе быстро реагировать на изменения в поведении пользователей и актуальные события, придавая больший вес недавним данным.
  5. Инфраструктура Универсального Поиска: Этот механизм напрямую управляет составом универсальной выдачи и определяет видимость и позиционирование вертикальных блоков (картинки, видео, новости).

Практика

Best practices (это мы делаем)

  • Комплексный анализ SERP и интента формата: Для ключевых запросов анализируйте, какие корпуса (вертикали) Google считает релевантными. Доминирование видео или картинок указывает на высокие показатели RSF и CTR Ratio для этих корпусов.
  • Создание контента в предпочтительных форматах: Стратегия должна соответствовать предпочтениям пользователей. Если для запроса предпочтительнее видео (например, инструкции "How-to"), необходимо создавать и оптимизировать видеоконтент, а не только текст.
  • Оптимизация под вертикальные поиски (VSEO, Image SEO): Уделяйте внимание оптимизации контента для Google Images, Google Video/YouTube, Google News. Высокая релевантность и хорошие поведенческие сигналы в этих вертикалях увеличивают вероятность бустинга в основном универсальном поиске.
  • Максимизация CTR в смешанной выдаче: Оптимизируйте элементы, влияющие на кликабельность (миниатюры видео и картинок, заголовки). Высокий CTR вашего контента в блоках Universal Search напрямую сигнализирует системе о его релевантности (влияя на OCTR).
  • Учет региональных особенностей (International SEO): Адаптируйте стратегию для разных рынков. Поскольку система использует сегментацию (Q,L,C), предпочтения форматов могут отличаться в зависимости от языка и страны.

Worst practices (это делать не надо)

  • Игнорирование формата контента: Попытки ранжировать текстовый контент по запросам, где поведение пользователей явно указывает на предпочтение других медиаформатов. Система предпочтет результаты из более релевантного корпуса.
  • Пренебрежение оптимизацией мультимедиа: Размещение неоптимизированных изображений или видео низкого качества. Такой контент не будет конкурентоспособен в вертикалях и не получит бустинга в универсальном поиске.
  • Игнорирование трендов: Полагаться на устаревшее понимание интента. Благодаря EMA, система быстро реагирует на изменения. Если тренд смещается (например, к новостному контенту), нужно своевременно адаптироваться.

Стратегическое значение

Патент подтверждает стратегическую важность диверсификации контента и оптимизации под Универсальный Поиск. Он демонстрирует, что Google интерпретирует интент не только на семантическом уровне, но и на уровне формата подачи информации, основываясь на данных о поведении пользователей. Долгосрочная стратегия должна включать мониторинг предпочтений форматов и инвестиции в производство разнообразного контента для всех релевантных вертикалей.

Практические примеры

Сценарий: Оптимизация запроса "Как завязать галстук"

  1. Анализ поведения (Данные Google): Система фиксирует, что пользователи часто ищут этот запрос в YouTube или Google Images (высокий RSF для Видео и Картинок). Также в смешанной веб-выдаче пользователи чаще кликают на видео или схемы-картинки, чем на текстовые инструкции (высокий OCTR по сравнению с BaseCTR).
  2. Расчет релевантности: Google вычисляет высокую Measure of Relative Relevance для корпусов Видео и Картинки.
  3. Действие SEO-специалиста: Приоритет отдается созданию короткого видео-руководства и пошаговой инфографики, а не длинной текстовой статьи.
  4. Оптимизация: Видео и инфографика оптимизируются для соответствующих вертикалей. Особое внимание уделяется привлекательности миниатюр (Thumbnails) для повышения CTR в смешанной выдаче.
  5. Результат: Система применяет бустинг к результатам из корпусов Видео и Картинки. Контент сайта занимает лидирующие позиции в соответствующих блоках универсального поиска, часто выше стандартных веб-результатов.

Вопросы и ответы

Какие два основных типа данных использует Google для определения предпочтительного корпуса?

Система использует два ключевых набора данных. Первый – Статистика Поиска (Relative Search Fraction), которая показывает, в какой вертикали пользователи ищут запрос. Это отражает их ожидания. Второй – Статистика Кликов (отношение CTR), которая показывает, на результаты из какого корпуса пользователи кликают в смешанной выдаче. Это отражает фактическую релевантность и удовлетворенность.

Что важнее: где пользователи ищут (RSF) или куда они кликают (CTR)?

Патент описывает использование обоих факторов, возможно, в виде взвешенной комбинации. CTR в смешанной выдаче (OCTR/BaseCTR) часто считается более сильным сигналом фактической полезности и удовлетворенности пользователя. Однако RSF важен как показатель явного намерения пользователя искать в определенной вертикали.

Как Google учитывает свежие тренды и изменения в поведении пользователей?

Система использует Exponential Moving Average (EMA) при расчете статистики. Это метод, который придает значительно больший вес недавним данным по сравнению с историческими. Если поведение меняется (например, из-за актуальных событий и роста интереса к Новостям), система быстро адаптирует свои оценки предпочтений корпусов.

Влияет ли язык и страна пользователя на эти расчеты?

Да, критически влияет. Вся статистика собирается и анализируется с учетом гранулярности по Языку (L) и Стране (C). Система стремится использовать наиболее детальные данные (Q, L, C). Это означает, что предпочтения по типам контента для одного и того же запроса могут сильно отличаться в разных регионах.

Что такое Smoothing (Сглаживание) и зачем оно нужно?

Smoothing используется для обеспечения надежности статистики при недостатке данных на высоком уровне гранулярности (например, по редкой стране или языку). Система комбинирует локальные данные с данными более общего уровня (например, глобальной статистикой). Это позволяет избежать некорректных выводов на основе недостаточной выборки.

Как этот патент влияет на SEO для изображений и видео?

Влияние критическое. Патент описывает механизм, который может значительно повысить (забустить) результаты из корпусов Images и Video в Универсальном Поиске, если система считает эти типы контента более релевантными запросу. Это подчеркивает необходимость серьезной работы над Image SEO и Video SEO как части общей стратегии.

Что такое Squashing Function и как она влияет на ранжирование?

Squashing Function – это математическая трансформация, применяемая к Мере относительной релевантности для расчета итогового коэффициента бустинга. Она используется для нормализации и ограничения максимального влияния этого сигнала, чтобы предотвратить чрезмерное повышение результатов только на основе предпочтения корпуса.

Может ли картинка или видео ранжироваться выше, чем ТОП-1 веб-результат?

Да. Если Мера относительной релевантности для корпуса Картинок или Видео значительно выше, чем для Веб-корпуса, и применен соответствующий агрессивный бустинг, блоки из этих вертикалей могут быть показаны на самой верхней позиции в смешанной выдаче, выше стандартных "синих ссылок".

Как я могу повлиять на эти показатели для моего контента?

Напрямую повлиять на RSF сложно, так как это глобальная статистика. Однако можно повлиять на CTR (OCTR). Создавая качественный контент для нужной вертикали и оптимизируя его представление (миниатюры, заголовки), вы повышаете вероятность клика в смешанной выдаче, что является позитивным сигналом для системы.

Применяется ли этот механизм ко всем запросам?

Нет. В патенте упоминается фильтрация (Filtering). Статистика рассчитывается и хранится только для запросов, которые превышают определенный порог популярности (Threshold T). Для редких или новых запросов (длинный хвост) этот механизм, скорее всего, не применяется.

Похожие патенты

Как Google определяет и ранжирует вертикали поиска (Web, Images, News, Local) на основе интента запроса и профиля пользователя
Патент описывает фундаментальный механизм Универсального Поиска (Universal Search). Система генерирует результаты из разных индексов (Web, Картинки, Новости, Карты) и вычисляет «Оценку Вероятности» (Likelihood Value) для каждой категории. Эта оценка определяет, какая вертикаль наиболее релевантна интенту запроса. Для расчета используются как агрегированные данные о поведении всех пользователей по схожим запросам, так и индивидуальный профиль пользователя.
  • US7966309B2
  • 2011-06-21
  • Семантика и интент

  • Персонализация

  • SERP

Как Google использует позиционный CTR (Selection Rate) для ранжирования и группировки вертикалей в Универсальном поиске
Google использует механизм для структурирования поисковой выдачи путем группировки результатов по категориям (вертикалям), таким как Новости, Видео или Веб. Система определяет порядок этих категорий, основываясь на ожидаемой частоте кликов (Selection Rate/CTR) тех позиций, которые занимают результаты категории в исходном смешанном ранжировании. Это определяет структуру Универсального поиска (Universal Search).
  • US8498984B1
  • 2013-07-30
  • SERP

  • Поведенческие сигналы

Как Google использует историю поведения пользователя для персонализации выбора и ранжирования вертикальных блоков (Universal Search)
Google отслеживает, с какими типами специализированных результатов (Новости, Картинки, Карты и т.д.) взаимодействует пользователь. На основе этой истории поведения строится персональная вероятностная модель, которая предсказывает, какие вертикали предпочтет пользователь в будущем. Система использует эти предсказания для выбора, оценки и ранжирования блоков вертикального поиска в выдаче.
  • US9305088B1
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует популярность сущностей в Веб-поиске для ранжирования результатов в Вертикальном поиске (Музыка, Книги, Товары)
Google улучшает ранжирование в специализированных поисковых вертикалях (например, Музыка, Книги, Товары), где данных для оценки контента недостаточно (Sparse Corpora). Система использует сигналы из основного Веб-поиска (популярность запросов, CTR веб-страниц), чтобы определить авторитетность и популярность сущностей (песен, книг, товаров) и скорректировать их позиции в вертикальной выдаче.
  • US9779140B2
  • 2017-10-03
  • Поведенческие сигналы

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Популярные патенты

Как Google использует паттерны просмотра пользователей (Co-Visitation) и временную близость для определения тематики нетекстового контента (изображений и видео)
Google использует механизм для понимания контента без текста (изображения, видео), анализируя, какие другие (текстовые) страницы пользователи посещают в рамках той же сессии. Ключевые слова с этих текстовых страниц заимствуются и присваиваются нетекстовому ресурсу. Критически важным фактором является время перехода: чем быстрее пользователь перешел между ресурсами, тем больший вес получают ключевые слова.
  • US8572096B1
  • 2013-10-29
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует социальные связи для обнаружения ссылочного спама и накрутки кликов
Google может анализировать связи между владельцами сайтов в социальных сетях, чтобы оценить независимость ссылок между их ресурсами. Если владельцы тесно связаны (например, друзья), ссылки между их сайтами могут получить меньший вес в ранжировании, а клики по рекламе могут быть классифицированы как спам (накрутка).
  • US8060405B1
  • 2011-11-15
  • Антиспам

  • Ссылки

  • SERP

Как Google планировал использовать социальные связи, сети доверия и экспертизу для персонализации и переранжирования поисковой выдачи
Google запатентовал метод использования данных из социальных сетей («member networks») для влияния на ранжирование. Пользователи могли явно одобрять («endorse») результаты поиска. Эти одобрения показывались другим связанным пользователям (друзьям или людям, ищущим экспертное мнение) и использовались для переранжирования выдачи, добавляя персонализированный слой доверия.
  • US8825639B2
  • 2014-09-02
  • Персонализация

  • EEAT и качество

  • Поведенческие сигналы

Как Google использует структуру сайта и анкорные тексты для извлечения Сущностей из шумных заголовков (Title)
Google использует метод для точного определения основного объекта (Сущности) веб-страницы, когда заголовок (Title) содержит лишнюю информацию (брендинг, рубрики). Система анализирует заголовки похожих страниц на том же сайте (Peer Documents) и анкорные тексты, ссылающиеся на них. Выявляя повторяющиеся шаблоны (префиксы и суффиксы) в заголовках, Google отделяет название Сущности от шума.
  • US7590628B2
  • 2009-09-15
  • Семантика и интент

  • Структура сайта

  • Ссылки

Как Google использует историю запросов, сделанных на Картах, для ранжирования локальных результатов и рекламы
Google анализирует, что пользователи ищут, когда просматривают определенную географическую область на карте (Viewport). Эта агрегированная история запросов используется для определения популярности локальных бизнесов и контента в этом конкретном районе. Результаты, которые часто запрашивались в этой области, особенно недавно, получают значительное повышение в ранжировании.
  • US9129029B1
  • 2015-09-08
  • Local SEO

  • Поведенческие сигналы

  • Свежесть контента

Как Google использует связанные запросы и временный «бустинг» для обнаружения и тестирования релевантных документов, которые ранжируются низко
Патент описывает механизм улучшения поиска путем перемещения документов на более высокие позиции. Google идентифицирует документы, которые высоко ранжируются по связанным запросам (например, с синонимами, уточнениями или исправленными ошибками), но низко по исходному запросу, и повышает их. Цель — протестировать истинную релевантность этих документов и собрать пользовательский отклик (клики) для улучшения будущего ранжирования.
  • US8521725B1
  • 2013-08-27
  • Поведенческие сигналы

  • SERP

  • Семантика и интент

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google автоматически превращает текст на странице в ссылки на результаты поиска для монетизации контента
Патент Google описывает технологию автоматического анализа контента веб-страницы для выявления ключевых тем и терминов. Система генерирует релевантные поисковые запросы и динамически встраивает гиперссылки в текст страницы. При клике пользователь перенаправляется на страницу результатов поиска (SERP). Ключевая особенность: система приоритизирует термины с высоким потенциалом дохода от рекламы.
  • US7788245B1
  • 2010-08-31
  • Ссылки

  • SERP

  • Семантика и интент

Как Google использует исторические данные о документах, ссылках и поведении пользователей для определения свежести, качества и борьбы со спамом
Фундаментальный патент Google, описывающий использование временных рядов данных для ранжирования. Система анализирует историю документа (дату создания, частоту и объем обновлений), историю ссылок (скорость появления, возраст, изменения анкоров), тренды запросов и поведение пользователей. Эти данные используются для определения свежести контента, выявления неестественной активности (спама) и оценки легитимности домена.
  • US7346839B2
  • 2008-03-18
  • Свежесть контента

  • Антиспам

  • Ссылки

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

seohardcore