SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google вычисляет «Оценку отвлекательности» (Distractiveness Score) для изображений, чтобы понизить кликбейт в поиске

SYSTEM AND METHODS FOR DETECTING IMAGES DISTRACTING TO A USER (Система и методы обнаружения изображений, отвлекающих пользователя)
  • US7877382B1
  • Google LLC
  • 2004-12-31
  • 2011-01-25
  • Поведенческие сигналы
  • SERP
  • Мультимедиа
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поведение пользователей для выявления изображений (например, юмористических или откровенных), на которые часто кликают независимо от исходного запроса. Система рассчитывает «Distractiveness Score» на основе кликов по не связанным между собой запросам и использует эту оценку для понижения таких изображений в выдаче, улучшая релевантность поиска.

Описание

Какую проблему решает

Патент решает проблему загрязнения поисковой выдачи (в частности, поиска по картинкам) нерелевантными, но привлекающими внимание (отвлекающими) изображениями. Это могут быть юмористические, шокирующие, откровенные или неуместные изображения, которые пользователи склонны выбирать из любопытства, независимо от их первоначального намерения. Это снижает эффективность поиска. Система направлена против кликбейта в результатах поиска.

Что запатентовано

Запатентована система и метод для вычисления Distractiveness Score (Оценки отвлекательности) для изображений. Ключевым элементом изобретения является метод расчета этой оценки, основанный на анализе частоты выбора изображения пользователями по широкому спектру независимых или не связанных друг с другом запросов (independent queries/unrelated queries). Если изображение часто кликают независимо от темы запроса, оно признается отвлекающим, и его заметность (prominence) в будущих результатах поиска снижается.

Как это работает

Система работает путем непрерывного мониторинга поведения пользователей:

  • Мониторинг: Behavior Analyzer отслеживает, какие изображения выбирают (кликают) пользователи в ответ на различные запросы.
  • Анализ независимости запросов: Система анализирует клики по изображению не только в контексте одного запроса, но и по множеству не связанных между собой запросов или классов запросов (query classes).
  • Расчет оценки: Если изображение демонстрирует высокий уровень кликов (selection-rate) независимо от тематики запроса, ему присваивается высокий Distractiveness Score.
  • Применение: При формировании выдачи поисковая система использует этот балл для понижения (уменьшения заметности) отвлекающих изображений.
  • Исключения: Система может не применять понижение, если запрос пользователя напрямую связан с отвлекающим контентом (например, порнографический запрос).

Актуальность для SEO

Средне-высокая. Хотя патент подан в 2004 году, концепция выявления и понижения кликбейта на основе сигналов вовлеченности пользователей остается фундаментальной для Google. Современные системы, вероятно, используют более сложные модели машинного обучения, но базовая логика использования сигналов, не зависящих от запроса (query-independent signals), для оценки релевантности остается актуальной, особенно в Поиске по картинкам и Google Discover.

Важность для SEO

Патент имеет значительное влияние на SEO, особенно для стратегий в Поиске по картинкам. Он демонстрирует, что высокий CTR сам по себе не всегда является положительным сигналом. Если изображение привлекает клики по слишком большому количеству не связанных тем (высокий Distractiveness Score), оно может быть классифицировано как кликбейт и понижено. Это подчеркивает критическую важность обеспечения высокой релевантности изображений конкретному контексту, а не просто их визуальной привлекательности.

Детальный разбор

Термины и определения

Behavior Analyzer (Анализатор поведения)
Компонент системы, который отслеживает поведение пользователей в отношении результатов поиска (например, клики) и вычисляет оценки отвлекательности.
Distracting Image (Отвлекающее изображение)
Изображение, которое привлекает внимание или любопытство пользователя независимо от исходного запроса. Примеры включают юмористические, оскорбительные, непристойные, порнографические или совершенно нерелевантные изображения.
Distractiveness Score (Оценка отвлекательности)
Метрика, рассчитываемая для изображения, которая измеряет его способность отвлекать пользователя. Она основана на частоте выбора изображения по множеству не связанных запросов. Используется для снижения заметности изображения в выдаче.
Independent Queries / Unrelated Queries (Независимые / Не связанные запросы)
Запросы, которые не имеют общности по ключевым словам или тематике (например, «военные корабли» и «животные»). Анализ кликов по таким запросам является ядром патента.
Query Classes (Классы запросов)
Группы запросов, связанных между собой (например, общими ключевыми словами или тематикой). Например, запросы о собаках и кошках могут входить в класс «домашние животные».
Query-Independent Selection-Rate (Независимая от запроса частота выбора)
Показатель того, как часто изображение выбирается пользователями независимо от того, какой запрос был введен.
Reasonable Selection-Rate (Разумная частота выбора)
Ожидаемая частота кликов на изображение. Отклонение от этой частоты может указывать на отвлекающий характер изображения.
Seeded Images (Посевные изображения)
Изображения, намеренно добавляемые в результаты поиска, даже если они не связаны с запросом, с целью статистического анализа поведения пользователей (Active Analysis) и измерения их отвлекательности.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод обнаружения отвлекающих изображений.

  1. Система получает запрос и отправляет набор изображений.
  2. Мониторит поведение пользователя (выборы/клики).
  3. Вычисляет Distractiveness Score для изображения на основе отслеживаемого поведения.
  4. Ключевой аспект: Оценка отвлекательности снижает заметность (prominence) изображения в результатах запроса, основываясь, по крайней мере частично, на выборе пользователем этого изображения в первом запросе И выборе этого же изображения во втором запросе, причем первый запрос не связан по тематике (unrelated in subject matter) со вторым запросом.

Claim 2, 3, 5 (Зависимые): Детализируют расчет Distractiveness Score.

  • Расчет включает вычисление query-independent selection-rate по множеству запросов (Claim 2) или по множеству классов запросов (Claim 3).
  • Расчет включает подсчет количества независимых запросов, для которых данное изображение было включено в результаты (Claim 5).

Claim 4 и 16 (Зависимые): Описывают обработку специфического контента (порнографические запросы).

  • Система определяет, является ли запрос порнографическим.
  • Claim 4 (Расчет): Вычисление selection-rate может производиться только по не порнографическим запросам.
  • Claim 16 (Применение): Система использует Distractiveness Score для изменения (понижения) результатов, если запрос НЕ порнографический, и НЕ использует его, если запрос порнографический (так как в этом случае отвлекающий контент релевантен).

Claims 7-11 (Зависимые): Указывают, что мониторинг и расчет могут проводиться для подмножества пользователей на основе демографических групп (пол, возраст, география).

Claim 19 (Независимый пункт): Описывает метод активного анализа (Active Analysis).

  1. Получение запроса и определение связанных изображений.
  2. Добавление к этому набору Seeded Images (посевных изображений).
  3. Отправка пользователю смешанного набора.
  4. Мониторинг поведения в отношении всех изображений.
  5. Расчет Distractiveness Score для всех изображений (включая посевные) на основе поведения по не связанным запросам (как в Claim 1).

Где и как применяется

Изобретение в основном применяется в системах поиска по изображениям (Image Search) и затрагивает несколько этапов обработки данных.

(Офлайн / Непрерывный процесс)
Behavior Analyzer непрерывно обрабатывает логи поведения пользователей (клики в SERP). Он анализирует данные по множеству независимых запросов и постоянно пересчитывает и обновляет Distractiveness Scores в базе данных.

INDEXING – Индексирование и извлечение признаков
На этом этапе (или в ходе офлайн-процессов) Distractiveness Scores сохраняются и обновляются, будучи привязанными к каждому изображению в индексе.

QUNDERSTANDING – Понимание Запросов
Система должна классифицировать запрос (например, является ли он порнографическим), чтобы определить, следует ли применять Distractiveness Score при ранжировании.

RANKING – Ранжирование
Поисковая система генерирует первоначальный набор изображений, релевантных запросу, на основе стандартных факторов.

RERANKING – Переранжирование
Основной этап применения патента. Система извлекает Distractiveness Scores для кандидатов ранжирования. Происходит модификация порядка результатов (Ordering) с целью снижения заметности (reduce prominence) изображений с высоким Distractiveness Score. Также на этом этапе может происходить внедрение Seeded Images для активного анализа.

Входные данные:

  • Запрос пользователя и его классификация.
  • Набор изображений-кандидатов.
  • Сохраненные Distractiveness Scores для изображений.
  • Логи поведения пользователей (клики, запросы, позиции).
  • (Опционально) Демографические данные пользователя.

Выходные данные:

  • Переупорядоченный набор результатов поиска с пониженными отвлекающими изображениями.
  • Обновленные Distractiveness Scores в базе данных.

На что влияет

  • Типы контента: В первую очередь влияет на изображения. Однако в патенте упоминается, что методы могут применяться в общем к любой поисковой системе, которая извлекает документы, включая веб-страницы. Концептуально это применимо к любому кликбейтному контенту.
  • Конкретные ниши: Наибольшее влияние в нишах, подверженных кликбейту: юмор, мемы, знаменитости, новости и контент NSFW (Not Safe For Work).

Когда применяется

  • Условия применения: Алгоритм расчета оценок работает непрерывно на основе логов поведения. Применение оценок для переранжирования происходит при каждом запросе в поиске по картинкам.
  • Исключения и особые случаи: Система специально обрабатывает порнографические запросы. Если запрос идентифицирован как порнографический, система может принять решение не использовать Distractiveness Score для понижения результатов (Claim 16). Также расчет самой оценки может вестись только на основе не порнографических запросов (Claim 4).
  • Персонализация: Оценки могут рассчитываться и применяться по-разному для разных демографических групп (пол, возраст, география), поскольку то, что отвлекает одну группу, может не отвлекать другую.

Пошаговый алгоритм

Процесс А: Обработка запроса и Ранжирование (Real-Time)

  1. Получение и анализ запроса: Система получает запрос и определяет его характер (например, является ли он порнографическим).
  2. Определение кандидатов: Поисковая система определяет набор изображений, релевантных запросу.
  3. (Опционально) Активный анализ: Добавление Seeded Images в набор результатов для тестирования.
  4. Получение оценок: Извлечение сохраненных Distractiveness Scores для каждого изображения в наборе (возможно, специфичных для демографии пользователя).
  5. Модификация и Упорядочивание: Переранжирование набора результатов. Если запрос не порнографический, изображения с высоким Distractiveness Score понижаются (уменьшается их заметность).
  6. Выдача результатов: Отправка модифицированного набора пользователю.

Процесс Б: Расчет Оценки Отвлекательности (Непрерывный/Офлайн)

  1. Мониторинг поведения: Сбор данных о кликах пользователей на изображения по всем запросам.
  2. Группировка запросов: Идентификация связанных запросов (Query Classes) и независимых запросов (Independent Queries).
  3. Фильтрация запросов (Опционально): Исключение определенных типов запросов (например, порнографических) из расчета.
  4. Расчет частоты выбора: Вычисление Query-Independent Selection-Rate. Ключевой метрикой является частота выбора по множеству независимых запросов.
  5. Сравнение с ожиданиями: Оценка отклонения от Reasonable Selection-Rate. Релевантные изображения должны получать меньше кликов по мере того, как запрос отдаляется от основной темы. Отвлекающие изображения сохраняют высокий уровень кликов.
  6. Вычисление оценки: Расчет текущего Distractiveness Score на основе этих метрик.
  7. Обновление и Хранение: Комбинирование текущей оценки с ранее сохраненной и сохранение обновленного Distractiveness Score.

Какие данные и как использует

Данные на входе

Основной фокус патента — на поведенческих данных и их интерпретации.

  • Поведенческие факторы: Критически важные данные. Система использует данные о кликах (Selections) на изображения. Важен контекст клика: какой запрос был использован. Также упоминается использование статистической информации: абсолютная позиция кликнутого изображения, относительная позиция, относительные клики (процент от общего числа кликов), клики, взвешенные по позиции.
  • Контентные факторы: Метаданные изображения и контекстная информация (текст рядом с изображением) используются для определения начальной релевантности. Также используются классы изображений (Image Classes), например, «сексуально откровенные изображения».
  • Пользовательские факторы: Патент предусматривает возможность использования демографических данных (пол, возраст, географическое положение) для расчета Distractiveness Score для подмножеств пользователей.

Какие метрики используются и как они считаются

  • Distractiveness Score (D): Основная вычисляемая метрика. Патент предлагает использовать комбинированную функцию, где общий балл является функцией от отдельных измерений отвлекательности (Dn):

Выводы

  1. CTR зависит от контекста: Патент четко показывает, что Google не интерпретирует высокий CTR как однозначно положительный сигнал. Высокий CTR по релевантным запросам — это хорошо. Высокий CTR по множеству не связанных запросов (Query-Independent Selection-Rate) — это сигнал отвлекательности, кликбейта или нерелевантности.
  2. Релевантность приоритетнее вовлеченности: Система активно борется с поверхностной вовлеченностью. Изобретение направлено на то, чтобы понижать изображения, которые привлекают внимание, но не соответствуют интенту запроса.
  3. Измерение «Отвлекательности» как негативный сигнал: Distractiveness Score является конкретной метрикой, используемой для понижения результатов в ранжировании.
  4. Адаптация к интенту: Система учитывает интент пользователя. Если пользователь ищет контент, который обычно считается «отвлекающим» (например, порнографию), механизм понижения может быть отключен (Claim 16), демонстрируя гибкость в интерпретации сигналов.
  5. Использование Active Analysis: Google оставляет за собой право проводить «полевые испытания», внедряя Seeded Images (нерелевантные изображения) в выдачу для сбора данных о реакции пользователей и калибровки алгоритмов (Claim 19).

Практика

Best practices (это мы делаем)

  • Обеспечение максимальной релевантности изображений: Изображения должны строго соответствовать конкретной теме страницы и целевым запросам. Избегайте использования общих, пусть и привлекательных, изображений, которые могут быть уместны в разных контекстах.
  • Использование уникального визуального контента: Отдавайте предпочтение уникальным, информативным изображениям (фотографиям продукта, инфографике), а не стоковым фотографиям или мемам. Стоковые фото и мемы часто используются в разных несвязанных контекстах, что повышает риск получения высокого Distractiveness Score.
  • Оптимизация контекста изображения: Убедитесь, что окружающий текст, подписи (captions) и атрибуты alt усиливают релевантность изображения конкретной теме. Это помогает поисковой системе понять, что клики на изображение обусловлены релевантностью, а не отвлечением.

Worst practices (это делать не надо)

  • Использование кликбейтных миниатюр (Thumbnails): Использование вводящих в заблуждение, чрезмерно провокационных, шокирующих или юмористических изображений, не имеющих прямого отношения к содержанию контента. Это прямой путь к получению высокого Distractiveness Score.
  • Повторное использование изображений в разных контекстах: Использование одного и того же «привлекающего внимание» изображения в качестве основного для множества статей на сайте, посвященных разным, не связанным темам.
  • Оптимизация под широкие запросы с помощью общих изображений: Попытка ранжироваться по разнообразным запросам, используя визуально привлекательные, но неспецифичные изображения.

Стратегическое значение

Патент подтверждает, что Google глубоко анализирует паттерны вовлеченности пользователей. Стратегически важно понимать, что цель SEO — не просто получить клик, а получить релевантный клик, который удовлетворяет интент пользователя. Эта концепция применима не только к изображениям, но и к заголовкам веб-страниц и общей контент-стратегии: необходимо избегать поверхностного вовлечения в пользу истинной релевантности и ценности.

Практические примеры

Сценарий: Понижение кликбейтного изображения в eCommerce

  1. Сайт и Запрос: Интернет-магазин пытается ранжироваться по запросу «купить бейсбольную биту».
  2. Действие SEO (Плохая практика): В качестве основного изображения товара используется популярный мем, где мультяшный персонаж бьет кого-то битой. Владелец сайта считает, что это забавно и привлечет внимание.
  3. Анализ Google: Behavior Analyzer замечает, что это изображение часто кликают, когда оно появляется в результатах по запросам «смешные мультики», «мемы про животных», а также «купить бейсбольную биту». Запросы являются независимыми (Independent Queries).
  4. Расчет оценки: Система фиксирует высокую Query-Independent Selection-Rate и присваивает изображению высокий Distractiveness Score.
  5. Результат: При следующем ранжировании по запросу «купить бейсбольную биту» это изображение (и связанная с ним страница товара) понижается в Поиске по картинкам. Вместо него выше ранжируются изображения, показывающие реальные биты, так как они имеют низкий Distractiveness Score (их кликают только по релевантным запросам).

Вопросы и ответы

Означает ли этот патент, что высокий CTR — это плохо?

Нет, но он означает, что высокий CTR должен быть контекстуально обоснован. Если изображение имеет высокий CTR только по релевантным запросам, это положительный сигнал. Если же изображение имеет высокий CTR по множеству не связанных между собой тем (высокий Query-Independent Selection-Rate), это интерпретируется как отвлечение или кликбейт, что приводит к понижению (присвоению высокого Distractiveness Score).

Как Google определяет, что запросы являются «независимыми» (Independent Queries)?

Патент определяет независимые запросы как те, которые не имеют общности в ключевых словах или тематике. На практике Google использует сложные системы понимания языка и классификации запросов (Query Classes), чтобы определить семантическую близость или отдаленность запросов друг от друга. Если два запроса принадлежат к совершенно разным тематическим кластерам, они считаются независимыми.

Применяется ли эта логика к обычному веб-поиску, а не только к картинкам?

Хотя патент сфокусирован на изображениях, в тексте упоминается, что методы могут применяться к любым документам, включая веб-страницы. Концептуально, если веб-страница (например, с кликбейтным заголовком) получает много кликов по широкому спектру не связанных запросов, она также может быть идентифицирована как «отвлекающая» или низкокачественная, и ее ранжирование может быть скорректировано.

Что такое «Seeded Images» и зачем Google показывает нерелевантные результаты?

Seeded Images — это изображения, которые система намеренно внедряет в выдачу, даже если они нерелевантны запросу. Это метод активного анализа (Active Analysis). Google делает это для сбора статистических данных о реакции пользователей, тестирования отвлекательности новых изображений и калибровки алгоритма Distractiveness Score в контролируемых условиях.

Как система обрабатывает NSFW или порнографический контент?

Патент признает, что порнографические изображения часто являются самыми отвлекающими. Система обрабатывает их двумя способами. Во-первых, при расчете Distractiveness Score она может учитывать клики только по не порнографическим запросам. Во-вторых, если пользователь вводит явно порнографический запрос, система может отключить механизм понижения, так как в этом случае «отвлекающий» контент является целью поиска.

Влияет ли использование стоковых фотографий на Distractiveness Score?

Да, потенциально может влиять. Если одна и та же популярная стоковая фотография используется сотнями сайтов в разных, не связанных контекстах, она может начать демонстрировать высокий уровень кликов по независимым запросам. Это может привести к увеличению её Distractiveness Score. Предпочтительнее использовать уникальные и высокорелевантные изображения.

Может ли Distractiveness Score быть персонализированным?

Да, патент явно предусматривает возможность расчета разных оценок для разных подмножеств пользователей. Система может учитывать демографические данные (пол, возраст, местоположение), поскольку то, что отвлекает одну группу пользователей (например, мужчин 30-39 лет), может отличаться от того, что отвлекает другую группу.

Что такое «Reasonable Selection-Rate»?

Это ожидаемая или эталонная частота кликов для изображения, основанная на его релевантности и позиции в выдаче. Система использует эту метрику для выявления аномалий. Если фактическая частота кликов значительно превышает Reasonable Selection-Rate по множеству запросов, это может указывать на отвлекающий характер изображения.

Как этот патент соотносится с современными метриками удовлетворенности пользователей (User Satisfaction)?

Этот патент можно рассматривать как раннюю попытку измерить удовлетворенность через призму релевантности. Понижая отвлекающие результаты, система стремится повысить эффективность поиска. Современные системы используют более сложные сигналы, но цель остается той же — предоставить релевантный контент, а не просто самый кликабельный.

Что делать, если мое релевантное изображение было ошибочно классифицировано как отвлекающее?

Если вы подозреваете это, необходимо провести аудит контекста, в котором используется изображение. Убедитесь, что оно не используется на вашем сайте в других, не связанных тематиках. Усильте сигналы релевантности вокруг изображения (окружающий текст, подписи, атрибуты alt), чтобы четко связать его с целевыми запросами и снизить вероятность его появления по независимым запросам.

Похожие патенты

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Как Google определяет намерение поиска изображений, анализируя контент топовых веб-результатов
Google использует систему для определения того, следует ли показывать блок с изображениями в поисковой выдаче. Вместо анализа только текста запроса, система анализирует характеристики контента (например, плотность изображений, соотношение изображений к тексту) на страницах, которые уже ранжируются в топе. Если эти страницы похожи на контент, который обычно удовлетворяет потребность в изображениях, система активирует показ блока картинок.
  • US9195717B2
  • 2015-11-24
  • Семантика и интент

  • Мультимедиа

  • SERP

Как Google использует клики по изображениям для определения схожести запросов и картинок (Поведенческая схожесть)
Google анализирует поведение пользователей в поиске по картинкам, чтобы определить схожесть двух запросов (или двух изображений). Если пользователи часто кликают на одни и те же изображения в ответ на разные запросы, эти запросы считаются похожими. Этот механизм (Коллаборативная фильтрация) позволяет находить связи независимо от языка или типа запроса (текст/изображение) и используется для генерации рекомендаций.
  • US8280881B1
  • 2012-10-02
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google использует клики пользователей для генерации альтернативных запросов и автоматической разметки изображений
Google анализирует исторические данные о том, какие запросы приводили к кликам по конкретному изображению. Эти запросы используются как автоматические метки (labels) для индексации и как предлагаемые альтернативные запросы при взаимодействии пользователя с этим изображением в выдаче. Система позволяет уточнять поиск на основе коллективного поведения и переносить метки между визуально похожими изображениями.
  • US20150161175A1
  • 2015-06-11
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует визуальный анализ кликов по картинкам для понимания интента запроса и переранжирования выдачи
Google анализирует визуальное содержимое изображений, которые пользователи чаще всего выбирают в ответ на определенный запрос. На основе этого анализа (наличие лиц, текста, графиков, доминирующих цветов) система определяет категорию запроса (например, «запрос о конкретном человеке» или «запрос на определенный цвет»). Эти категории затем используются для переранжирования будущих результатов поиска, повышая изображения, которые визуально соответствуют выявленному интенту.
  • US9836482B2
  • 2017-12-05
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Популярные патенты

Как Google выбирает предлагаемые запросы, анализируя вероятность завершения поиска и коммерческую ценность
Google использует графовую модель для анализа поисковых сессий пользователей. Система определяет, какие уточняющие запросы чаще всего приводят к завершению поиска (становятся «финальным пунктом назначения»). Эти запросы считаются обладающими наибольшей «полезностью» (Utility) и предлагаются пользователю в качестве подсказок или связанных запросов. Система также учитывает коммерческий потенциал этих запросов и может показывать для них релевантные рекламные блоки.
  • US8751520B1
  • 2014-06-10
  • SERP

  • Поведенческие сигналы

  • Семантика и интент

Как Google запоминает прошлые уточнения поиска пользователя и автоматически перенаправляет его к конечному результату
Google использует механизм персонализации, который отслеживает, как пользователи уточняют свои поисковые запросы. Если пользователь часто вводит общий запрос, а затем выполняет ряд действий (например, меняет запрос или взаимодействует с картой), чтобы добраться до конкретного результата, система запоминает эту последовательность. В будущем, при вводе того же общего запроса, Google может сразу показать конечный результат, минуя промежуточные шаги.
  • US9305102B2
  • 2016-04-05
  • Персонализация

  • Поведенческие сигналы

Как Google использовал специальные токены в запросе (например, «+») для прямой навигации на верифицированные социальные страницы в обход SERP
Google может интерпретировать специальные токены в поисковом запросе (например, «+») как намерение пользователя найти официальную социальную страницу сущности. Если система идентифицирует верифицированный профиль, соответствующий запросу с высокой степенью уверенности, она может перенаправить пользователя прямо на эту страницу, минуя стандартную поисковую выдачу.
  • US9275421B2
  • 2016-03-01
  • Семантика и интент

  • SERP

  • Ссылки

Как Google использует консенсус анкорных текстов для определения авторитетных источников и проверки фактов в Knowledge Graph
Google определяет, является ли веб-страница авторитетным источником о конкретной сущности (Entity), анализируя все анкорные тексты входящих ссылок. Система находит консенсусное описание (Center of Mass). Если оно совпадает с именем сущности и это имя присутствует в заголовке страницы, документ используется как эталон для проверки (Corroboration) фактов в базе знаний Google (Fact Repository).
  • US9208229B2
  • 2015-12-08
  • Knowledge Graph

  • Ссылки

  • EEAT и качество

Как Google использует «Фразовую модель» (Phrase Model) для прогнозирования качества сайта на основе статистики использования N-грамм
Google прогнозирует оценку качества сайта, анализируя, какие фразы (N-граммы) используются и как часто они распределены по страницам сайта. Система создает «Фразовую модель», изучая известные высококачественные и низкокачественные сайты, а затем применяет эту модель для оценки новых сайтов по их лингвистическим паттернам.
  • US9767157B2
  • 2017-09-19
  • Семантика и интент

  • Техническое SEO

  • EEAT и качество

Как Google создает и использует базу «идеальных» ответов (Canonical Content Items) для ответов на вопросы пользователей
Google использует систему для идентификации и создания «канонических элементов контента» — образцовых объяснений тем, часто в формате вопрос-ответ. Система анализирует огромные массивы существующего контента, кластеризует похожие вопросы и ответы и выбирает или синтезирует идеальную версию. Когда пользователь задает вопрос, система сопоставляет его с этой базой данных, чтобы мгновенно предоставить высококачественный, модельный ответ.
  • US9396263B1
  • 2016-07-19
  • Семантика и интент

  • EEAT и качество

Как Google подменяет ссылки в выдаче, чтобы обойти медленные редиректы на мобильные версии сайтов
Google оптимизирует скорость загрузки, определяя, когда клик по результату поиска вызовет условный редирект (например, с десктопной версии на мобильную). Система заранее подменяет исходную ссылку в выдаче на конечный URL редиректа. Это позволяет устройству пользователя сразу загружать нужную страницу, минуя промежуточный запрос и экономя время.
  • US9342615B2
  • 2016-05-17
  • Техническое SEO

  • SERP

  • Ссылки

Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
  • US8577897B2
  • 2013-11-05
  • SERP

  • Семантика и интент

  • EEAT и качество

Как Google определяет ключевую тематику зданий и адресов, используя клики пользователей для показа релевантной рекламы
Google использует этот механизм для понимания основного назначения физического местоположения (адреса или здания). Система анализирует все бизнесы в этой локации и определяет, какие поисковые запросы чаще всего приводят к кликам по их листингам. Самый популярный запрос используется как доминирующее ключевое слово для выбора релевантной рекламы, когда пользователи ищут этот адрес или взаимодействуют с ним на Картах или в Street View.
  • US20120278171A1
  • 2012-11-01
  • Local SEO

  • Семантика и интент

  • Поведенческие сигналы

Как Google использует длительность кликов, Pogo-Sticking и уточнение запросов для оценки качества поиска (Click Profiles)
Google анализирует поведение пользователей после клика для оценки удовлетворенности. Система создает «Профили взаимодействия» (Click Profiles), учитывая длительность клика (Dwell Time), возврат к выдаче (Pogo-Sticking) и последующее уточнение запроса. Эти данные используются для сравнения эффективности алгоритмов ранжирования и выявления спама или кликбейта.
  • US9223868B2
  • 2015-12-29
  • Поведенческие сигналы

  • SERP

  • Антиспам

seohardcore