SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google динамически повышает порог качества для результатов поиска по «рискованным» запросам

METHODS, SYSTEMS, AND MEDIA FOR MODIFYING SEARCH RESULTS BASED ON SEARCH QUERY RISK (Методы, системы и средства для модификации результатов поиска на основе риска поискового запроса)
  • US11609949B2
  • Google LLC
  • 2019-11-06
  • 2023-03-21
  • Антиспам
  • SERP
  • Поведенческие сигналы
  • Безопасный поиск
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google оценивает «риск» поискового запроса, анализируя общее качество топовых результатов. Если запрос часто привлекает спам, кликбейт или нежелательный контент (особенно видео), система динамически повышает минимальный порог качества. Контент, не соответствующий этому повышенному стандарту, понижается в выдаче, при этом учитываются такие сигналы, как показатель просмотров (Watch Rate).

Описание

Какую проблему решает

Патент решает проблему фильтрации нежелательного контента (abusive content) — такого как спам, кликбейт, вводящий в заблуждение или пиратский контент (abusive re-uploads) — который часто оптимизируется под «рискованные» запросы (risky search queries). Проблема заключается в том, что стандартные фильтры могут быть недостаточно агрессивны для проблемных запросов (например, «action full movie 2018») или слишком строги для безопасных. Изобретение предлагает механизм динамической адаптации строгости фильтрации в зависимости от контекста запроса.

Что запатентовано

Запатентована система, которая динамически регулирует порог качества для результатов поиска в зависимости от предполагаемого риска запроса. Система оценивает общее качество выдачи по запросу (Query Goodness Value) и использует эту оценку для установки минимально допустимого порога качества (Threshold Goodness Value) для отдельных результатов. Если запрос рискованный, порог повышается. Механизм явно ориентирован на поиск видеоконтента (video content item).

Как это работает

Система работает по принципу адаптивного порога:

  • Оценка результата (Gr): Для каждого результата рассчитывается Result Goodness Value (Gr) на основе его характеристик (включая Watch Rate Score и качество источника).
  • Оценка запроса (Gq): Рассчитывается Query Goodness Value (Gq) путем агрегации Gr топовых результатов. Низкий Gq указывает на «рискованный» запрос.
  • Динамический порог (Gt): Система определяет Threshold Goodness Value (Gt) на основе Gq, используя обученную функцию (Threshold Goodness Function). Ключевой механизм: чем ниже Gq (рискованнее запрос), тем выше устанавливается порог Gt (строже фильтрация).
  • Понижение: Если Gr результата ниже динамического порога Gt (Gr < Gt), и результат не находится в белом списке (Whitelist), он понижается или фильтруется.

Актуальность для SEO

Высокая. Патент опубликован в 2023 году и направлен на решение актуальных проблем модерации контента и борьбы с кликбейтом, особенно на платформах с пользовательским контентом, таких как YouTube (на что указывают метрики типа Watch Rate Score, явно упомянутые в Claim 1). Динамическая адаптация алгоритмов к контексту запроса является современным трендом в поиске.

Важность для SEO

Влияние на SEO высокое (8.5/10), особенно для видео-SEO и ниш, подверженных спаму. Патент демонстрирует, что требования к качеству контента не статичны, а динамически повышаются в рискованных тематиках. Это делает поведенческие сигналы (особенно Watch Rate) и авторитетность источника критически важными для преодоления агрессивной фильтрации в определенных контекстах.

Детальный разбор

Термины и определения

Result Goodness Value (Gr) (Оценка качества результата)
Общая оценка качества отдельного результата поиска (например, видео). Нормализована (например, от 0.0 до 1.0). Рассчитывается на основе агрегации Feature Goodness Values.
Query Goodness Value (Gq) (Оценка качества запроса)
Метрика, отражающая общее качество или «риск» поискового запроса. Рассчитывается на основе среднего Gr результатов. Низкий Gq = рискованный запрос.
Threshold Goodness Value (Gt) (Пороговое значение качества)
Динамический порог, определяемый на основе Gq. Минимальный Gr, необходимый результату, чтобы избежать понижения.
Feature Goodness Value (g) (Оценка качества характеристики)
Нормализованная оценка отдельной характеристики контента (например, Watch Rate Score). Используется для расчета Gr.
Watch Rate Score (w) (Показатель просмотров)
Метрика вовлеченности: количество просмотров или взаимодействий с контентом по отношению к количеству его показов (impressions). Ключевой сигнал качества, обязательный согласно Claim 1.
Threshold Goodness Function (Пороговая функция качества)
Функция, настроенная с помощью машинного обучения (ML-tuned), которая определяет Gt на основе Gq. Она монотонно невозрастающая: чем выше риск (ниже Gq), тем выше порог (выше Gt).
Whitelist/Blacklist (Белый/Черный список)
Списки контента, каналов или доменов, которые всегда разрешены (Whitelist) или всегда понижаются (Blacklist), минуя динамический порог Gt.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод понижения результатов поиска для видеоконтента.

  1. Система получает запрос на video content item.
  2. Генерируются результаты поиска.
  3. Рассчитывается набор оценок результатов (Gr). Каждая оценка Gr основана как минимум на Watch Rate Score (просмотры относительно показов).
  4. Рассчитывается оценка запроса (Gq) на основе набора Gr.
  5. Система проверяет, не находится ли результат в Whitelist (автоматическое разрешение) или Blacklist (автоматическое понижение).
  6. Если нет, определяется пороговое значение (Gt) на основе Gq с использованием Threshold Goodness Function.
  7. Ключевые свойства функции: (i) она отображает Gq на минимально допустимый Gr; (ii) она уменьшается по мере увеличения Gq (т.е. для безопасных запросов порог ниже); (iii) она настраивается с помощью модели машинного обучения на основе размеченных данных.
  8. Система проверяет условие Gr < Gt.
  9. Если ДА, результат понижается (demoting).
  10. Происходит фильтрация нежелательного медиаконтента (abusive media content), и пониженный результат исключается из списка.

Claim 3 и 4 (Зависимые): Детализируют расчет Gq.

Gq рассчитывается как среднее значение (average) набора Gr. Перед усреднением значения Gr могут быть скорректированы (adjusted) (например, с помощью функции-ядра f(Gr) для учета поляризации выдачи).

Где и как применяется

Изобретение функционирует как система контроля качества на финальных этапах поиска.

INDEXING – Индексирование и извлечение признаков
На этом этапе вычисляются и сохраняются характеристики контента и источников: Watch Rate Score, оценки качества канала/пользователя. Также офлайн происходит обучение ML-модели для Threshold Goodness Function на основе истории трафика и разметки данных.

RANKING – Ранжирование
Генерируется первоначальный набор релевантных результатов.

RERANKING – Переранжирование
Основной этап применения патента. Система действует как динамический фильтр качества:

  1. Рассчитывает Gr для результатов и Gq для запроса.
  2. Определяет динамический порог Gt на основе Gq.
  3. Применяет логику Whitelist/Blacklist.
  4. Понижает результаты, где Gr < Gt.

Входные данные:

  • Набор результатов ранжирования.
  • Характеристики контента (Watch Rate Score, качество канала и т.д.).
  • Данные Whitelist/Blacklist.
  • Обученная Threshold Goodness Function.

Выходные данные:

  • Отфильтрованный (скорректированный) набор результатов поиска.

На что влияет

  • Конкретные типы контента: Патент явно сфокусирован на видеоконтенте (video content item). Критически важно для YouTube SEO и Google Video.
  • Специфические запросы: Влияет на «рискованные» запросы (низкий Gq) — те, которые часто привлекают спам, пиратский контент (например, «смотреть фильм бесплатно»), кликбейт или контент на грани допустимого.
  • Конкретные ниши: Ниши с большим объемом UGC (User Generated Content) и тематики, подверженные злоупотреблениям (например, YMYL-темы с низким уровнем экспертизы).

Когда применяется

  • Условия работы: Алгоритм оценки (расчет Gr, Gq, Gt) потенциально применяется к каждому запросу в системе видеопоиска.
  • Триггеры понижения: Понижение активируется, если результат не находится в Whitelist И (он в Blacklist ИЛИ его Gr ниже динамического порога Gt).
  • Динамическая строгость: Эффект алгоритма наиболее заметен при обработке рискованных запросов (низкий Gq), когда порог Gt становится высоким.

Пошаговый алгоритм

Процесс А: Обработка запроса в реальном времени

  1. Получение запроса и генерация результатов.
  2. Расчет качества результатов (Gr): Для каждого результата:
    • Извлекаются характеристики (например, Watch Rate Score).
    • Характеристики нормализуются в Feature Goodness Values (g).
    • Рассчитывается Result Goodness Value (Gr) как взвешенное произведение g.
  3. Расчет качества запроса (Gq):
    • Значения Gr агрегируются (усредняются) для получения Query Goodness Value (Gq). Может применяться корректирующая функция f(Gr) перед усреднением.
  4. Определение динамического порога (Gt): Система использует Threshold Goodness Function для определения Gt на основе Gq. (Низкий Gq -> Высокий Gt).
  5. Применение фильтров и понижений: Для каждого результата:
    • Проверка Whitelist (Разрешить) и Blacklist (Понизить).
    • Если не в списках: Сравнение Gr и Gt. Если Gr < Gt, понизить результат (снизить ранг, исключить из выдачи или предотвратить монетизацию).
  6. Презентация: Модифицированный набор результатов предоставляется пользователю.

Процесс Б: Офлайн-настройка (Tuning)

  1. Сбор истории трафика: Анализ истории поисковых запросов и результатов.
  2. Разметка данных: Результаты маркируются как «BAD», «GOOD» или «UNKNOWN».
  3. Настройка моделей (ML): Функции (включая Threshold Goodness Function) настраиваются с использованием размеченных данных и функции потерь (например, logistic loss function). При обучении используются веса, чтобы сильнее штрафовать за ошибочное понижение «GOOD» контента.

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Критически важны.
    • Watch Rate Score (w): Явно указан в Claims как обязательный фактор. Отношение просмотров/взаимодействий к показам.
    • История поискового трафика: Используется для офлайн-тюнинга ML-моделей.
  • Факторы качества/Авторитетности: Упоминаются как характеристики для расчета Gr.
    • Оценка качества контента (quality score associated with a content item).
    • Оценка качества источника (quality score associated with a user, entity, and/or channel).
  • Системные данные: Whitelists и Blacklists. Размеченные данные для обучения (Labels: GOOD, BAD, UNKNOWN).

Какие метрики используются и как они считаются

  • Result Goodness Value (Gr): Рассчитывается как взвешенное произведение нормализованных характеристик (g).
    Формула (Equation 1): Gr=∏featureg(feature)k(feature)G_r = \prod_{\text{feature}} g(\text{feature})^{k(\text{feature})} (где k — вес характеристики).
  • Query Goodness Value (Gq): Рассчитывается как среднее значение Gr.
    Формула (Equation 3): Gq=avgrf(Gr)G_q = \text{avg}_r f(G_r) (где f(Gr) — опциональная функция-ядро для учета поляризации выдачи).
  • Threshold Goodness Value (Gt): Определяется Threshold Goodness Function(Gq).
  • Алгоритмы машинного обучения: Используются для настройки всех функций (g, f, Gt). Приоритет отдается минимизации ложных срабатываний на качественном контенте.

Выводы

  1. Контекстно-зависимые стандарты качества: Google не использует единый порог качества для фильтрации контента. Требования (Gt) динамически адаптируются к «рискованности» (Gq) каждого конкретного запроса.
  2. Агрессивная фильтрация в рискованных нишах: Ключевой механизм — обратная зависимость между Gq и Gt. Если запрос рискованный (низкий Gq), порог качества Gt резко повышается. Для ранжирования по таким запросам контент должен обладать исключительно сильными сигналами качества (Gr).
  3. Критичность поведенческих сигналов (Engagement) в Видео: Watch Rate Score (вовлеченность/досматриваемость) явно указан как обязательный компонент оценки качества результата (Gr) для видео. Это ставит поведенческие факторы в центр видео-SEO.
  4. Авторитетность источника как фактор защиты: Качество канала/источника влияет на Gr. Кроме того, высокоавторитетные источники могут попасть в Whitelist, что полностью защищает их от понижения этим алгоритмом.
  5. Адаптация через Машинное Обучение: Система автоматически оптимизирует пороговые функции и веса характеристик, используя ML и размеченные данные (GOOD/BAD). При обучении приоритет отдается минимизации ложных срабатываний на качественном контенте.

Практика

Best practices (это мы делаем)

Рекомендации особенно актуальны для видео-SEO (YouTube, Google Video).

  • Максимизация Watch Rate и удержания: Это ключевой фактор Gr. Оптимизируйте заголовки и превью (thumbnails) для точного отражения содержания, чтобы избежать кликбейта. Сосредоточьтесь на создании контента, который пользователи досматривают до конца. Высокое время просмотра и процент завершения просмотра критичны.
  • Укрепление авторитетности канала/источника (E-E-A-T): Работайте над повышением качества канала в целом. Авторитетные источники имеют более высокий Gr и могут попасть в Whitelist. Это лучшая защита от динамических понижений.
  • Анализ «рискованности» ниши: Оценивайте, насколько ваши целевые запросы могут быть классифицированы как «рискованные» (например, финансы, здоровье, бесплатный контент, adult-adjacent). В таких нишах (низкий Gq) ожидайте более высоких порогов качества (Gt) и прилагайте дополнительные усилия для подтверждения надежности.

Worst practices (это делать не надо)

  • Использование кликбейта: Тактики, приводящие к низкому Watch Rate Score (высокий показатель отказов после клика), напрямую снижают Gr. В контексте рискованного запроса это гарантирует понижение из-за высокого порога Gt.
  • Создание контента пограничного качества: Контент среднего качества может ранжироваться по безопасным запросам, но будет отфильтрован по рискованным. Система специально разработана для того, чтобы требовать высокого Gr там, где велик риск злоупотреблений (Low Gq).
  • Работа в рискованных нишах без авторитета: Попытки ранжироваться по запросам типа «бесплатный фильм» или «быстрый заработок», не будучи авторитетным источником с высоким Gr, скорее всего, приведут к активации агрессивных понижений.

Стратегическое значение

Патент подтверждает использование Google динамических, контекстно-зависимых систем для контроля качества выдачи. Качество (Goodness) здесь выступает не просто как фактор ранжирования, а как необходимое условие для видимости в определенных контекстах. Для видео-SEO это подчеркивает доминирование поведенческих сигналов (Watch Rate) как определяющих факторов ранжирования, способных перевесить традиционные факторы оптимизации.

Практические примеры

Сценарий 1: Рискованный запрос (Финансы/YMYL)

  1. Запрос: «быстрый заработок в интернете без вложений».
  2. Оценка Gq: Система определяет, что выдача содержит много сомнительного контента. Gq = 0.3 (Низкий/Рискованный).
  3. Определение порога Gt: Из-за низкого Gq система устанавливает высокий порог Gt = 0.85.
  4. Оценка результатов:
    • Видео А: Кликбейт, низкий Watch Rate Score, новый канал. Gr = 0.4.
    • Видео Б: Интервью с экспертом на авторитетном финансовом канале. Gr = 0.9.
  5. Результат: Видео А понижается (0.4 < 0.85). Видео Б разрешается (0.9 > 0.85).

Сценарий 2: Безопасный запрос

  1. Запрос: «как завязать галстук».
  2. Оценка Gq: Система определяет, что выдача в целом качественная. Gq = 0.9 (Высокий/Безопасный).
  3. Определение порога Gt: Из-за высокого Gq система устанавливает низкий порог Gt = 0.2.
  4. Оценка результатов:
    • Видео В: Профессиональная инструкция. Gr = 0.95.
    • Видео Г: Любительское видео среднего качества. Gr = 0.5.
  5. Результат: Оба видео разрешены (Gr > Gt). Система допускает большее разнообразие качества в безопасной выдаче.

Вопросы и ответы

Что такое «рискованный запрос» (Risky Search Query) в контексте этого патента?

Это запрос, который, по оценке системы, с высокой вероятностью привлекает нежелательный контент (спам, кликбейт, пиратство). Технически он определяется через Query Goodness Value (Gq). Если среднее качество результатов в выдаче низкое, Gq также будет низким, и запрос классифицируется как рискованный.

Как именно оценка качества запроса (Gq) влияет на порог (Gt)?

Влияние обратное. Если Gq низкий (запрос рискованный), то порог качества Gt устанавливается высоким (система становится более строгой). Если Gq высокий (запрос безопасный), то порог Gt устанавливается низким (система более лояльна). Это позволяет агрессивно фильтровать спам там, где он есть, не затрагивая нормальные выдачи.

Какие факторы используются для расчета качества результата (Gr)?

Патент явно указывает на Watch Rate Score (отношение просмотров к показам) как на обязательный компонент (Claim 1). Также упоминаются оценки качества самого контента и оценки качества источника (канала, пользователя, сущности). На практике это комбинация поведенческих сигналов и сигналов авторитетности (E-E-A-T).

Применяется ли этот патент только к поиску видео?

В Claims (Формуле изобретения) явно указан «поисковый запрос на видеоконтент» (search query for a video content item). Это указывает на основное применение в системах типа YouTube или Google Video Search. Однако общие принципы динамического изменения порогов качества на основе риска запроса могут быть применимы и в основном веб-поиске.

Что произойдет, если мой контент качественный, но размещен на новом сайте/канале?

Если система оценивает качество источника как низкое, это снизит общую оценку Result Goodness Value (Gr). Если вы таргетируете рискованные запросы (где порог Gt высок), есть значительный риск, что ваш Gr окажется ниже Gt, и контент будет понижен, несмотря на его собственное качество. Это подчеркивает важность развития авторитета источника.

Как система определяет, что понижать, а что нет, если функции настраиваются автоматически (ML Tuning)?

Система обучается на исторических данных, где результаты размечены как «GOOD» (хорошие) или «BAD» (нежелательные). Процесс обучения оптимизирует функции и пороги так, чтобы максимизировать фильтрацию «BAD» результатов. В патенте указано, что при обучении используются веса, и ошибки на «GOOD» результатах (ложные срабатывания) штрафуются сильнее.

Что такое корректирующая функция f(Gr) и зачем она нужна?

Это функция (kernel), которая может применяться к оценкам Gr перед их усреднением в Gq. Она нужна для того, чтобы различать поляризованную выдачу (половина результатов очень плохие, половина очень хорошие) и равномерную выдачу (все результаты среднего качества). Это позволяет системе точнее оценить характер риска выдачи.

Как попадание в Whitelist влияет на этот алгоритм?

Попадание в Whitelist полностью отключает механизм динамического порога для данного контента или источника. Если результат в Whitelist, он будет разрешен независимо от его оценки Gr или порога Gt. Это высший уровень доверия со стороны системы.

Как бороться с понижением по этому алгоритму?

Единственный способ — систематически повышать Result Goodness Value (Gr) вашего контента. Это достигается за счет улучшения поведенческих факторов (увеличение Watch Rate Score, снижение отказов) и повышения авторитетности источника (E-E-A-T сайта или канала).

Влияет ли этот алгоритм на монетизацию контента?

Да, в описании патента (не в Claims) упоминается, что одним из вариантов «понижения» (demoting) является предотвращение монетизации (preventing monetization) контента. Это означает, что даже если контент не удален из выдачи, он может перестать приносить доход от рекламы, если не пройдет динамический фильтр качества.

Похожие патенты

Как Google рассчитывает «Рейтинг безопасности» запроса для фильтрации или блокировки выдачи (SafeSearch)
Google анализирует рейтинги контента (например, «для всех возрастов» или «для взрослых») топовых результатов по запросу, чтобы вычислить его «Safety Score». Если выдача содержит слишком много неприемлемого контента, система может полностью заблокировать запрос или агрессивно отфильтровать результаты, показывая только гарантированно безопасный и релевантный контент.
  • US11829373B2
  • 2023-11-28
  • Безопасный поиск

  • SERP

Как Google динамически переоценивает значимость факторов ранжирования, основываясь на их надежности в контексте конкретной выдачи
Google использует механизм для повышения качества ранжирования путем анализа надежности (Trustworthiness) различных факторов, влияющих на позицию документа. Если система обнаруживает значительную разницу в надежности сигналов среди результатов поиска, она снижает влияние менее достоверных факторов. Это гарантирует, что документы, получившие высокие оценки за счет ненадежных или легко манипулируемых сигналов, не будут ранжироваться выше документов с более достоверными показателями качества и релевантности.
  • US9623119B1
  • 2017-04-18
  • EEAT и качество

  • Поведенческие сигналы

  • SERP

Как Google повышает ранжирование каналов на основе позиций их контента в результатах поиска
Google использует механизм для улучшения видимости «Каналов» (например, каналов YouTube) в поиске на контент-платформах. Система гарантирует присутствие определенного числа каналов в выдаче, а затем агрессивно повышает ранжирование канала, если его отдельные единицы контента (например, видео) уже занимают высокие позиции по данному запросу. Это достигается путем расчета совокупной оценки канала на основе позиций его контента.
  • US9348922B2
  • 2016-05-24
  • SERP

  • Мультимедиа

Как Google динамически корректирует веса факторов ранжирования для каждого запроса на основе анализа выдачи
Google использует этот механизм для динамической адаптации алгоритма ранжирования к специфике конкретного запроса. Система анализирует, какие факторы оказали наибольшее влияние на формирование первичной выдачи по сравнению с историческими данными. Если влияние факторов отличается от нормы, система корректирует их веса и проводит повторное ранжирование (Re-scoring) для обеспечения оптимального результата.
  • US10339144B1
  • 2019-07-02
  • SERP

Как Google динамически генерирует фильтры (теги) в выдаче на основе контента ранжируемых страниц
Google использует механизм для автоматического создания фильтров поисковой выдачи (например, в виде тегов или «пузырьков»). Система анализирует контент страниц, уже отобранных для показа по запросу, извлекает из них ключевые слова и проверяет их полезность, используя данные о поведении пользователей. Затем система отбирает наиболее релевантные и разнообразные фильтры, позволяя пользователю уточнить свой интент в один клик.
  • US10242112B2
  • 2019-03-26
  • Семантика и интент

  • SERP

  • Поведенческие сигналы

Популярные патенты

Как Google использует крупномасштабное машинное обучение и данные о поведении пользователей для предсказания кликов и ранжирования результатов
Google использует систему машинного обучения для создания модели ранжирования, которая предсказывает вероятность клика пользователя по документу. Модель обучается на огромных массивах данных о прошлых поисках (запросы, документы, клики). Система учитывает базовую вероятность клика (Prior Probability), основанную на позиции и предыдущей оценке документа, а затем корректирует её с помощью правил, выявляющих, какие признаки (Features) документа и запроса влияют на выбор пользователя.
  • US7231399B1
  • 2007-06-12
  • Поведенческие сигналы

Как Google использует модифицированный PageRank (Personalized PageRank) для персонализации выдачи на основе истории и предпочтений пользователя
Патент Google, описывающий механизм персонализации поиска путем модификации алгоритма PageRank. Система определяет "точку зрения" пользователя (Point-of-View Data) на основе его истории посещений, закладок или указанных категорий. Затем стандартный расчет PageRank изменяется так, чтобы авторитет (Reset Probability) концентрировался только на этих персональных источниках, повышая в выдаче сайты, которые близки к интересам пользователя.
  • US7296016B1
  • 2007-11-13
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует клики (CTR) и время на сайте (Click Duration) для выявления спама и корректировки ранжирования в тематических выдачах
Google использует итеративный процесс для улучшения классификации контента и выявления спама, анализируя поведенческие сигналы (CTR и продолжительность клика). Если пользователи быстро покидают документ или игнорируют его в выдаче, он помечается как спам или нерелевантный теме. Эти данные затем используются для переобучения классификатора и корректировки ранжирования для будущих тематических запросов.
  • US7769751B1
  • 2010-08-03
  • Поведенческие сигналы

  • Антиспам

  • SERP

Как Google использует генеративный ИИ для создания динамических и гиперперсонализированных бизнес-профилей
Google разрабатывает систему, которая заменяет статические бизнес-профили динамическими «курируемыми профилями», генерируемыми ИИ (например, LLM). Эти профили адаптируются в реальном времени под конкретного пользователя, учитывая его запрос, предпочтения, историю поиска и демографию, чтобы показать наиболее релевантный контент, продукты и описания бренда.
  • US20250054045A1
  • 2025-02-13
  • Персонализация

  • Поведенческие сигналы

  • Семантика и интент

Как Google выбирает модель визуальной релевантности для сложных запросов в Поиске по картинкам
Google решает проблему ранжирования изображений для сложных или редких запросов, для которых нет специализированной модели релевантности. Система тестирует существующие модели, созданные для частей запроса (подзапросов), и выбирает ту, которая лучше всего соответствует поведению пользователей (кликам) по исходному запросу. Это позволяет улучшить визуальную релевантность в Image Search.
  • US9152652B2
  • 2015-10-06
  • Поведенческие сигналы

  • Мультимедиа

  • Семантика и интент

Как Google использует вовлеченность пользователей на связанных страницах (Reachability Score) для ранжирования основного документа
Google рассчитывает «Оценку Достижимости» (Reachability Score), анализируя, как пользователи взаимодействуют со страницами, на которые ссылается основной документ (внутренние и исходящие ссылки). Если пользователи активно переходят по этим ссылкам (высокий CTR) и проводят время на целевых страницах (высокое время доступа), основной документ получает повышение в ранжировании. Этот механизм измеряет потенциальную глубину и качество пользовательской сессии.
  • US8307005B1
  • 2012-11-06
  • Поведенческие сигналы

  • Ссылки

  • SERP

Как Google использует анализ сопутствующих ссылок (co-citation) и нормализацию веса для определения связанных сайтов и конкурентов
Google анализирует структуру ссылок для поиска сайтов, связанных с выбранным документом и находящихся на том же уровне обобщения (например, конкурентов). Система определяет, на какие еще сайты ссылаются источники, цитирующие исходный документ (co-citation). Для повышения точности вес ссылок нормализуется: снижается влияние множественных ссылок с одного хоста и ссылок со страниц-каталогов (хабов).
  • US6754873B1
  • 2004-06-22
  • Ссылки

  • SERP

  • Техническое SEO

Как Google использует анкорный текст входящих ссылок для определения синонимов и псевдонимов сущностей в Knowledge Graph
Google автоматически определяет синонимы и псевдонимы для сущностей (например, людей, компаний) в своем хранилище фактов (Knowledge Graph). Система анализирует анкорный текст ссылок, ведущих на исходные документы, из которых были извлечены факты о сущности. Это позволяет системе понять, что, например, "Биг Блю" и "IBM" относятся к одной и той же компании.
  • US8738643B1
  • 2014-05-27
  • Knowledge Graph

  • Семантика и интент

  • Ссылки

Как Google использует машинное зрение и исторические клики для определения визуального интента и ранжирования изображений
Google использует систему, которая определяет визуальное значение текстового запроса, анализируя объекты на картинках, которые пользователи выбирали ранее по этому или похожим запросам. Система создает набор «меток контента» (визуальный профиль) для запроса и сравнивает его с объектами, распознанными на изображениях-кандидатах с помощью нейросетей. Это позволяет ранжировать изображения на основе их визуального соответствия интенту пользователя.
  • US20200159765A1
  • 2020-05-21
  • Семантика и интент

  • Мультимедиа

  • Персонализация

Как Google создает и наполняет Панели Знаний (Knowledge Panels), используя шаблоны сущностей и популярность фактов
Google использует систему для отображения Панелей Знаний (Knowledge Panels) рядом с результатами поиска. Когда запрос относится к конкретной сущности (человеку, месту, компании), система выбирает соответствующий шаблон и наполняет его контентом из разных источников. Выбор фактов для отображения основан на том, как часто пользователи искали эту информацию в прошлом.
  • US9268820B2
  • 2016-02-23
  • Knowledge Graph

  • SERP

  • Семантика и интент

seohardcore