SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google рассчитывает «Рейтинг безопасности» запроса для фильтрации или блокировки выдачи (SafeSearch)

METHODS, SYSTEMS, AND MEDIA FOR PRESENTING SEARCH RESULTS (Методы, системы и средства для представления результатов поиска)
  • US11829373B2
  • Google LLC
  • 2015-02-20
  • 2023-11-28
  • Безопасный поиск
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует рейтинги контента (например, «для всех возрастов» или «для взрослых») топовых результатов по запросу, чтобы вычислить его «Safety Score». Если выдача содержит слишком много неприемлемого контента, система может полностью заблокировать запрос или агрессивно отфильтровать результаты, показывая только гарантированно безопасный и релевантный контент.

Описание

Какую проблему решает

Патент решает проблему предотвращения показа неприемлемого или "взрослого" контента (Mature Content – насилие, сексуальный контент, ненормативная лексика и т.д.) пользователям, для которых он не предназначен, особенно детям. Сложность заключается в идентификации запросов, которые могут привести к такому контенту, даже если сам текст запроса не содержит запрещенных слов. Система направлена на оценку безопасности запроса на основе анализа результатов, которые он генерирует.

Что запатентовано

Запатентована система для динамической оценки безопасности поискового запроса путем расчета Content Rating Score (или Safety Score). Этот показатель вычисляется как пропорция результатов поиска, принадлежащих к определенным классам рейтинга контента (например, безопасные против небезопасных), среди топовых результатов. На основе этой оценки и анализа релевантности система принимает решение о разрешении, блокировке или агрессивной фильтрации выдачи.

Как это работает

Ключевой механизм – это расчет и использование Safety Score:

  • Сбор и анализ результатов: Система анализирует Топ-N результатов по запросу и определяет их классы контент-рейтинга (Content Ratings Classes).
  • Расчет Safety Score: Вычисляется пропорция безопасного и небезопасного контента. Этот расчет взвешивается по популярности или релевантности результатов.
  • Адаптация порогов: Пороги срабатывания могут динамически корректироваться, например, на основе длины запроса (как индикатора возраста пользователя).
  • Принятие решения: Используется многоступенчатая логика. Если контент преимущественно безопасный – запрос разрешается. Если преимущественно небезопасный – блокируется.
  • Обработка пограничных случаев: Если выдача смешанная, система проверяет, достаточно ли релевантных безопасных результатов. Если да – показывается отфильтрованная выдача; если нет – запрос блокируется.

Актуальность для SEO

Высокая. Патент подан в 2015 году, но выдан только в конце 2023 года, что указывает на актуальность технологии. Описанные механизмы критически важны для работы систем безопасного поиска (SafeSearch), родительского контроля и соблюдения регуляторных требований по защите детей.

Важность для SEO

Патент имеет высокое значение (7.5/10), но специфическое. Он не описывает базовое ранжирование, но критичен для понимания видимости контента в фильтрованных средах (SafeSearch, детские аккаунты). Он демонстрирует механизмы, которые могут полностью исключить сайт из видимости для значительной части аудитории, если контент или сам запрос классифицированы как небезопасные, независимо от E-E-A-T или базовой релевантности.

Детальный разбор

Термины и определения

Content Rating Score / Safety Score (Оценка рейтинга контента / Оценка безопасности)
Метрика, рассчитываемая для поискового запроса. Отражает пропорцию результатов поиска, принадлежащих к определенным Content Ratings Classes среди Топ-N результатов. Может быть взвешенной.
Content Ratings Classes (Классы рейтинга контента)
Категории, присваиваемые контенту, указывающие на его пригодность для разных аудиторий. Например, "Suitable for all ages" (Безопасный/Safe) и "Suitable for adults" (Небезопасный/Unsafe/Mature).
Safe Results / Unsafe Results
Результаты поиска, классифицированные как подходящие или неподходящие для презентации соответственно.
Known Safe Results (Известные безопасные результаты)
Подмножество Safe Results, для которых система имеет высокую степень уверенности (Confidence Value) в их классификации.
Borderline Queries (Пограничные запросы)
Запросы, которые возвращают смесь безопасного и небезопасного контента и требуют более глубокого анализа релевантности для принятия решения о фильтрации.
Weight (Вес)
Множитель, применяемый к результатам при расчете Safety Score. Может основываться на популярности (popularity) или релевантности (relevance) результата.
Relevance Score (Оценка релевантности)
Метрика, указывающая, насколько результат поиска соответствует запросу. Рассчитывается на основе различных "типов доказательств" (types of evidence).
Predetermined Threshold Value (Предопределенное пороговое значение)
Значение, с которым сравнивается Safety Score. Может быть динамическим, например, зависеть от длины запроса.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт, выдан в 2023): Описывает основной метод представления результатов поиска.

  1. Система получает текст поискового запроса.
  2. Определяется пороговое значение (predetermined threshold value) на основе количества слов в запросе. (Логика: более длинные запросы ассоциируются со взрослыми, более короткие — с детьми).
  3. Определяется, находится ли Content Rating Score запроса ниже этого порога. Расчет оценки включает:
    • Идентификацию первого набора результатов и их Content Ratings Classes.
    • Определение веса (weight) для каждого результата на основе его популярности (popularity).
    • Расчет оценки как взвешенной пропорции результатов определенных классов.
  4. Если оценка НИЖЕ порога:
    • Блокируется показ первого набора результатов.
    • Идентифицируется ВТОРОЙ набор результатов (отфильтрованный).
  5. Система вызывает показ второго набора результатов вместе с указанием причины блокировки первого набора.

Claim 2 (Зависимый от 1): Уточняет, что вес также может определяться на основе релевантности (relevance) результата запросу.

Claim 6 (Зависимый от 1): Детализирует логику, если оценка ВЫШЕ порога (т.е. запрос потенциально разрешен).

Система сравнивает релевантность результатов первого класса (например, Safe) и второго класса (например, Unsafe). Если релевантность первого класса схожа или больше, чем второго, идентифицируется и показывается третий набор результатов. Это гарантирует, что безопасный контент достаточно релевантен для показа.

Где и как применяется

Изобретение является ключевым компонентом систем фильтрации контента, таких как SafeSearch или Родительский Контроль.

INDEXING – Индексирование и извлечение признаков
На этом этапе контент должен быть проанализирован и ему должны быть присвоены Content Ratings Classes (Safe/Unsafe). Эти данные сохраняются в индексе.

QUNDERSTANDING – Понимание Запросов
Система анализирует характеристики запроса в реальном времени (например, длину запроса согласно Claim 1), чтобы скорректировать пороговые значения безопасности.

RANKING – Ранжирование
Генерируется первоначальный (неотфильтрованный) набор результатов (Топ-N) и рассчитываются базовые Relevance Scores и метрики популярности.

RERANKING – Переранжирование / METASEARCH – Метапоиск и Смешивание
Основное применение патента. Search Server и Safety Score Server анализируют результаты этапа RANKING:

  1. Расчет оценки: Вычисляется Safety Score для запроса на основе рейтингов и весов (популярности/релевантности) топовых результатов.
  2. Принятие решения: Оценка сравнивается с порогами (используя логику, например, из FIG. 5) для определения действия (Allow, Block, Filter).
  3. Фильтрация: При необходимости генерируется второй набор результатов, состоящий только из безопасного контента, который заменяет исходный набор.

Входные данные:

  • Поисковый запрос и его длина.
  • Топ-N результатов ранжирования.
  • Content Ratings Class и Confidence Value для каждого результата.
  • Веса для результатов (популярность, релевантность).

Выходные данные:

  • Финальный набор результатов (SERP) или уведомление о блокировке.

На что влияет

  • Специфические запросы: Наибольшее влияние оказывается на неоднозначные или широкие запросы (Borderline Queries), которые могут возвращать смесь безопасного и зрелого контента.
  • Конкретные ниши или тематики: Ниши, связанные со здоровьем, развлечениями, новостями, социальными темами и любым контентом, который может быть классифицирован как Mature (насилие, сексуальный контент, ненормативная лексика).
  • Типы контента: В патенте особо упоминаются видео и медиаконтент, но механизм применим к любому типу индексируемого контента.

Когда применяется

  • Условия работы: Алгоритм применяется, когда активированы функции безопасности контента (SafeSearch, родительский контроль, детские аккаунты) или когда система идентифицирует пользователя как ребенка (например, на основе длины запроса).
  • Триггеры активации: Действия по блокировке или фильтрации активируются, когда Safety Score запроса пересекает определенные пороги (Thresholds).

Пошаговый алгоритм

Описание процесса на основе наиболее детализированной логики принятия решений (FIG. 5).

  1. Получение данных и расчет Safety Score: Система рассчитывает Safety Score (взвешенную пропорцию Safe и Unsafe результатов в Топ-N).
  2. Проверка на безопасность (Threshold 1): Превышает ли пропорция Safe Results первый высокий порог?
    • Если ДА: Проверяется релевантность Safe Results. Если они релевантны, запрос разрешается (Allow).
  3. Проверка на опасность (Threshold 2): Если Threshold 1 не достигнут, превышает ли пропорция Unsafe Results второй порог?
    • Если ДА: Запрос блокируется (Block).
  4. Обработка пограничных случаев (Borderline): Если ни Threshold 1, ни Threshold 2 не сработали.
  5. Идентификация надежных результатов: Идентифицируются Known Safe Results (результаты с высокой уверенностью в безопасности).
  6. Проверка количества (Threshold 3): Превышает ли количество Known Safe Results третий порог?
    • Если НЕТ: Запрос блокируется (Block).
  7. Сравнение релевантности: Если Threshold 3 достигнут, система сравнивает агрегированную релевантность Known Safe Results с агрегированной релевантностью Unsafe Results.
  8. Финальное решение:
    • Если Safe релевантнее или схожи по релевантности с Unsafe: Показывается отфильтрованная выдача (Filter).
    • Если Safe значительно менее релевантны, чем Unsafe: Запрос блокируется (Block).

Какие данные и как использует

Данные на входе

  • Данные о классификации контента (Системные): Критически важные данные – Content Ratings Class (Safe/Unsafe), присвоенный каждому документу в индексе. Также используется Confidence Value этой классификации.
  • Поведенческие факторы (Popularity): В Claim 1 явно указано использование популярности (popularity) для взвешивания результатов при расчете Safety Score. Упоминаются просмотры, длительность просмотра, клики.
  • Метрики релевантности: Relevance Score результатов по отношению к запросу.
  • Технические факторы (Характеристики запроса): Длина запроса (number of words) используется для динамической настройки пороговых значений безопасности (Claim 1).
  • Пользовательские факторы (Опционально, FIG. 6): Возраст, пол, история поиска, IP-адрес (локация), информация об устройстве могут использоваться обученным классификатором для оценки безопасности запроса.

Какие метрики используются и как они считаются

  • Safety Score (Content Rating Score): Взвешенная пропорция Safe/Unsafe контента в Топ-N. Пример формулы (без весов): (MA 

    Выводы

    1. Оценка безопасности на уровне запроса: Google оценивает безопасность не только отдельных документов, но и всего запроса (Safety Score) на основе состава Топ-N результатов. Это позволяет обрабатывать двусмысленные запросы и блокировать выдачу целиком, если она признана небезопасной.
    2. Влияние популярных и релевантных результатов: Расчет Safety Score является взвешенным. Более популярные (Claim 1) или релевантные (Claim 2) результаты сильнее влияют на итоговую оценку. Небезопасный результат на 1-й позиции значительно опаснее, чем на 10-й.
    3. Динамическая адаптация порогов (Возраст пользователя): Система использует эвристики для определения возраста пользователя. Длина запроса используется как прокси-сигнал (Claim 1): для коротких запросов (предположительно детских) пороги безопасности строже.
    4. Баланс между безопасностью и релевантностью (Borderline Queries): Для смешанной выдачи применяется сложная логика. Безопасный контент будет показан, только если он достаточно многочислен (Threshold 3) И его релевантность сопоставима с релевантностью небезопасного контента. Google предпочтет заблокировать запрос, чем показать нерелевантную безопасную выдачу.
    5. Критичность уверенности в классификации: Система полагается на Known Safe Results (высокая уверенность в безопасности) при принятии решений в пограничных случаях, подчеркивая важность точности классификации контента на этапе индексирования.

    Практика

    Best practices (это мы делаем)

    • Обеспечение четких сигналов о характере контента: Убедитесь, что контент сайта посылает однозначные сигналы, позволяющие системам Google правильно его классифицировать как безопасный (Safe). Избегайте двусмысленности, использования лексики или изображений, которые могут привести к классификации страницы как Mature или Unsafe.
    • Максимизация релевантности безопасного контента: В пограничных нишах критически важно, чтобы безопасный контент был максимально релевантен. Согласно патенту (FIG. 5), если релевантность безопасного контента ниже, чем у небезопасного, запрос может быть заблокирован. Необходимо глубоко прорабатывать контент под безопасный интент запроса.
    • Мониторинг видимости в SafeSearch: Регулярно проверяйте ранжирование сайта при включенном режиме SafeSearch. Резкое падение видимости указывает на проблемы с классификацией контента или на то, что целевые запросы считаются пограничными/небезопасными.
    • Сегментация контента: Если сайт содержит как безопасный, так и "взрослый" контент, четко разделяйте их (например, по поддоменам). Используйте метатеги рейтинга (например, rating=adult) для Mature разделов, чтобы помочь корректной классификации.

    Worst practices (это делать не надо)

    • Смешивание безопасного и Mature контента: Размещение "взрослого" контента, включая немодерируемый UGC (комментарии, изображения), на страницах, предназначенных для широкой аудитории. Это увеличивает риск классификации страницы как Unsafe.
    • Использование двусмысленных или провокационных заголовков (Clickbait): Заголовки или изображения, намекающие на Mature Content, могут привести к соответствующей классификации, даже если основной контент безопасен.
    • Игнорирование популярности небезопасной интерпретации запроса: Оптимизация под двусмысленные термины, если основная популярность этих терминов связана с взрослым контентом. Поскольку популярность используется как вес (Claim 1), система может признать запрос небезопасным.

    Стратегическое значение

    Патент подтверждает, что оценка безопасности контента является ключевым компонентом поисковой системы, который может переопределить стандартное ранжирование. Алгоритм демонстрирует, что Google готов пожертвовать полнотой выдачи ради обеспечения безопасности. Для SEO-стратегии это означает, что необходимо учитывать не только E-E-A-T, но и классификацию безопасности контента (Suitability/Safety), так как она напрямую влияет на видимость сайта в защищенных средах.

    Практические примеры

    Сценарий 1: Обработка неоднозначного запроса (Borderline Query)

    1. Запрос: "Bands" (может означать музыкальные группы или что-то еще). Контекст: SafeSearch включен.
    2. Анализ SERP: Топ-10 содержит 7 результатов о музыке (Safe) и 3 результата, классифицированных как Mature (Unsafe).
    3. Расчет Safety Score: Оценка попадает в пограничную зону.
    4. Глубокий анализ (FIG. 5): Система сравнивает релевантность Safe и Unsafe результатов.
    5. Случай А (Релевантные безопасные результаты): Если результаты о музыкальных группах имеют высокую релевантность, система отфильтрует 3 Unsafe результата и покажет только 7 Safe (Фильтрованная выдача).
    6. Случай Б (Нерелевантные безопасные результаты): Если система определяет, что Safe результаты менее релевантны, она решает, что не может предоставить качественную безопасную выдачу, и блокирует запрос полностью.

    Сценарий 2: Влияние популярности на Safety Score (Claim 1)

    1. Запрос: Информационный запрос по теме здоровья.
    2. Анализ SERP: В Топ-10 находятся 9 статей из медицинских источников (Safe) и 1 результат с сайта для взрослых (Unsafe), который имеет очень высокую вирусную популярность.
    3. Расчет Safety Score: Система применяет веса на основе популярности. Unsafe результат получает вес, значительно превышающий вес остальных результатов.
    4. Результат: Взвешенный Safety Score оказывается низким, что приводит к фильтрации выдачи или блокировке запроса, несмотря на то, что 9 из 10 результатов были безопасными.

    Вопросы и ответы

    Что такое «Safety Score» запроса и чем он отличается от оценки безопасности страницы?

    Safety Score (или Content Rating Score) относится к самому поисковому запросу. Он рассчитывается на основе оценок безопасности (Content Ratings Classes) отдельных страниц, которые находятся в Топ-N выдачи по этому запросу. Если в топе преобладают страницы, классифицированные как небезопасные, то и сам запрос получит низкий Safety Score, что может привести к блокировке всей выдачи.

    Как популярность и релевантность влияют на Safety Score запроса?

    Они используются как веса при расчете (Claims 1 и 2). Это означает, что результаты, которые более популярны или находятся выше в ранжировании (более релевантны), оказывают большее влияние на итоговую оценку безопасности запроса. Высокопопулярный небезопасный результат на 1-й позиции значительно снизит Safety Score запроса.

    Влияет ли длина запроса на строгость фильтрации?

    Да, согласно Claim 1. Система использует количество слов в запросе как индикатор возраста пользователя. Предполагается, что короткие запросы чаще вводят дети. Следовательно, для коротких запросов система может применять более строгие пороги безопасности (требовать более высокого Safety Score для разрешения запроса).

    Что происходит, если выдача содержит и безопасный, и небезопасный контент (Borderline Query)?

    Система активирует сложную логику (FIG. 5). Она проверит два условия: 1) Достаточно ли много результатов, которые точно классифицированы как безопасные (Known Safe Results)? 2) Являются ли эти безопасные результаты такими же или более релевантными, чем небезопасные? Если оба условия выполнены, будет показана отфильтрованная выдача. Иначе запрос будет заблокирован.

    Может ли запрос быть заблокирован, даже если по нему есть релевантные безопасные результаты?

    Да. Если система определяет, что общая пропорция небезопасного контента слишком высока (превышен Threshold 2), запрос будет заблокирован независимо от наличия отдельных безопасных результатов. Это делается для предотвращения любого риска показа Mature Content в защищенной среде.

    Как этот патент связан с работой фильтра Google SafeSearch?

    Этот патент описывает техническую реализацию и логику принятия решений, которые, вероятнее всего, лежат в основе системы Google SafeSearch и аналогичных функций родительского контроля. Он детализирует, как именно система решает, когда фильтровать выдачу или блокировать запрос.

    Что делать SEO-специалисту, если его безопасный контент фильтруется?

    Необходимо проверить, не был ли контент ошибочно классифицирован как Unsafe из-за двусмысленности, изображений или UGC. Также важно повышать релевантность и популярность этого контента, чтобы он имел больше шансов пройти проверку релевантности в пограничных ситуациях и оказывал большее положительное влияние на Safety Score запросов.

    Как система определяет рейтинг контента (Content Rating Class) для страницы?

    Патент предполагает, что этот процесс происходит на этапе индексирования и не детализирует его. На практике это включает анализ текста, изображений, видео, метаданных и поведенческих сигналов с помощью автоматических классификаторов для выявления Mature Content (насилие, сексуальный контент, ненормативная лексика).

    Учитывает ли система данные пользователя при оценке безопасности?

    Да. Помимо использования длины запроса как прокси-сигнала возраста (Claim 1), в патенте описан вариант (FIG. 6), использующий обученный классификатор. Он учитывает профиль пользователя (возраст, пол), историю поиска и активность для более точной оценки безопасности запроса в контексте конкретного пользователя.

    Влияет ли этот механизм на ранжирование в обычном (нефильтрованном) поиске?

    Патент фокусируется на фильтрации результатов после ранжирования в защищенных средах. Однако системы классификации контента (определяющие Content Ratings Classes), которые являются входными данными для этого механизма, используются Google повсеместно и могут влиять на видимость контента и в общем поиске.

    Похожие патенты

    Как Google фильтрует поисковые подсказки (Autocomplete) на основе оценок безопасности контента в результатах поиска
    Google анализирует рейтинги безопасности (например, возрастные ограничения) контента в результатах поиска для популярных запросов. Если выдача по запросу содержит недостаточное количество "безопасного" контента (ниже установленного порога), этот запрос добавляется в список запрещенных и не показывается в качестве поисковой подсказки (Autocomplete) пользователям с включенными фильтрами безопасности.
    • US10169488B2
    • 2019-01-01
    • Безопасный поиск

    • SERP

    Как Google стандартизирует и применяет международные возрастные рейтинги для фильтрации контента в поиске
    Google использует систему для унификации различных национальных систем возрастных рейтингов (например, PG-13 в США, 12А в Великобритании, 16+ в России) в единый глобальный стандарт. Это позволяет применять пользовательские настройки фильтрации (например, родительский контроль или SafeSearch) единообразно к контенту из любой страны, блокируя или модифицируя результаты поиска, если они не соответствуют установленному уровню ограничений.
    • US9703846B1
    • 2017-07-11
    • Безопасный поиск

    • SERP

    Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
    Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
    • US9152701B2
    • 2015-10-06
    • Семантика и интент

    • Безопасный поиск

    • Поведенческие сигналы

    Как Google использует классификаторы запросов и контента для фильтрации и понижения оскорбительных результатов, связанных с защищенными группами
    Google применяет систему двойной классификации для защиты пользователей от неуместного или оскорбительного контента. Система оценивает, относится ли запрос к «защищенной группе людей» и содержит ли он деликатные термины. Параллельно анализируется, содержат ли результаты поиска оскорбительный контент. На основе комбинации этих классификаций и анализа сессии пользователя результаты могут быть отфильтрованы или понижены в ранжировании.
    • US10083237B2
    • 2018-09-25
    • Безопасный поиск

    • Семантика и интент

    • SERP

    Как Google реализует SafeSearch и верификацию возраста путем фильтрации чувствительных запросов и результатов
    Google использует систему для обнаружения «фильтрующих терминов» в запросах или результатах поиска. При обнаружении Google немедленно показывает только «отфильтрованные» (безопасные) результаты и предлагает доступ к службе верификации (например, подтверждение возраста). Если пользователь верифицирован, отображаются «нефильтрованные» (потенциально чувствительные) результаты. Это предотвращает полную блокировку выдачи при использовании чувствительных терминов.
    • US8032527B2
    • 2011-10-04
    • Безопасный поиск

    Популярные патенты

    Как Google определяет основной контент страницы, анализируя визуальную структуру и характеристики разделов
    Google использует систему для идентификации основного контента веб-страницы путем её разделения на логические разделы на основе визуального макета. Система оценивает характеристики каждого раздела (соотношение ссылок к тексту, количество слов, изображения, расположение) относительно характеристик всей страницы, чтобы выделить наиболее значимый контент и отделить его от навигации и шаблонов.
    • US20140372873A1
    • 2014-12-18
    • Структура сайта

    • Техническое SEO

    • Ссылки

    Как Google снижает ценность ссылок между аффилированными сайтами для борьбы с линк-схемами
    Google использует модификацию алгоритмов расчета качества (типа PageRank), которая учитывает аффилированность между ссылающимися документами. Если система определяет, что сайты связаны (например, принадлежат одному владельцу, находятся в одной сети или имеют схожие паттерны трафика), ценность ссылок между ними агрессивно снижается. Вместо суммирования веса всех ссылок система учитывает только максимальный вклад от аффилированной группы, нейтрализуя эффект линк-ферм и PBN.
    • US7783639B1
    • 2010-08-24
    • Ссылки

    • Антиспам

    • EEAT и качество

    Как Google оценивает качество изображений, комбинируя визуальные характеристики, распознанный контент и социальные сигналы для ранжирования
    Google использует систему для автоматического определения качества изображений, анализируя три класса характеристик: техническое качество (резкость, экспозиция), содержание (объекты, лица, ландшафты) и социальную популярность (просмотры, шеры, рейтинги). Система присваивает баллы этим характеристикам, взвешивает их (учитывая репутацию пользователей, оставивших отзывы) и формирует общий рейтинг для выбора лучших изображений.
    • US9858295B2
    • 2018-01-02
    • Мультимедиа

    • Поведенческие сигналы

    • SERP

    Как Google ранжирует сущности (например, фильмы или книги), используя популярность связанных веб-страниц и поисковых запросов в качестве прокси-сигнала
    Google использует механизм для определения популярности контентных сущностей (таких как фильмы, телешоу, книги), когда прямые данные о потреблении недоступны. Система идентифицирует авторитетные «эталонные веб-страницы» (например, страницы Википедии) и связанные поисковые запросы. Затем она измеряет популярность сущности, анализируя объем трафика на эти эталонные страницы и частоту связанных запросов в поиске, используя эти данные как прокси-сигнал для ранжирования сущности.
    • US9098551B1
    • 2015-08-04
    • EEAT и качество

    • Поведенческие сигналы

    • SERP

    Как Google использует визуальное расположение новостей на главных страницах СМИ для ранжирования в Google News
    Google анализирует главные страницы авторитетных новостных сайтов («Hub Pages»), чтобы определить важность новостей. Система оценивает «визуальную заметность» (Prominence) ссылки на статью — ее расположение (выше/ниже), размер шрифта, наличие картинки и сниппета. Чем заметнее ссылка на сайте СМИ, тем выше статья ранжируется в агрегаторах новостей.
    • US8375073B1
    • 2013-02-12
    • EEAT и качество

    • SERP

    • Ссылки

    Как Google улучшает результаты поиска, подбирая похожие "идеальные" запросы из логов и структурированных данных
    Google идентифицирует запросы, которые стабильно показывают высокое вовлечение пользователей (CTR, долгие клики), и генерирует синтетические запросы из структурированных данных (например, частотного анкорного текста). Когда пользователь вводит похожий, но потенциально плохо сформулированный запрос, Google использует эти "аугментирующие запросы" для предоставления более качественных и релевантных результатов.
    • US9128945B1
    • 2015-09-08
    • SERP

    • Поведенческие сигналы

    • EEAT и качество

    Как Google использует фразы и тематические кластеры из истории пользователя для персонализации результатов поиска
    Google может строить модель интересов пользователя, анализируя семантически значимые фразы и тематические кластеры в контенте, который пользователь потребляет (просматривает, сохраняет, печатает). При последующих запросах система повышает в ранжировании те документы, которые содержат фразы, одновременно релевантные запросу и присутствующие в профиле интересов пользователя.
    • US7580929B2
    • 2009-08-25
    • Персонализация

    • Семантика и интент

    • Поведенческие сигналы

    Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
    Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
    • US8874594B2
    • 2014-10-28
    • Персонализация

    • Поведенческие сигналы

    • Local SEO

    Как Google определяет, когда показывать обогащенный результат для сущности, и использует консенсус веба для исправления данных
    Google использует механизм для определения того, когда запрос явно относится к конкретной сущности (например, книге). Если один результат значительно доминирует над другими по релевантности, система активирует «обогащенный результат». Этот результат агрегирует данные из разных источников (структурированные данные, веб-страницы, каталоги товаров) и использует наиболее популярные варианты данных из интернета для проверки и исправления информации о сущности.
    • US8577897B2
    • 2013-11-05
    • SERP

    • Семантика и интент

    • EEAT и качество

    Как Google использует модель D-Q-D и поведение пользователей для предложения разнообразных запросов, связанных с конкретными результатами поиска
    Google использует модель "Документ-Запрос-Документ" (D-Q-D), построенную на основе данных о поведении пользователей (клики, время просмотра), для генерации связанных поисковых подсказок. Система предлагает альтернативные запросы, привязанные к конкретному результату, только если эти запросы ведут к новому, разнообразному набору документов, облегчая исследование смежных тем.
    • US8583675B1
    • 2013-11-12
    • Поведенческие сигналы

    • SERP

    • Семантика и интент

    seohardcore