SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google использует анализ совместных поисковых сессий для выявления запросов о неприемлемом или запрещенном контенте

UTILIZING USER CO-SEARCH BEHAVIOR TO IDENTIFY SEARCH QUERIES SEEKING INAPPROPRIATE CONTENT (Использование поведения совместного поиска пользователей для выявления поисковых запросов, направленных на поиск неприемлемого контента)
  • US9959354B2
  • Google LLC
  • 2015-06-23
  • 2018-05-01
  • Безопасный поиск
  • Поведенческие сигналы
  • Семантика и интент
  • Антиспам
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует поисковые сессии пользователей для обучения классификатора, выявляющего запросы о неприемлемом контенте (например, насилии, CSAM, терроризме). Система отслеживает, какие еще запросы вводил пользователь незадолго до или после ввода уже известного "плохого" запроса. Это позволяет автоматически расширять базу данных для фильтрации и модерации поисковой выдачи.

Описание

Какую проблему решает

Патент решает задачу автоматической идентификации поисковых запросов, направленных на поиск inappropriate sensitive or offensive content (неприемлемого чувствительного или оскорбительного контента). В качестве примеров такого контента приводятся детская порнография (CSAM), сцены насилия (gore), материалы для вербовки террористов. Цель — автоматизировать и расширить базу данных таких запросов для обучения классификатора (search query classifier), минимизируя ручной труд и защищая пользователей от нежелательного контента.

Что запатентовано

Запатентована система и метод для обучения классификатора поисковых запросов. Суть изобретения заключается в использовании поведения совместного поиска пользователей (user co-search behavior) для расширения существующей базы данных запросов, связанных с неприемлемым контентом. Система анализирует, какие дополнительные запросы пользователи вводят в течение короткого периода времени до или после ввода уже известного "плохого" запроса.

Как это работает

Система работает в офлайн-режиме для генерации обучающих данных:

  • Генерация базы: Создается начальный набор Reference Queries (референсных запросов), которые точно связаны с неприемлемым контентом.
  • Анализ сессий: Система анализирует логи поиска и идентифицирует Co-occurring Queries — запросы, введенные тем же пользователем в рамках определенного временного окна от Reference Query.
  • Расчет метрики: Для каждого совместного запроса рассчитывается Co-occurrence Value — метрика, показывающая, как часто этот запрос встречается рядом с референсными запросами по сравнению с его общей частотой.
  • Фильтрация и Валидация: Запросы с высоким Co-occurrence Value становятся Кандидатами. Они проходят дополнительные проверки (например, не являются ли они новостными или слишком частыми для данного пользователя), чтобы исключить ложные срабатывания.
  • Обучение: Подтвержденные запросы используются как обучающие данные для тренировки классификатора, который затем применяется в поиске для фильтрации выдачи.

Актуальность для SEO

Высокая. Обеспечение безопасности контента, модерация выдачи и борьба с распространением незаконных и неприемлемых материалов (CSAM, терроризм, экстремизм) являются критически важными и постоянно актуальными задачами для Google. Методы машинного обучения и анализа поведения пользователей для автоматизации этого процесса активно развиваются.

Важность для SEO

Минимальное влияние (1/10). Патент описывает инфраструктуру для модерации контента и систем безопасности (таких как SafeSearch или специализированные фильтры для незаконного контента), а не алгоритмы ранжирования общего веб-поиска. Он не дает практических рекомендаций для SEO-продвижения стандартных коммерческих или информационных сайтов. Его ценность для SEO заключается в понимании того, как Google использует анализ поисковых сессий (co-search behavior) для классификации интента запросов.

Детальный разбор

Термины и определения

Appropriate sensitive/offensive content (Приемлемый чувствительный/оскорбительный контент)
Контент, который может быть чувствительным или оскорбительным, но является допустимым в определенном контексте (например, новости о трагедии, медицинский контент). Система должна отличать его от Inappropriate.
Candidate Query (Запрос-кандидат)
Совместно встречающийся запрос, чье Co-occurrence Value превысило установленный порог и который подлежит дальнейшей проверке.
Classifier (Классификатор)
Компонент поисковой системы, обученный определять вероятность того, что входящий запрос направлен на поиск неприемлемого контента.
Co-occurring Query (Совместно встречающийся запрос)
Запрос, введенный пользователем в течение определенного периода времени (например, от 2 минут до 1 часа) до или после ввода Reference Query в рамках одной сессии.
Co-occurrence Value (Значение совместной встречаемости)
Метрика, указывающая на силу связи между запросом и неприемлемым контентом. Рассчитывается на основе (i) общего числа появлений запроса и (ii) числа его совместных появлений с любым из Reference Queries. Часто представляет собой соотношение (ii) к (i).
Inappropriate sensitive or offensive content (Неприемлемый чувствительный или оскорбительный контент)
Целевой контент, который система должна идентифицировать и фильтровать. Примеры: CSAM (детская порнография), сцены насилия (gore), вербовка террористов.
Reference Query (Референсный запрос)
Запрос, который уже идентифицирован (вручную или автоматически) как связанный с поиском неприемлемого контента. Служит отправной точкой для анализа совместного поведения.
Seed Terms (Начальные термины)
Базовые слова, используемые для автоматической генерации Reference Queries. Делятся на два набора (например, Набор 1: общий тип контента, Набор 2: неприемлемый аспект/подмножество).

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод сбора обучающих данных для классификатора.

  1. Система получает набор Reference Queries (известные "плохие" запросы).
  2. Идентифицируется набор Co-occurring Queries, которые встречаются рядом с референсными запросами в логах поиска.
  3. Каждый совместный запрос классифицируется как Candidate Query или нет.
  4. Определяется, какие из Кандидатов вероятно связаны с неприемлемым контентом.
  5. Эти запросы предоставляются как обучающие данные (training data) для классификатора.

Claim 8 (Независимый пункт): Детализирует полный цикл, включая генерацию референсных запросов и расчет метрик.

  1. Получение первого и второго наборов Seed Terms.
  2. Идентификация запросов, комбинирующих термины из обоих наборов, и классификация их как Reference Queries.
  3. Идентификация Co-occurring Queries.
  4. Расчет метрик: (i) общее число вхождений, (ii) число совместных вхождений.
  5. Расчет Co-occurrence Value на основе этих метрик.
  6. Классификация в Candidate Query (на основе Co-occurrence Value).
  7. Применение одного или нескольких критериев к Кандидатам для финальной классификации как "вероятно связанного" или "маловероятно связанного" с неприемлемым контентом.
  8. Предоставление "вероятно связанных" запросов как обучающих данных.

Claim 5 и Claim 11 (Зависимые): Уточняют механизм классификации в Кандидаты.

Классификация происходит, если Co-occurrence Value удовлетворяет пороговому значению (co-occurrence threshold).

Claim 6 и Claim 12 (Зависимые): Определяют критически важные критерии для финальной валидации Кандидата.

Критерии включают одно или несколько из следующих условий:

  • Reference Query был получен от того же пользователя в течение определенного времени до или после Кандидата (подтверждение связи в сессии).
  • Кандидат не связан с Appropriate sensitive content (исключение ложных срабатываний на приемлемый контент, например, новости).
  • Кандидат был получен от этого пользователя только один раз в течение календарного дня (исключение привычного или повторяющегося поведения).

Где и как применяется

Изобретение связано с этапами Понимания Запросов и Фильтрации (Переранжирования).

QUNDERSTANDING – Понимание Запросов

Основная часть патента описывает офлайн-процесс, который является частью глобального понимания пространства запросов:

  1. Сбор данных: Система собирает и анализирует логи поисковых сессий.
  2. Обучение классификатора: Генерируются обучающие данные (Training Data) по описанному методу (анализ co-search behavior), и на их основе тренируется Classifier.
  3. Применение классификатора: В реальном времени обученный классификатор используется для оценки входящих запросов и определения интента, связанного с поиском неприемлемого контента.

RERANKING – Переранжирование (Фильтрация)

На финальном этапе формирования выдачи система использует результаты работы классификатора для модерации (например, через Twiddlers типа SafeSearch).

  1. Если запрос классифицирован как направленный на поиск Inappropriate content.
  2. Система может проверить настройки пользователя (User Preference/Behavior).
  3. Происходит модификация результатов поиска: удаление неприемлемого контента из выдачи или значительное понижение ранжирования соответствующих ресурсов (Claim 14).

Входные данные (для офлайн-процесса):

  • Логи поисковых сессий (Query Logs).
  • Наборы начальных терминов (Seed Terms) или существующие Reference Queries.

Выходные данные (офлайн-процесса):

  • Расширенный набор обучающих данных (Training Data) для классификатора.

На что влияет

  • Специфические запросы и тематики: Влияет исключительно на запросы, связанные с крайне чувствительными, оскорбительными или незаконными темами (насилие, CSAM, терроризм). Не оказывает влияния на стандартные коммерческие (ecommerce) или информационные ниши. Патент направлен на обеспечение безопасности и модерацию контента.

Когда применяется

  • Офлайн-процесс (Обучение): Применяется периодически или постоянно при анализе поисковых логов для обновления и улучшения классификатора.
  • Онлайн-процесс (Использование классификатора): Применяется при обработке каждого поискового запроса для его оценки.
  • Триггеры активации (Модификация выдачи): Активируется, когда классификатор помечает запрос как неприемлемый, и когда настройки пользователя требуют фильтрации (или когда контент является незаконным и фильтруется принудительно).

Пошаговый алгоритм

Фаза 1: Генерация Референсных Запросов (Офлайн)

  1. Сбор начальных данных: Получение первого набора Seed Terms (например, общая тема) и второго набора Seed Terms (например, неприемлемый аспект).
  2. Идентификация комбинаций: Поиск в логах запросов, которые содержат комбинацию терминов из обоих наборов.
  3. Фильтрация и Верификация: Отбор запросов по частотности и проверка (автоматическая или ручная) их связи с неприемлемым контентом.
  4. Формирование базы: Классификация подтвержденных запросов как Reference Queries.

Фаза 2: Идентификация Кандидатов (Офлайн)

  1. Анализ сессий: Анализ логов поиска и идентификация Co-occurring Queries — запросов, введенных тем же пользователем в течение определенного временного окна (например, 2-60 минут) до или после Reference Query.
  2. Расчет метрик: Для каждого Co-occurring Query подсчитывается общее количество его появлений и количество его совместных появлений с любым Reference Query.
  3. Расчет Co-occurrence Value: Вычисление значения совместной встречаемости.
  4. Сравнение с порогом: Сравнение Co-occurrence Value с установленным порогом (Co-occurrence Threshold). Если значение выше порога, запрос классифицируется как Candidate Query.

Фаза 3: Фильтрация и Маркировка (Офлайн)

  1. Применение поведенческих критериев: Проверка Candidate Query:
    • Подтверждение, что Reference Query был введен тем же пользователем в рамках временного окна.
    • Проверка, не вводил ли пользователь этот Candidate Query ранее в тот же календарный день (фильтр повторов).
  2. Применение контентных критериев: Проверка, не связан ли Candidate Query с Appropriate sensitive content (например, новости, исследования).
  3. Маркировка и Подготовка данных: Если все критерии удовлетворены, Candidate Query маркируется как "вероятно связанный с неприемлемым контентом" и добавляется в Training Data. (Опционально: генерация вариантов написания, опечаток для расширения данных - Claim 19).

Фаза 4: Применение Классификатора (Онлайн)

  1. Получение и Классификация запроса: Поисковая система получает запрос и оценивает его обученным классификатором.
  2. Проверка условий: Если запрос классифицирован как неприемлемый, система определяет предпочтения пользователя (например, включены ли фильтры).
  3. Модификация выдачи: Предоставление модифицированных результатов поиска (удаление ссылок или понижение их ранжирования).

Какие данные и как использует

Данные на входе

  • Поведенческие факторы: Являются основой изобретения. Используются логи поисковых сессий (Query Logs), временные метки запросов, идентификаторы пользователей (для связывания запросов в сессию). Анализируется последовательность и временная близость запросов (co-search behavior), а также частота запросов в течение дня.
  • Контентные факторы: Используются начальные термины (Seed Terms) для генерации стартового набора Reference Queries. Также используются данные для классификации контента как Appropriate или Inappropriate.
  • Пользовательские факторы: Настройки фильтрации контента пользователя (User Preference/Behavior, например, SafeSearch) используются на этапе применения классификатора для принятия решения о модификации выдачи.

Какие метрики используются и как они считаются

  • Co-occurrence Value: Ключевая метрика. Рассчитывается для каждого запроса на основе двух показателей: (i) общее количество вхождений запроса в логи; (ii) количество вхождений запроса, когда он соседствует с Reference Query. Метрика обычно нормализована, например, как отношение (ii)/(i). Co-occurrence Value≈Число совместных вхождений с Reference QueriesОбщее число вхождений запроса\text{Co-occurrence Value} \approx \frac{\text{Число совместных вхождений с Reference Queries}}{\text{Общее число вхождений запроса}}Co-occurrence Value≈Общее число вхождений запросаЧисло совместных вхождений с Reference Queries​
  • Пороги частотности (Particular Threshold): Используются для отсева слишком редких запросов (Claim 9).
  • Временные пороги (Determined Time Period): Определяют максимальное время между запросами для того, чтобы они считались совместно встречающимися (окно сессии).
  • Co-occurrence Threshold: Пороговое значение для Co-occurrence Value, необходимое для того, чтобы запрос стал Кандидатом.

Выводы

Патент описывает внутренние процессы Google, направленные на модерацию контента и обеспечение безопасности поиска, без прямых рекомендаций для SEO. Он дает следующее понимание работы системы:

  1. Инфраструктура безопасности, а не ранжирования: Это не алгоритм ранжирования общего веб-поиска, а система для обучения классификаторов, используемых в модерации выдачи (например, SafeSearch).
  2. Анализ сессий как метод классификации: Ключевым механизмом является использование анализа поисковых сессий (co-search behavior). Система исходит из предположения, что запросы, часто вводимые незадолго до или после известных "плохих" запросов, также, вероятно, являются "плохими".
  3. Многоступенчатая фильтрация для точности: Для минимизации ложных срабатываний используется сложная логика: расчет Co-occurrence Value, сравнение с порогами и применение специфических поведенческих критериев (например, фильтр запросов, повторяющихся в течение дня - Claim 6).
  4. Различение контекста чувствительного контента: Система явно разделяет Inappropriate (неприемлемый) и Appropriate (приемлемый) чувствительный контент. Это указывает на попытку Google различать контекст, например, между новостями о насилии и поиском инструкций к насилию.
  5. Автоматизация и масштабирование: Цель патента — автоматизировать процесс выявления новых способов поиска неприемлемого контента, минимизируя ручной труд.

Практика

Патент является инфраструктурным и фокусируется на безопасности контента. Он не дает практических выводов для SEO-продвижения большинства стандартных сайтов.

Best practices (это мы делаем)

  • Четкое позиционирование контента (для специфических ниш): Если сайт работает в нишах, которые могут касаться чувствительных тем (новости, история, психология, медицина), крайне важно убедиться, что контент представлен в образовательном, документальном или новостном контексте. Это поможет системам классифицировать его как Appropriate sensitive content, а не Inappropriate.
  • Понимание анализа сессий: SEO-специалисты должны понимать, что Google анализирует поведение пользователей в рамках сессий (co-search behavior) для классификации запросов. Этот общий принцип используется не только для безопасности, но и для лучшего понимания интента в общем поиске, что подтверждает важность оптимизации под задачи пользователя (user journey).

Worst practices (это делать не надо)

  • Создание пограничного контента: Создание контента, который граничит с запрещенными или крайне неприемлемыми темами (насилие, CSAM, терроризм, hate speech). Этот патент описывает механизмы, которые Google использует для активного обнаружения запросов, ведущих к такому контенту, и его последующего подавления в выдаче.
  • Оптимизация под "Inappropriate" запросы: Попытки ранжироваться по запросам, которые могут быть классифицированы как Inappropriate. Система будет активно модифицировать выдачу (понижать или удалять результаты), даже если пользователь явно ищет такой контент (если это не запрещено законом).

Стратегическое значение

Патент подтверждает высокую степень развития технологий Google в анализе поведения пользователей на уровне сессий. Способность использовать контекст соседних запросов (co-search behavior) для классификации текущего запроса является мощным инструментом. Хотя в данном патенте он применяется для обеспечения безопасности, аналогичные механизмы анализа сессий используются и в общем поиске для уточнения намерений пользователя и улучшения релевантности.

Практические примеры

Практических примеров для применения в SEO нет, так как патент направлен на фильтрацию и подавление контента, а не на его продвижение или оптимизацию.

Вопросы и ответы

Влияет ли этот патент на ранжирование моего интернет-магазина или информационного блога?

Нет, напрямую не влияет. Этот патент описывает не алгоритмы ранжирования, а систему для обучения классификатора, который выявляет запросы о крайне неприемлемом или незаконном контенте (насилие, терроризм, CSAM). Он относится к инфраструктуре безопасности и модерации контента (например, SafeSearch).

Что такое "Co-search behavior" и как Google его использует?

Co-search behavior (поведение совместного поиска) — это анализ последовательности запросов, которые пользователь вводит в течение короткого периода времени (сессии). В контексте этого патента Google использует его для выявления новых "плохих" запросов. Если неизвестный запрос часто вводят сразу после или до известного "плохого" запроса, система помечает его как подозрительный.

Что считается "неприемлемым чувствительным контентом" (Inappropriate sensitive content) согласно патенту?

Патент приводит конкретные примеры: детская порнография (CSAM), сцены жестокости и насилия (gore scenes and images), контент для вербовки террористов или банд (terrorist or gang recruitment content). Это контент, доступ к которому Google стремится ограничить или полностью заблокировать.

Как система отличает новостной запрос о трагедии от запроса о том, как ее совершить?

Патент вводит разделение на Appropriate (приемлемый) и Inappropriate (неприемлемый) контент. Для отделения одного от другого используются специальные фильтры (Claim 6 и 12). Например, если запрос связан с новостями или исследованиями, он может быть помечен как Appropriate, даже если тема чувствительная, и исключен из обучающих данных для "плохого" классификатора.

Используется ли анализ поисковых сессий только для фильтрации плохого контента?

Нет. Анализ поисковых сессий (co-search behavior) — это общий метод в Information Retrieval. Хотя в этом патенте он используется для безопасности, Google также использует анализ сессий в общем поиске для лучшего понимания контекста, уточнения намерения пользователя и улучшения релевантности.

Что такое "Co-occurrence Value"?

Это метрика, которая показывает, насколько сильно запрос связан с неприемлемым контентом. Она рассчитывается как отношение: насколько часто запрос X встречается рядом с известными "плохими" запросами (Reference Queries) по сравнению с тем, насколько часто запрос X встречается всего. Чем выше значение, тем сильнее связь.

Какие поведенческие фильтры использует система, чтобы избежать ложных срабатываний?

Система применяет несколько критериев. Например, она проверяет, вводил ли пользователь этот же запрос ранее в тот же день (Claim 6 и 12). Если да, то запрос, скорее всего, не связан с поиском неприемлемого контента в данной конкретной сессии (возможно, это привычный запрос), и он исключается из анализа.

Может ли мой сайт быть пессимизирован из-за этого алгоритма?

Только если ваш сайт содержит контент, который классифицируется как Inappropriate sensitive or offensive content. Если классификатор определит, что запрос пользователя направлен на поиск такого контента, система модифицирует выдачу и может понизить или удалить ваш ресурс из результатов поиска (Claim 13, 14).

Как этот патент связан с SafeSearch?

Этот патент описывает механизм для обучения классификатора, который, вероятно, используется системами типа SafeSearch. Классификатор определяет, является ли запрос "чувствительным" или "неприемлемым". Затем SafeSearch, в зависимости от настроек пользователя (User Preference/Behavior), принимает решение о фильтрации результатов.

Зачем SEO-специалисту знать об этом патенте, если он не влияет на ранжирование?

Знание этого патента полезно для глубокого понимания того, как работают компоненты поисковой системы. Он демонстрирует продвинутые методы анализа поведения пользователей в сессиях для классификации запросов. Понимание этих механизмов помогает лучше понять общие принципы работы Google с интентом пользователя.

Похожие патенты

Как Google использует совместное посещение сайтов в рамках одной сессии (Co-visitation) для классификации ресурсов по темам
Google анализирует, какие ресурсы пользователи посещают в рамках одной сессии (поисковой или браузерной). Если пользователь посещает известный ресурс по теме А, а затем в той же сессии посещает новый ресурс Б (даже в ответ на другой запрос), система предполагает, что ресурс Б также связан с темой А. Этот механизм позволяет автоматически классифицировать контент на основе реального поведения пользователей.
  • US20140108376A1
  • 2014-04-17
  • Семантика и интент

  • Поведенческие сигналы

Как Google использует классификаторы запросов и контента для фильтрации и понижения оскорбительных результатов, связанных с защищенными группами
Google применяет систему двойной классификации для защиты пользователей от неуместного или оскорбительного контента. Система оценивает, относится ли запрос к «защищенной группе людей» и содержит ли он деликатные термины. Параллельно анализируется, содержат ли результаты поиска оскорбительный контент. На основе комбинации этих классификаций и анализа сессии пользователя результаты могут быть отфильтрованы или понижены в ранжировании.
  • US10083237B2
  • 2018-09-25
  • Безопасный поиск

  • Семантика и интент

  • SERP

Как Google использует машинное обучение для обнаружения и удаления "revenge porn" и другого неконсенсусного контента из поиска
Google использует систему для борьбы с лично нежелательным контентом (например, «revenge porn»). Система применяет два классификатора: один определяет, является ли контент нежелательным (например, порнографическим), а второй — является ли он любительским. Если контент одновременно нежелательный и любительский, он удаляется из выдачи. Система также проактивно анализирует запросы с низкой популярностью для выявления нового такого контента.
  • US10795926B1
  • 2020-10-06
  • Безопасный поиск

  • SERP

  • Семантика и интент

Как Google использует поведенческие сигналы и совместные просмотры для генерации рекомендаций контента (например, "Похожие видео" на YouTube)
Google использует механизм коллаборативной фильтрации для определения связанности контента, анализируя логи взаимодействия пользователей. Система определяет, какой контент пользователи потребляют совместно в рамках одной сессии ("locality of time"). Учитываются только "позитивные взаимодействия" (например, длительный просмотр, высокая оценка). Это позволяет формировать рекомендации на основе реального поведения аудитории, а не только метаданных.
  • US8055655B1
  • 2011-11-08
  • Поведенческие сигналы

  • Персонализация

Как Google комбинирует визуальное сходство и поведение пользователей для переранжирования поиска по картинкам
Google использует механизм для перекрестной проверки релевантности изображений, объединяя поведенческие сигналы (клики) с визуальным анализом. Если изображение часто кликают и оно визуально похоже на другие релевантные изображения по запросу (совместная релевантность), его рейтинг агрессивно повышается. Если оно редко кликается и визуально отличается (совместная нерелевантность), его рейтинг понижается. Это защищает выдачу от кликбейта.
  • US8209330B1
  • 2012-06-26
  • Поведенческие сигналы

  • SERP

  • Мультимедиа

Популярные патенты

Как Google понижает в выдаче результаты, которые пользователь уже видел или проигнорировал в рамках одной поисковой сессии
Google использует механизм для улучшения пользовательского опыта во время длительных поисковых сессий. Если пользователь вводит несколько связанных запросов подряд, система идентифицирует результаты, которые уже появлялись в ответ на предыдущие запросы. Эти повторяющиеся результаты понижаются в ранжировании для текущего запроса, чтобы освободить место для новых, потенциально более полезных страниц. Понижение контролируется порогом релевантности, чтобы не скрывать важный контент.
  • US8051076B1
  • 2011-11-01
  • SERP

  • Поведенческие сигналы

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

Как Google использует распределение кликов по разным типам запросов для оценки общего качества сайта (Website Quality Score)
Google оценивает качество сайта не по общему CTR, а по тому, в ответ на какие запросы он получает клики. Система сегментирует пользовательский фидбек (клики, CTR) по различным параметрам запроса (например, конкурентность, длина, популярность). Сайт считается качественным, если он получает много кликов в ответ на высококонкурентные и популярные запросы, а не только на низкочастотные или нечеткие.
  • US8615514B1
  • 2013-12-24
  • Поведенческие сигналы

Как Google предсказывает намерения пользователя и выполняет поиск до ввода запроса (Predictive Search)
Google использует механизм для прогнозирования тем, интересующих пользователя в конкретный момент времени, основываясь на его истории и контексте. При обнаружении сигнала о намерении начать поиск (например, открытие страницы поиска), система проактивно выполняет запрос по предсказанной теме и мгновенно показывает результаты или перенаправляет пользователя на релевантный ресурс.
  • US8510285B1
  • 2013-08-13
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google использует данные о поведении пользователей для генерации и ранжирования Sitelinks (Дополнительных ссылок сайта)
Патент описывает механизм генерации Sitelinks (дополнительных ссылок под основным результатом поиска). Google анализирует логи доступа пользователей (частоту кликов, время на странице) и другие факторы качества, чтобы определить наиболее важные внутренние страницы сайта. Эти страницы затем отображаются в виде ранжированного списка для ускорения навигации пользователя.
  • US7996391B2
  • 2011-08-09
  • Ссылки

  • Поведенческие сигналы

  • SERP

Как Google в Autocomplete динамически выбирает между показом общих категорий и конкретных подсказок в зависимости от «завершенности запроса»
Google анализирует «меру завершенности запроса» (Measure of Query Completeness) по мере ввода текста пользователем. Если намерение неясно и существует много вариантов продолжения (низкая завершенность, высокая энтропия), система предлагает общие категории (например, «Регионы», «Бизнесы»). Если намерение становится ясным (высокая завершенность, низкая энтропия), система переключается на конкретные подсказки или сущности.
  • US9275147B2
  • 2016-03-01
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google фильтрует персонализированные предложения запросов на основе контента просматриваемой страницы
Google использует механизм для генерации предложений следующего запроса после того, как пользователь покинул страницу выдачи. Система создает кандидатов на основе истории поиска пользователя, а затем фильтрует их, проверяя релевантность контенту страницы, которую пользователь просматривает в данный момент. Это гарантирует, что предложения соответствуют как интересам пользователя, так и текущему контексту просмотра.
  • US8392435B1
  • 2013-03-05
  • Персонализация

  • Поведенческие сигналы

  • SERP

Как Google использует клики пользователей в Поиске по Картинкам для определения реального содержания изображений
Google использует данные о поведении пользователей для автоматической идентификации содержания изображений. Если пользователи вводят определенный запрос (Идею) и массово кликают на конкретное изображение в результатах поиска, система ассоциирует это изображение с Концептом, производным от запроса. Это позволяет Google понимать, что изображено на картинке, не полагаясь исключительно на метаданные или сложный визуальный анализ, и улучшает релевантность ранжирования в Image Search.
  • US8065611B1
  • 2011-11-22
  • Поведенческие сигналы

  • Семантика и интент

  • Мультимедиа

Как Google рассчитывает оценку авторитетности сайта, используя соотношение Независимых Ссылок и Брендовых Запросов
Google рассчитывает метрику авторитетности для веб-сайтов на основе соотношения количества независимых входящих ссылок к количеству брендовых (референсных) запросов. Сайты, имеющие много независимых ссылок относительно их поисковой популярности, получают преимущество. Напротив, популярные сайты с недостаточным количеством внешних ссылок могут быть понижены в ранжировании по общим запросам.
  • US8682892B1
  • 2014-03-25
  • Ссылки

  • EEAT и качество

  • SERP

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

seohardcore