SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google фильтрует поисковые подсказки (Autocomplete) на основе оценок безопасности контента в результатах поиска

METHODS, SYSTEMS, AND MEDIA FOR PROVIDING SEARCH SUGGESTIONS BASED ON CONTENT RATINGS OF SEARCH RESULTS (Методы, системы и средства для предоставления поисковых подсказок на основе рейтингов контента результатов поиска)
  • US10169488B2
  • Google LLC
  • 2015-02-20
  • 2019-01-01
  • Безопасный поиск
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует рейтинги безопасности (например, возрастные ограничения) контента в результатах поиска для популярных запросов. Если выдача по запросу содержит недостаточное количество "безопасного" контента (ниже установленного порога), этот запрос добавляется в список запрещенных и не показывается в качестве поисковой подсказки (Autocomplete) пользователям с включенными фильтрами безопасности.

Описание

Какую проблему решает

Патент решает задачу предотвращения показа нежелательных или неприемлемых поисковых подсказок (Autocomplete) пользователям, у которых активированы фильтры безопасности (например, SafeSearch или родительский контроль), особенно детям. Цель — исключить подсказки, которые могут вести к взрослому или иному нежелательному контенту (mature content).

Что запатентовано

Запатентована система и метод фильтрации кандидатов в поисковые подсказки. Ключевая особенность заключается в том, что фильтрация основана не на тексте самого запроса, а на анализе рейтингов контента (Content Ratings) в результатах поиска, которые этот запрос возвращает. Система заранее генерирует список запрещенных запросов (Disallowed List), если выдача по ним не удовлетворяет установленным критериям безопасности.

Как это работает

Система функционирует в двух режимах:

  • Офлайн (Генерация списка): Анализируются логи ранее выполненных запросов (Previously Submitted Search Queries). Для каждого запроса оцениваются Top N результатов и подсчитывается количество результатов с определенным Content Rating (например, "безопасно для всех возрастов"). Если это количество не достигает порогового значения (Threshold Value), запрос добавляется в список запрещенных.
  • Онлайн (Фильтрация подсказок): Когда пользователь вводит частичный запрос (Partial Search Query), система генерации подсказок (Suggestion Completion Server) определяет кандидатов. Эти кандидаты проверяются по списку запрещенных (с помощью Safety Score Server). Запрещенные подсказки удаляются, и пользователю показывается только отфильтрованный набор.

Актуальность для SEO

Высокая. Механизмы безопасного поиска, родительского контроля и фильтрации контента (особенно на платформах типа YouTube и в общем поиске) являются критически важными компонентами продуктов Google. Этот патент описывает конкретный механизм обеспечения качества и безопасности поисковых подсказок в реальном времени.

Важность для SEO

Патент имеет умеренно высокое значение для SEO (6.5/10). Он не влияет на алгоритмы ранжирования результатов поиска, но напрямую определяет видимость запросов в Autocomplete. Поскольку подсказки формируют значительную часть поискового трафика, исключение запросов, классифицированных как "небезопасные", может снизить охват аудитории (особенно пользователей с включенными фильтрами) на этапе формирования запроса.

Детальный разбор

Термины и определения

Candidate Search Suggestion (Кандидат в поисковые подсказки)
Запрос, который система предсказывает как вероятное завершение частичного запроса, введенного пользователем.
Content Rating (Рейтинг контента)
Метка или оценка, присвоенная результату поиска (документу, видео), указывающая на характер контента. Например, возрастные ограничения (suitable for all ages, suitable for adults), наличие сцен насилия, ненормативной лексики и т.д.
Disallowed List / Prohibited List (Список запрещенных подсказок)
Список запросов, которые не должны показываться в качестве подсказок. Генерируется на основе анализа Content Ratings в результатах поиска.
Partial Search Query (Частичный поисковый запрос)
Один или несколько символов, введенных пользователем в строку поиска.
Previously Submitted Search Queries (Ранее отправленные поисковые запросы)
Логи запросов, используемые для офлайн-анализа и генерации списка запрещенных подсказок.
Safety Score (Оценка безопасности)
Метрика, связанная с запросом, часто основанная на количестве результатов поиска с определенным Content Rating. Используется для определения, следует ли добавить запрос в Disallowed List.
Safety Score Server (Сервер оценки безопасности)
Компонент системы, ответственный за генерацию, хранение и предоставление данных о безопасности запросов (списков или оценок).
Suggestion Completion Server (Сервер завершения подсказок)
Компонент системы (Autocomplete), который генерирует кандидатов в подсказки и выполняет их фильтрацию.
Threshold Value (Пороговое значение)
Критерий для определения безопасности запроса. Например, минимальное количество или процент "безопасных" результатов в Top N выдачи, необходимое для показа подсказки.

Ключевые утверждения (Анализ Claims)

Claim 1 (Независимый пункт): Описывает основной метод предоставления и фильтрации поисковых подсказок.

  1. Система получает частичный запрос (Partial Search Query) от пользовательского устройства.
  2. Идентифицируется группа кандидатов в подсказки (Candidate Search Suggestions).
  3. Проверяется, включен ли каждый кандидат в список запрещенных подсказок (Disallowed List).
  4. Описывается механизм генерации этого списка (ядро изобретения):
    • Анализ ранее выполненных запросов (полученных от других устройств) и их результатов поиска.
    • Для каждого запроса определяется количество результатов с определенным Content Rating (указывающим рекомендуемый возраст).
    • Проверяется, достигает ли это количество порогового значения (Threshold Value).
    • Если порог НЕ достигнут (т.е. безопасных результатов слишком мало), запрос добавляется в Disallowed List.
  5. Генерируется модифицированная группа подсказок путем удаления тех, что находятся в Disallowed List.
  6. Модифицированная группа предоставляется пользователю.

Claim 3 и 4 (Зависимые): Уточняют процесс после фильтрации.

Модифицированная (отфильтрованная) группа подсказок ранжируется. Подмножество для показа выбирается на основе этого ранжирования. Ранжирование может выполняться на основе релевантности результатов поиска, связанных с подсказкой, для определенной демографической группы (например, детей определенного возраста).

Claim 5 (Зависимый): Детализирует процесс генерации Disallowed List в отношении похожих запросов.

Система определяет похожие запросы (например, с опечатками или синонимами) в логах. Для этой группы рассчитывается среднее (averaging) количество результатов с нужным Content Rating. Если это среднее значение не достигает порога, вся группа похожих запросов добавляется в Disallowed List.

Claim 6 (Зависимый): Описывает использование дополнительных списков блокировки.

Система также проверяет кандидатов по второму списку запрещенных подсказок, который связан с учетной записью пользователя (например, ручные настройки родительского контроля).

Claim 7 (Зависимый): Уточняет хранение данных.

Система сохраняет количество результатов с определенным Content Rating и производную оценку безопасности (Safety Score) в ассоциации с каждым запросом в списке.

Где и как применяется

Изобретение применяется на этапе взаимодействия пользователя с поисковой строкой и требует предварительной обработки данных на этапах индексирования и понимания запросов.

INDEXING – Индексирование и извлечение признаков
На этом этапе система должна проанализировать контент (веб-страницы, видео и т.д.) и присвоить ему соответствующий Content Rating (оценку безопасности, возрастные ограничения). Эти данные сохраняются в индексе.

QUNDERSTANDING – Понимание Запросов
Это основной этап применения патента, включающий два процесса:

  1. Офлайн-анализ: Система периодически анализирует логи запросов (Previously Submitted Search Queries) и использует данные Content Rating из индекса для расчета Safety Scores и генерации Disallowed List. Это происходит на Safety Score Server.
  2. Онлайн-фильтрация (Autocomplete): В момент ввода пользователем Partial Search Query, Suggestion Completion Server генерирует кандидатов и в реальном времени фильтрует их, используя данные от Safety Score Server.

Входные данные (Онлайн):

  • Частичный запрос пользователя.
  • Список кандидатов в подсказки.
  • Disallowed List или Safety Scores.
  • Настройки безопасности пользователя или демографические данные (для определения порога).

Выходные данные (Онлайн):

  • Отфильтрованный и отранжированный список поисковых подсказок.

На что влияет

  • Конкретные типы контента: Наибольшее влияние на мультимедийный контент (видео, изображения, игры), где Content Ratings часто явно определены и критичны.
  • Специфические запросы: Запросы с неоднозначным интентом (dual-intent), которые могут вести как к безопасному, так и к взрослому контенту.
  • Конкретные ниши или тематики: Темы, связанные со здоровьем, развлечениями для взрослых, новостями о происшествиях или шокирующим контентом.

Когда применяется

  • Условия работы: Алгоритм фильтрации активируется в процессе ввода текста в строку поиска, когда система генерирует поисковые подсказки.
  • Триггеры активации: Фильтрация применяется, когда на устройстве или в аккаунте активированы режимы безопасного поиска (SafeSearch), родительского контроля или используются детские аккаунты (например, YouTube Kids).
  • Пороговые значения: Применение фильтра зависит от Threshold Value – минимального количества безопасных результатов в выдаче. Этот порог может быть более строгим для детских аккаунтов.

Пошаговый алгоритм

Процесс А: Онлайн-фильтрация подсказок (в реальном времени)

  1. Получение ввода: Пользовательское устройство получает текст частичного поискового запроса и передает его на Suggestion Completion Server.
  2. Генерация кандидатов: Сервер определяет список кандидатов в поисковые подсказки, соответствующих введенному тексту.
  3. Запрос проверки безопасности: Suggestion Completion Server отправляет список кандидатов на Safety Score Server, запрашивая индикацию допустимости для каждого. Запрос может включать требуемый уровень рейтинга контента.
  4. Определение допустимости: Safety Score Server проверяет наличие кандидатов в Disallowed List или сравнивает их Safety Score с требуемым порогом. Также могут проверяться пользовательские списки блокировки.
  5. Передача индикаций: Safety Score Server возвращает результаты проверки.
  6. Удаление запрещенных кандидатов: Suggestion Completion Server удаляет из списка кандидатов те, которые были помечены как недопустимые.
  7. Ранжирование и выбор: Оставшиеся разрешенные кандидаты ранжируются (например, по популярности или релевантности для демографической группы пользователя). Выбирается подмножество лучших.
  8. Отображение: Подмножество разрешенных кандидатов передается на пользовательское устройство для отображения.

Процесс Б: Офлайн-генерация списка запрещенных запросов

  1. Получение логов: Система получает список ранее выполненных поисковых запросов за определенный период.
  2. Определение результатов поиска: Для каждого запроса определяются Топ N связанных с ним результатов поиска.
  3. Анализ рейтингов контента: Для Топ N результатов подсчитывается количество результатов, имеющих определенный Content Rating (например, "безопасно для всех возрастов").
  4. Агрегация похожих запросов (Опционально): Система идентифицирует похожие запросы (синонимы, опечатки) и усредняет количество безопасных результатов для них.
  5. Сохранение оценки: Количество безопасных результатов (или рассчитанный Safety Score) сохраняется в ассоциации с запросом.
  6. Генерация списка запрещенных запросов: Формируется Disallowed List, в который попадают запросы, у которых количество безопасных результатов ниже установленного Threshold Value.

Какие данные и как использует

Данные на входе

Патент фокусируется на использовании следующих данных для обеспечения безопасности подсказок:

  • Факторы классификации контента (Content Classification Factors): Content Ratings. Предварительно рассчитанные оценки безопасности, возрастные ограничения или классификация контента (взрослый, шокирующий) для результатов поиска. Это ключевые данные для расчета Safety Score.
  • Поведенческие факторы: Журналы запросов (Previously Submitted Search Queries). Используются в офлайн-процессе для определения популярных запросов и анализа состава их выдачи.
  • Пользовательские факторы: Данные учетной записи пользователя. Используются для применения персональных списков блокировки (родительский контроль) и для ранжирования подсказок с учетом демографии.

Какие метрики используются и как они считаются

  • Количество безопасных результатов (Number of safe results): Прямой подсчет количества результатов в Top N выдачи, которые имеют определенный Content Rating (например, "suitable for all ages").
  • Safety Score (Оценка безопасности): Метрика, рассчитываемая на основе количества безопасных результатов. Может быть выражена в виде процента или нормализованной оценки.
  • Threshold Value (Пороговое значение): Заранее определенное минимальное значение Safety Score или количества безопасных результатов. Если метрика запроса ниже порога, он блокируется.
  • Агрегированная оценка безопасности (Averaged Score): Усредненное количество безопасных результатов для группы похожих запросов (синонимов, запросов с опечатками).

Выводы

  1. Фильтрация подсказок основана на анализе SERP: Google определяет безопасность поисковой подсказки (запроса) не по ключевым словам в ней, а по тому, какой контент находится в результатах поиска по этому запросу. Если выдача преимущественно "небезопасна", подсказка блокируется.
  2. Критичность классификации контента (Content Rating): То, как Google классифицирует контент сайта (безопасный, взрослый, шокирующий), напрямую влияет на видимость связанных запросов в Autocomplete.
  3. Автоматизированный и пороговый механизм: Генерация Disallowed List происходит автоматически (офлайн) путем сравнения количества безопасных результатов с пороговым значением (Threshold Value).
  4. Обработка вариативности запросов: Система агрегирует данные о безопасности для похожих запросов (синонимы, опечатки). Если средняя безопасность группы низкая, блокируется вся группа.
  5. Ранжирование безопасных подсказок учитывает демографию: После фильтрации оставшиеся подсказки ранжируются. Патент упоминает возможность ранжирования на основе релевантности для конкретной демографической группы (например, детей).
  6. Многоуровневая фильтрация: Помимо автоматической фильтрации на основе контента, система поддерживает дополнительные уровни, такие как персональные настройки пользователя (родительский контроль).

Практика

Best practices (это мы делаем)

  • Обеспечение корректной классификации контента: Для сайтов, ориентированных на широкую или детскую аудиторию, критически важно, чтобы контент классифицировался Google как безопасный. Это увеличивает вероятность того, что релевантные запросы останутся в Autocomplete при включенных фильтрах. Используйте соответствующие метаданные и следите за чистотой контента.
  • Мониторинг выдачи в режиме SafeSearch: Анализируйте видимость ваших ключевых запросов в Autocomplete при включенном SafeSearch. Исчезновение запроса может указывать на то, что Google считает выдачу по нему недостаточно безопасной.
  • Сегментация контента: Если на сайте есть как безопасный, так и взрослый контент, убедитесь, что они четко разделены (например, по разделам или поддоменам). Это поможет избежать негативного влияния "взрослых" страниц на классификацию безопасного контента и видимость связанных с ним запросов в подсказках.
  • Анализ безопасности SERP по целевым запросам: Оценивайте качество и безопасность сайтов-конкурентов в Топ N. Если в выдаче много сомнительного контента, это повышает риск попадания запроса в Disallowed List, даже если ваш собственный сайт полностью безопасен.

Worst practices (это делать не надо)

  • Игнорирование сигналов безопасности контента: Размещение рекламы для взрослых, использование ненормативной лексики или шокирующих изображений на страницах, предназначенных для широкой аудитории. Это может привести к присвоению нежелательного Content Rating и последующему исключению связанных запросов из Autocomplete.
  • Создание контента "на грани": Попытки привлечь трафик с помощью кликбейтных заголовков или контента на сенситивные темы, которые могут быть классифицированы как небезопасные. Это ставит под угрозу видимость в подсказках для значительной части аудитории.
  • Манипуляция Content Ratings: Попытки указать неверный (более мягкий) возрастной рейтинг для контента с целью обойти фильтры. Google использует автоматические классификаторы, и несоответствие может привести к пессимизации.

Стратегическое значение

Патент демонстрирует, что системы классификации контента Google влияют не только на ранжирование, но и на взаимодействие с пользователем на самых ранних этапах поиска (Autocomplete). Content Rating и Safety Score являются факторами, влияющими на охват аудитории. Для SEO-стратегии это подчеркивает важность управления репутацией сайта как безопасного источника, особенно для брендов и медиа, ориентированных на широкую аудиторию.

Практические примеры

Сценарий: Фильтрация подсказок для YouTube или Поиска по Видео

  1. Офлайн-анализ (Запрос А): Google анализирует запрос "смешные падения". В Топ-20 результатов 18 видео классифицированы как "Безопасные", а 2 имеют ограничения из-за потенциально опасных сцен.
  2. Расчет Safety Score (Запрос А): 90% результатов безопасны. Это выше порога (например, 70%). Запрос считается допустимым.
  3. Офлайн-анализ (Запрос Б): Анализируется запрос "жесткие розыгрыши". В Топ-20 только 5 видео классифицированы как "Безопасные", остальные имеют ограничения по возрасту.
  4. Расчет Safety Score (Запрос Б): Только 25% безопасны. Это ниже порога. Запрос "жесткие розыгрыши" добавляется в Disallowed List.
  5. Онлайн-взаимодействие: Пользователь с активным SafeSearch (или ребенок на YouTube Kids) вводит "жесткие".
  6. Фильтрация: Система генерирует кандидата "жесткие розыгрыши", но Safety Score Server блокирует его, так как он в Disallowed List.
  7. Результат: Подсказка "жесткие розыгрыши" не отображается этому пользователю.

Вопросы и ответы

Влияет ли этот патент на ранжирование в основном поиске?

Нет, напрямую не влияет. Патент описывает исключительно механизм фильтрации поисковых подсказок (Autocomplete). Однако он использует данные о рейтингах контента (Content Ratings) результатов поиска. Эти же рейтинги используются другими системами (например, SafeSearch) для фильтрации самой выдачи, но в данном патенте рассматривается только этап генерации подсказок.

Как Google определяет Content Rating для веб-страницы или видео?

Патент не детализирует механизм присвоения рейтинга, но указывает, что он основан на анализе контента и может соответствовать стандартным системам возрастных рейтингов. На практике Google использует автоматические классификаторы для обнаружения взрослого контента, насилия, ненормативной лексики, а также может учитывать метаданные и структурированные данные, предоставленные владельцем сайта или автором видео.

Что такое Threshold Value (Пороговое значение) и как он определяется?

Threshold Value — это минимальное количество "безопасных" результатов, которое должно присутствовать в выдаче (Top N), чтобы запрос считался допустимым для показа в подсказках. Патент не указывает конкретных цифр (приводя примеры типа 30% или 50%). Это значение может динамически настраиваться в зависимости от строгости фильтра (например, для детских аккаунтов порог будет значительно выше).

Мой сайт безопасен, но релевантный запрос пропал из Autocomplete. Почему?

Механизм, описанный в патенте, оценивает безопасность всей выдачи (Top N), а не только вашего сайта. Если большинство других сайтов в выдаче по этому запросу классифицированы Google как небезопасные, общий Safety Score запроса упадет ниже порога, и запрос будет добавлен в Disallowed List.

Как система обрабатывает новые или редкие запросы?

Патент фокусируется на анализе Previously Submitted Search Queries (логов уже выполненных запросов). Новые или очень редкие запросы могут не иметь заранее рассчитанного Safety Score. В таких случаях, вероятно, применяются другие механизмы фильтрации (например, основанные на стоп-словах или ручных списках), которые также упоминаются в патенте как дополнительные методы.

Учитывает ли система синонимы и опечатки при блокировке подсказок?

Да, патент явно описывает механизм агрегации данных для похожих запросов (Claim 5). Система идентифицирует группу похожих запросов (синонимы, опечатки) и рассчитывает средний показатель безопасности (Averaged Score) для них. Если среднее значение ниже порога, вся группа запросов может быть заблокирована.

Что такое Safety Score Server?

Это специализированный компонент инфраструктуры, который отвечает за офлайн-анализ логов запросов, расчет оценок безопасности (Safety Scores) и хранение Disallowed List. Он позволяет серверу Autocomplete (Suggestion Completion Server) быстро проверить безопасность кандидатов в реальном времени без необходимости анализировать результаты поиска на лету.

Могу ли я повлиять на Safety Score моих целевых запросов?

Да, косвенно. Улучшая качество и безопасность вашего собственного контента и добиваясь высоких позиций в Топ N, вы способствуете повышению общего Safety Score запросов, по которым вы ранжируетесь. Ваш безопасный контент увеличивает долю безопасных результатов в выдаче.

Применяется ли этот механизм только для детских аккаунтов?

Хотя в патенте в качестве основной мотивации упоминается защита детей, описанный механизм может применяться для любых пользователей, у которых активированы фильтры безопасности, такие как SafeSearch. Также он используется на платформах с более строгой модерацией контента (например, YouTube Kids).

Как ранжируются подсказки после фильтрации?

После удаления небезопасных кандидатов оставшиеся подсказки ранжируются. Патент упоминает, что ранжирование может основываться на стандартных факторах (например, популярности запроса), а также на релевантности контента для определенной демографической группы (Claim 4). Например, для детского аккаунта предпочтение может отдаваться подсказкам, популярным среди детей.

Похожие патенты

Как Google рассчитывает «Рейтинг безопасности» запроса для фильтрации или блокировки выдачи (SafeSearch)
Google анализирует рейтинги контента (например, «для всех возрастов» или «для взрослых») топовых результатов по запросу, чтобы вычислить его «Safety Score». Если выдача содержит слишком много неприемлемого контента, система может полностью заблокировать запрос или агрессивно отфильтровать результаты, показывая только гарантированно безопасный и релевантный контент.
  • US11829373B2
  • 2023-11-28
  • Безопасный поиск

  • SERP

Как Google выявляет и удаляет подсказки в Autocomplete, которые отвлекают пользователя от его изначальной цели поиска
Google использует механизм для очистки системы автозаполнения (Autocomplete). Система выявляет популярные подсказки, которые развлекают или интересуют пользователей, но не соответствуют их изначальному намерению. Путем экспериментов с временным скрытием этих подсказок Google проверяет, ищут ли пользователи эту информацию самостоятельно. Если нет, подсказка классифицируется как отвлекающая и понижается.
  • US9355191B1
  • 2016-05-31
  • Семантика и интент

Как Google реализует SafeSearch и верификацию возраста путем фильтрации чувствительных запросов и результатов
Google использует систему для обнаружения «фильтрующих терминов» в запросах или результатах поиска. При обнаружении Google немедленно показывает только «отфильтрованные» (безопасные) результаты и предлагает доступ к службе верификации (например, подтверждение возраста). Если пользователь верифицирован, отображаются «нефильтрованные» (потенциально чувствительные) результаты. Это предотвращает полную блокировку выдачи при использовании чувствительных терминов.
  • US8032527B2
  • 2011-10-04
  • Безопасный поиск

Как Google переписывает частичные запросы для улучшения подсказок Autocomplete, если стандартных вариантов недостаточно
Патент описывает механизм работы Google Autocomplete для сложных или редких запросов. Если система не находит достаточно качественных или популярных подсказок для введенного текста, она переписывает частичный запрос. Это включает классификацию терминов на обязательные и опциональные, удаление менее важных слов или замену слов на синонимы. Это позволяет предложить пользователю релевантные и популярные полные запросы, даже если они не идеально соответствуют тому, что было введено изначально.
  • US9235654B1
  • 2016-01-12
  • Семантика и интент

Как Google визуально и аудиально сигнализирует об уверенности в подсказках автозаполнения (Auto-Complete)
Google использует систему для улучшения UX при вводе запроса, рассчитывая вероятность того, что подсказка автозаполнения соответствует намерению пользователя. Если вероятность для лучшей подсказки превышает определенный порог, Google может визуально или аудиально выделить ее (например, подсветкой, гистограммой или звуком), чтобы ускорить выбор пользователя.
  • US8412728B1
  • 2013-04-02
  • Семантика и интент

Популярные патенты

Как Google использует персональное дерево интересов пользователя для определения важности слов в запросе и его переписывания
Google использует иерархический профиль интересов пользователя (Profile Tree), построенный на основе истории поиска и поведения, чтобы определить, какие слова в запросе наиболее важны для конкретного человека. Специфичные интересы (глубокие узлы в дереве) получают больший вес. Это позволяет системе отфильтровать шум в длинных запросах и сгенерировать более точный альтернативный запрос.
  • US8326861B1
  • 2012-12-04
  • Персонализация

  • Семантика и интент

  • Поведенческие сигналы

Как Google планировал использовать цифровые подписи для расчета репутации авторов (Agent Rank) независимо от сайта публикации
Патент Google, описывающий концепцию "Agent Rank". Система предлагает авторам (агентам) использовать цифровые подписи для подтверждения авторства контента. Это позволяет рассчитывать репутационный рейтинг агента, используя алгоритмы, подобные PageRank, на основе того, кто ссылается на их подписанный контент. Этот рейтинг затем используется для влияния на ранжирование, независимо от того, где контент опубликован.
  • US7565358B2
  • 2009-07-21
  • EEAT и качество

  • Ссылки

Как Google предсказывает ваш следующий запрос на основе контента, который вы просматриваете, и истории поиска других пользователей
Google использует систему контекстной информации, которая анализирует контент на экране пользователя (например, статью или веб-страницу) и предсказывает, что пользователь захочет искать дальше. Система не просто ищет ключевые слова на странице, а использует исторические данные о последовательностях запросов (Query Logs). Она определяет, что другие пользователи искали после того, как вводили запросы, связанные с текущим контентом, и предлагает эти последующие запросы в качестве рекомендаций.
  • US20210232659A1
  • 2021-07-29
  • Семантика и интент

  • Поведенческие сигналы

  • Персонализация

Как Google использует исторические данные о кликах по Сущностям для ранжирования нового или редко посещаемого контента
Google решает проблему «холодного старта» для новых страниц, у которых нет собственных поведенческих данных. Система агрегирует историю кликов на уровне Сущностей (Entities). Если сущности, упомянутые на новой странице, исторически имеют высокий CTR по целевому запросу, страница получает бустинг в ранжировании, наследуя поведенческие сигналы через эти сущности.
  • US10303684B1
  • 2019-05-28
  • Поведенческие сигналы

  • Семантика и интент

  • SERP

Как Google использует обучение с подкреплением (Reinforcement Learning) для оптимизации ранжирования и переписывания запросов на основе успешности поисковых сессий
Google использует систему Reinforcement Learning для динамической адаптации поисковых процессов. Система анализирует поисковые сессии (последовательности запросов и кликов) и учится оптимизировать выдачу, чтобы пользователь быстрее находил нужный результат. Это достигается путем корректировки весов факторов ранжирования, переписывания запросов или даже обновления индекса на лету для конкретных ситуаций.
  • US11157488B2
  • 2021-10-26
  • Индексация

  • Поведенческие сигналы

  • Семантика и интент

Как Google использует данные сессий и разнообразие результатов для генерации блока "Связанные запросы"
Google анализирует поисковые сессии пользователей, чтобы найти запросы, которые часто следуют за одним и тем же предшествующим запросом (родственные запросы). Затем система фильтрует эти потенциальные "Связанные запросы", чтобы убедиться, что они предлагают разнообразные результаты по сравнению с исходным запросом и другими предложениями, помогая пользователям исследовать смежные, но отличные темы.
  • US8244749B1
  • 2012-08-14
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google определяет интент запроса, анализируя классификацию контента, который кликают пользователи
Google использует данные о поведении пользователей для классификации запросов. Система определяет, какой контент пользователи считают наиболее релевантным для запроса (на основе кликов и времени пребывания). Затем она анализирует классификацию этого контента (например, «продукт», «новости», «взрослый контент») и присваивает доминирующую классификацию самому запросу. Это позволяет уточнить интент и скорректировать ранжирование.
  • US8838587B1
  • 2014-09-16
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google использует контекст пользователя для предложения запросов до начала ввода текста (Zero-Input Queries)
Google анализирует историю поисковых запросов, группируя их в «контекстные кластеры» на основе схожести темы и обстоятельств ввода (время, местоположение, интересы). Когда пользователь открывает строку поиска, система оценивает его текущий контекст и мгновенно предлагает релевантные категории запросов (например, «Кино» или «Рестораны»), предсказывая намерение еще до ввода символов.
  • US10146829B2
  • 2018-12-04
  • Семантика и интент

  • Персонализация

  • Поведенческие сигналы

Как Google рассчитывает репутационную значимость организаций и людей, используя данные из внешних источников для ранжирования
Google использует систему для оценки репутации и престижа сущностей (например, организаций или людей). Система не полагается только на предоставленные данные, а активно ищет «Дополнительные Аспекты» из внешних источников (например, профессиональные сети, СМИ). На основе этих данных рассчитываются две метрики: «Репутационная Значимость» (престиж относительно аналогов) и «Двустороннее Соответствие» (взаимная привлекательность), которые используются для ранжирования результатов поиска и рекомендаций.
  • US10878048B2
  • 2020-12-29
  • EEAT и качество

  • SERP

  • Knowledge Graph

Как Google фильтрует поведенческие сигналы, используя совместимость языков и стран пользователей
Google уточняет ранжирование, анализируя, откуда (страна) и на каком языке (язык пользователя) поступали исторические клики по документу. Если эти характеристики считаются «несовместимыми» с текущим пользователем, поведенческие сигналы (клики) от этих групп могут быть исключены или понижены в весе. Это предотвращает искажение релевантности данными от кардинально отличающихся аудиторий.
  • US8498974B1
  • 2013-07-30
  • Поведенческие сигналы

  • Мультиязычность

  • Персонализация

seohardcore