SEO HARDCORE
  • Разборы патентов
    • Патенты Google
  • Скоро SEO инструменты
  • Скоро SEO аналитика
  • seohardcore
SEO HARDCORE
назад

Как Google алгоритмически выбирает наиболее информативные фрагменты из отзывов для создания сниппетов

SELECTING HIGH QUALITY TEXT WITHIN IDENTIFIED REVIEWS FOR DISPLAY IN REVIEW SNIPPETS (Выбор высококачественного текста в идентифицированных отзывах для отображения в сниппетах отзывов)
  • US8010480B2
  • Google LLC
  • 2005-09-30
  • 2011-08-30
  • SERP
  • Описание
  • Разбор
  • Выводы
  • Практика
  • FAQ
  • Похожие

Google анализирует текст отзыва, разбивая его на предложения. Каждое предложение оценивается по длине, позиции в тексте и информационной ценности слов (используя IDF). Система выбирает последовательность предложений с наивысшей совокупной оценкой качества, чтобы сформировать максимально полезный и информативный сниппет.

Описание

Какую проблему решает

Патент решает проблему генерации качественных и информативных сниппетов для отзывов (reviews). Стандартные методы, такие как выбор начала текста или случайных фрагментов, часто бывают неинформативными. Система стремится алгоритмически выбрать наиболее содержательную часть отзыва, улучшая пользовательский опыт и позволяя быстро оценить суть отзыва.

Что запатентовано

Запатентована система и метод автоматической генерации сниппетов из текста одного отзыва. Изобретение описывает процесс разделения отзыва на части (partitions), например, предложения, оценки качества каждой части на основе предопределенных критериев и выбора комбинации последовательных (consecutive) частей с наивысшей совокупной оценкой качества в рамках ограничений по длине.

Как это работает

Ключевой механизм работы системы:

  • Разделение (Partitioning): Текст отзыва делится на разделы, обычно предложения.
  • Оценка качества (Quality Scoring): Каждое предложение получает Quality Score. Эта оценка базируется на трех основных факторах: длина предложения (предпочтение оптимальной длине), ценность слов (используя Inverse Document Frequency (IDF) для выявления информативных терминов) и позиция предложения в отзыве (предпочтение может отдаваться началу текста).
  • Выбор комбинации: Система анализирует комбинации последовательных предложений, которые соответствуют максимальной длине сниппета (Maximum Snippet Length), и выбирает ту, которая имеет наибольшую сумму оценок качества.
  • Генерация сниппета: Из выбранной комбинации формируется финальный сниппет.

Актуальность для SEO

Высокая. Генерация информативных сниппетов остается критически важной задачей для Google, особенно в Local Search, Google Shopping и других сервисах, агрегирующих отзывы. Хотя конкретные методы оценки текста эволюционировали (например, с использованием нейронных сетей), базовые принципы алгоритмической оптимизации выбора сниппета для максимизации его информативности остаются фундаментальными.

Важность для SEO

Влияние на SEO — значительное (7/10). Этот патент не описывает алгоритм ранжирования. Однако он напрямую влияет на то, как контент (отзывы) представляется пользователю, что критически важно для оптимизации коэффициента кликабельности (CTR) и управления репутацией (ORM). В Local SEO и E-commerce качественные сниппеты отзывов могут значительно повысить вероятность взаимодействия пользователя с профилем компании или товара.

Детальный разбор

Термины и определения

Combination (Комбинация)
Набор из одного или нескольких последовательных (consecutive) разделов отзыва, рассматриваемый как кандидат для сниппета.
Inverse Document Frequency (IDF, Обратная частота документа)
Метрика для оценки информативности или «ценности» слова. Слова с высоким IDF (редко встречающиеся в корпусе) считаются более ценными. Используется для расчета Word Value Sub-score. Патент отмечает, что таблицы IDF могут рассчитываться отдельно для разных типов субъектов (например, товары и услуги).
Maximum Snippet Length (Максимальная длина сниппета)
Предопределенное ограничение (в словах или символах) на длину генерируемого сниппета.
Partition (Раздел)
Часть отзыва, полученная в результате его разделения. В основном это предложения (sentences).
Quality Score (Оценка качества раздела)
Числовая оценка, присваиваемая каждому разделу (предложению). Рассчитывается как взвешенная сумма субоценок по факторам: длина, ценность слов, позиция.
Word Value Sub-score (Субоценка ценности слов)
Часть Quality Score, рассчитываемая на основе суммы произведений частоты слова (TF) на его IDF (TF-IDF) для всех слов в разделе.

Ключевые утверждения (Анализ Claims)

Патент фокусируется исключительно на процессе генерации сниппета из одного конкретного отзыва.

Claim 1 (Независимый пункт): Описывает основной метод генерации сниппета.

  1. Идентификация одного отзыва (single review).
  2. Разделение отзыва на разделы (partitions).
  3. Выбор нескольких разделов. Этот шаг включает:
    • Идентификацию двух или более комбинаций разделов.
    • Определение оценки качества (quality score) для каждой комбинации.
    • Выбор комбинации с наивысшей оценкой качества.
  4. Генерация сниппета исключительно для этого отзыва.

Claim 3 (Зависимый от 2, который зависит от 1): Уточняет факторы для расчета Quality Score раздела.

Оценка качества для каждого раздела определяется на основе его длины (length) И как минимум одного из следующих факторов: значений IDF, связанных со словами в разделе, ИЛИ позиции (position) раздела внутри отзыва.

Claim 6 (Независимый пункт): Добавляет ключевые ограничения на структуру комбинаций.

Процесс выбора разделов включает идентификацию комбинаций, где каждая комбинация состоит из разделов, которые являются последовательными (consecutive) в отзыве и удовлетворяют предопределенным критериям длины (predefined length criteria).

Claim 7 (Зависимый от 6): Детализирует выбор лучшей комбинации.

Выбор основывается на определении Quality Score для каждого раздела в комбинации и выборе комбинации с наивысшим показателем (combination score), который базируется на этих оценках.

Где и как применяется

Изобретение применяется на финальных этапах обработки запроса, когда система формирует представление данных для пользователя.

INDEXING – Индексирование и извлечение признаков
На этом этапе происходит предварительная обработка данных. Система анализирует корпус отзывов для вычисления таблиц Inverse Document Frequency (IDF). Эти таблицы могут быть специфичными для типа субъекта отзыва.

METASEARCH – Метапоиск и Смешивание / RERANKING – Переранжирование (Презентационный слой)
Это основной этап применения патента. После того как система определила, какие отзывы должны быть показаны пользователю, данный алгоритм активируется для определения того, как эти отзывы будут показаны, т.е. для генерации сниппетов.

  • Входные данные: Текст конкретного отзыва; таблица значений IDF; параметры конфигурации (веса факторов, Maximum Snippet Length).
  • Выходные данные: Сниппет (фрагмент текста) для этого отзыва.

На что влияет

  • Конкретные типы контента: Влияет на отображение пользовательского контента (UGC), такого как отзывы о товарах (E-commerce) и компаниях (Local Search).
  • Специфические запросы: Влияет на запросы, которые вызывают отображение сводок отзывов (например, запросы с интентом исследования или выбора).
  • Форматы контента: Влияет на текстовые отзывы. Патент также упоминает возможность адаптации для аудио и видео отзывов путем преобразования речи в текст (speech-to-text conversion).

Когда применяется

Алгоритм применяется в момент, когда системе необходимо сгенерировать сниппет для отображения отзыва пользователю, вместо показа полного текста.

Пошаговый алгоритм

Процесс генерации сниппета для одного отзыва:

  1. Идентификация отзыва: Система получает текст отзыва.
  2. Партиционирование: Текст делится на разделы (предложения) на основе знаков препинания.
  3. Оценка качества разделов: Для каждого предложения рассчитывается Quality Score. Это взвешенная сумма субоценок:
    1. Длина: Оценка, основанная на отклонении длины предложения от предопределенной "оптимальной". Слишком короткие и слишком длинные предложения штрафуются.
    2. Ценность слов (Word Value): Рассчитывается по формуле TF-IDF. WVP=∑w∈Pfw,P⋅log⁡IDFwWV_P = \sum_{w \in P} f_{w,P} \cdot \log IDF_w (где P - предложение, w - слово, f - частота слова). Это повышает оценку предложений с конкретными и информативными словами.
    3. Позиция: Оценка, основанная на расположении предложения в отзыве. Начальные предложения могут получать бонус.
  4. Комбинирование субоценок: Субоценки объединяются для получения итогового Quality Score предложения. Q=∑j=1Fweightj⋅qjQ = \sum_{j=1}^{F} \text{weight}_j \cdot q_j.
  5. Идентификация комбинаций: Система перебирает все возможные комбинации последовательных предложений. Для каждой комбинации проверяется ее длина относительно Maximum Snippet Length. Комбинация формируется до достижения или превышения лимита.
  6. Оценка комбинаций: Для каждой валидной комбинации рассчитывается совокупная оценка качества (например, сумма Quality Scores входящих в нее предложений).
  7. Выбор лучшей комбинации: Выбирается комбинация с максимальной совокупной оценкой.
  8. Генерация сниппета: Выбранная комбинация используется для формирования сниппета. Если ее длина превышает лимит, она обрезается (truncation). Патент предусматривает удаление последнего предложения, если после обрезки от него остается всего несколько слов.

Какие данные и как использует

Данные на входе

  • Контентные факторы: Основные данные — это текст самого отзыва. Система анализирует слова (лексику), используемые в тексте, для расчета частоты (TF) и ценности (IDF).
  • Структурные факторы: Система использует знаки препинания для определения границ предложений (partitions). Также учитывается последовательность и позиция предложений в тексте.
  • Технические факторы: Длина текста (в словах или символах) используется для оценки длины предложений и соблюдения ограничений длины сниппета.

Какие метрики используются и как они считаются

Система вычисляет несколько ключевых метрик для оценки текста:

  • TF-IDF (Term Frequency-Inverse Document Frequency): Используется для расчета Word Value Sub-score (формула приведена выше). Подчеркивает информативность слов.
  • Sentence Length (Длина предложения): Измеряется в словах или символах. Используется для сравнения с "оптимальной" длиной.
  • Position (Позиция): Порядковый номер предложения в отзыве.
  • Partition Quality Score (Оценка качества раздела): Взвешенная сумма субоценок (длина, TF-IDF, позиция) (формула приведена выше).
  • Combination Score (Оценка комбинации): Сумма Quality Scores предложений, входящих в комбинацию.

Выводы

  1. Информативность (IDF) как ключевой критерий качества: Основной вывод — Google алгоритмически определяет наиболее информативные части текста для сниппета. Информативность измеряется с помощью IDF. Предложения, содержащие специфичные, редкие термины, имеют приоритет над общими фразами.
  2. Оптимизация сниппетов по качеству, а не только по позиции: Система не просто берет начало отзыва. Она активно ищет наиболее качественный фрагмент в любом месте текста, хотя позиция в начале и дает небольшой бонус (Position Score).
  3. Структура и читаемость имеют значение: Алгоритм учитывает длину предложений, предпочитая оптимальную длину. Это улучшает читаемость сниппета.
  4. Контекстная целостность: Требование выбирать только последовательные предложения гарантирует, что сниппет сохраняет логическую связность и контекст.
  5. Контекстная специфичность оценки: Система может использовать разные таблицы IDF для разных категорий отзывов (товары, услуги), признавая, что ценность слов зависит от контекста.

Практика

Best practices (это мы делаем)

Поскольку SEO-специалисты часто не контролируют содержание пользовательских отзывов (UGC), применение фокусируется на стратегиях ORM и стимулировании качественного контента.

  • Стимулирование использования конкретной лексики (High IDF): Мотивируйте клиентов упоминать в отзывах конкретные детали, характеристики, названия моделей или услуг. Такие термины обычно имеют более высокий IDF и увеличивают Word Value Sub-score, повышая вероятность выбора этого фрагмента для сниппета.
  • Поощрение написания структурированных отзывов: Поощряйте пользователей писать четкие отзывы с использованием знаков препинания. Это помогает системе корректно разделить текст на предложения (partitions) и оценить их длину и качество.
  • Анализ отображаемых сниппетов (Snippet Analysis): Регулярно анализируйте, какие сниппеты Google выбирает для отзывов о вашем бизнесе (например, в Local Pack). Определяйте термины, которые система считает важными (высокий IDF). Это дает понимание того, какие аспекты вашего продукта или услуги наиболее заметны.
  • Размещение важной информации в начале (для редакционных обзоров): Если вы публикуете редакционные обзоры на своем сайте, размещайте ключевые выводы в начале текста, так как фактор "позиция в отзыве" дает преимущество началу текста.

Worst practices (это делать не надо)

  • Генерация шаблонных отзывов из общих фраз: Отзывы типа "Все супер. Рекомендую." имеют низкую информационную ценность из-за использования слов с низким IDF. Они вряд ли сформируют качественный сниппет.
  • Игнорирование качества и структуры UGC: Разрешение публикации отзывов без знаков препинания или сплошным текстом. Это затрудняет парсинг на предложения и снижает оценку качества.
  • Поощрение экстремально коротких или длинных отзывов: Система штрафует предложения, которые сильно отклоняются от оптимальной длины.
  • Попытки "накрутки" ключевых слов в отзывах: Искусственное внедрение частотных ключевых слов неэффективно. Система использует IDF, который понижает ценность часто встречающихся слов. Фокус должен быть на специфичности.

Стратегическое значение

Патент подчеркивает стремление Google извлекать и демонстрировать наиболее полезную информацию даже из неструктурированного UGC. Для SEO и ORM это означает, что качество, структура и информативность отзывов напрямую влияют на то, как бренд представлен в поисковой выдаче (SERP, Maps, Shopping). Алгоритмический выбор сниппетов на основе IDF и структуры подчеркивает важность аутентичного, детализированного языка для привлечения внимания пользователей и повышения CTR.

Практические примеры

Сценарий: Выбор сниппета для отзыва о наушниках

Текст отзыва:
"Купил эти наушники на прошлой неделе. Доставка была вовремя. В целом, они неплохие. Однако, функция активного шумоподавления (ANC) работает слишком агрессивно в офисном окружении, создавая неприятное давление. Батарея держит около 25 часов с включенным ANC. Качество звука отличное."

Анализ системы:

  1. Партиционирование: Текст делится на 6 предложений.
  2. Оценка (предполагаемая):
    • Предложения 1, 2, 3 ("Купил...", "Доставка...", "В целом...") получают низкие оценки Word Value из-за общих слов (низкий IDF).
    • Предложение 4 ("Однако, функция активного шумоподавления (ANC)...") получает высокую оценку: оптимальная длина, высокий IDF у слов "активного шумоподавления", "ANC", "агрессивно", "давление".
    • Предложение 5 ("Батарея держит...") получает хорошую оценку: конкретные данные (25 часов), высокий IDF у "Батарея", "ANC".
  3. Выбор комбинации: Комбинация предложений 4+5, вероятно, будет иметь наивысшую совокупную оценку качества и уложится в Maximum Snippet Length.
  4. Результат (Сниппет): "Однако, функция активного шумоподавления (ANC) работает слишком агрессивно в офисном окружении, создавая неприятное давление. Батарея держит около 25 часов с включенным ANC..."

Вопросы и ответы

Что такое Inverse Document Frequency (IDF) и почему это важно для сниппетов?

IDF — это мера того, насколько уникально или информативно слово. Редкие и специфичные термины имеют высокий IDF, а общие слова — низкий. Google использует TF-IDF для оценки предложений. Предложения, содержащие специфические термины, считаются более информативными и с большей вероятностью попадут в сниппет, так как они несут больше пользы для пользователя.

Влияет ли этот патент на ранжирование моего сайта?

Напрямую нет. Патент описывает механизм генерации сниппетов (Презентационный слой), а не ранжирования. Однако косвенное влияние значительно: более информативные и привлекательные сниппеты увеличивают CTR, что положительно влияет на поведенческие сигналы и общую эффективность SEO-стратегии, особенно в Local SEO и E-commerce.

Всегда ли Google берет начало отзыва для сниппета?

Нет. Хотя позиция в начале отзыва является одним из факторов, повышающих оценку качества предложения (Position Score), система анализирует весь текст. Если наиболее информативная часть (с высоким IDF и оптимальной длиной) находится в середине отзыва, алгоритм выберет именно ее.

Как SEO-специалист может использовать эту информацию на практике?

Основное применение – в стратегиях ORM (управление репутацией) и анализе выдачи. Необходимо мотивировать клиентов оставлять детализированные отзывы с использованием специфической лексики и четкой структуры. Это повышает вероятность того, что Google сформирует привлекательные и полезные сниппеты, улучшая представление бренда.

Может ли сниппет состоять из несвязанных предложений из разных частей отзыва?

Согласно этому патенту – нет. Алгоритм специально разработан для выбора комбинации последовательных (consecutive) предложений (Claim 6). Это делается для обеспечения логической связности и читаемости сниппета.

Имеет ли значение пунктуация в отзывах?

Да, она критически важна. Система использует знаки препинания (например, точки) для разделения отзыва на предложения (partitions). Если отзыв представляет собой сплошной текст без точек, система не сможет корректно его обработать и оценить отдельные части, что приведет к генерации неоптимального сниппета.

Использует ли Google разные правила для отзывов о товарах и услугах?

Да, патент предусматривает такую возможность. Упоминается, что система может использовать разные таблицы IDF для разных типов субъектов (например, для продуктов и для компаний). Это позволяет точнее определять ценность слов, так как информативная лексика различается в разных нишах.

Какова «оптимальная длина» предложения согласно патенту?

Конкретные цифры не указаны, но отмечается, что оценка основана на отклонении от «оптимальной» длины. Это подразумевает, что система предпочитает предложения средней длины, штрафуя как слишком короткие (неинформативные), так и слишком длинные (трудночитаемые) предложения.

Применяется ли этот алгоритм к сниппетам обычных веб-страниц?

Патент специфичен для обработки отзывов (Reviews). Генерация сниппетов для стандартных веб-результатов, вероятно, использует другие алгоритмы, которые больше фокусируются на релевантности тексту запроса пользователя, а не только на общей информативности (IDF) текста страницы.

Актуален ли этот патент, учитывая развитие NLP и BERT?

Концептуально актуален, но технически мог быть усовершенствован. Принципы выбора наиболее информативного фрагмента остаются важными. Однако современные системы Google используют более сложные нейросетевые модели (BERT/MUM) для понимания семантики и информативности текста, что является эволюцией статистических методов вроде TF-IDF.

Похожие патенты

Как Google динамически выбирает текст для сниппета, основываясь на типе запроса и структуре документа
Google использует адаптивную систему для генерации сниппетов в результатах поиска. Система анализирует тип запроса (например, поиск по автору или по содержанию) и местоположение ключевых слов в документе. На основе этого выбирается алгоритм генерации. Параграфы оцениваются по их длине, позиции в документе, качеству текста и форматированию, чтобы выбрать наиболее информативный фрагмент, часто отдавая предпочтение введению или резюме.
  • US8145617B1
  • 2012-03-27
  • SERP

  • Семантика и интент

Как Google находит, извлекает и объединяет отзывы о товарах из интернета для создания агрегированных рейтингов и выявления частых фраз
Патент описывает систему Google для сбора отзывов о товарах из интернета. Система использует селективное сканирование сайтов, извлекает текст отзывов, рейтинги и авторов. Затем она автоматически определяет, к какому именно продукту относится отзыв (даже при разных названиях), и создает сводную информацию: общий рейтинг, распределение оценок и список часто упоминаемых фраз. Эта система позволяет пользователям искать информацию внутри отзывов о конкретном товаре.
  • US7962461B2
  • 2011-06-14
  • Краулинг

Как Google использует анализ тональности (Sentiment Analysis) для создания сниппетов из отзывов
Google использует запатентованную систему для генерации информативных сниппетов для сущностей, о которых оставляют отзывы (например, рестораны, товары). Система извлекает фразы, выражающие мнение (sentiment phrases), из множества отзывов, оценивает их тональность с учетом специфики домена и выбирает наиболее частотные и разнообразные фразы для формирования сниппета, суммирующего общественное мнение об этой сущности.
  • US8010539B2
  • 2011-08-30
  • SERP

  • Семантика и интент

Как Google автоматически извлекает и анализирует отзывы о компаниях из интернета
Google использует систему для автоматического поиска и анализа отзывов о сущностях (например, компаниях) на веб-страницах. Система идентифицирует информацию о компании (название, адрес), извлекает текст рядом с ней и применяет анализ тональности (Sentiment Analysis), чтобы определить, является ли этот текст отзывом и какова его эмоциональная окраска.
  • US20150112981A1
  • 2015-04-23
  • Local SEO

  • Семантика и интент

  • EEAT и качество

Как Google использует отзывы для сравнения, фильтрации и ранжирования сущностей в поиске
Патент Google описывает систему, которая позволяет пользователям искать внутри отзывов (UGR) сразу по нескольким сущностям (например, отелям или товарам) и сравнивать их в едином интерфейсе. Система индексирует отзывы как отдельные документы и использует их содержание для обнаружения сущностей, фильтрации результатов основного поиска и в качестве сигналов ранжирования веб-страниц.
  • US11568004B2
  • 2023-01-31
  • Индексация

  • SERP

  • Семантика и интент

Популярные патенты

Как Google использует данные о кликах пользователей (CTR и Click Ratio) для определения официального сайта по навигационным запросам
Google анализирует журналы запросов, чтобы определить, какой результат пользователи подавляюще предпочитают по конкретному запросу. Если результат демонстрирует исключительно высокий CTR и/или Click Ratio по популярному запросу, система помечает его как «авторитетную страницу». Затем этот результат может отображаться на выдаче с особым выделением, потенциально переопределяя стандартное ранжирование.
  • US8788477B1
  • 2014-07-22
  • Поведенческие сигналы

  • EEAT и качество

  • SERP

Как Google использует временной распад и анализ трендов кликов для корректировки ранжирования и борьбы со стагнацией выдачи
Google применяет механизмы для предотвращения «залипания» устаревших результатов в топе выдачи. Система анализирует возраст пользовательских кликов и снижает вес старых данных (временной распад), отдавая приоритет свежим сигналам. Кроме того, система выявляет документы с ускоряющимся трендом кликов по сравнению с фоном и повышает их в выдаче, улучшая актуальность результатов.
  • US9092510B1
  • 2015-07-28
  • Свежесть контента

  • Поведенческие сигналы

  • SERP

Как Google перенаправляет пользователей на «идеальные» запросы (KHRQ), анализируя поведение и удовлетворенность
Google анализирует логи запросов, чтобы определить «известные высокоранжированные запросы» (KHRQ) — те, которые пользователи вводят часто и которыми остаются довольны (редко переформулируют или долго изучают результаты). Система вычисляет вероятность того, что исходный запрос пользователя лучше заменить на KHRQ, основываясь на сходстве запросов и исторических цепочках переформулировок. Это позволяет направлять пользователей к наиболее эффективным формулировкам.
  • US7870147B2
  • 2011-01-11
  • Семантика и интент

  • Поведенческие сигналы

  • SERP

Как Google позволяет пользователям "углубиться" в контент установленного мобильного приложения прямо из веб-выдачи
Google использует этот механизм для интеграции контента из нативных приложений в веб-поиск. Если приложение установлено у пользователя и система определяет высокую релевантность его контента запросу, в выдачу добавляется специальный элемент (например, "Больше результатов из приложения X"). Клик по этому элементу запускает новый поиск, показывая множество deep links только из этого приложения, не покидая интерфейс поиска.
  • US10579687B2
  • 2020-03-03
  • SERP

  • Семантика и интент

  • Ссылки

Как Google консолидирует сигналы ранжирования между мобильными и десктопными версиями страниц, используя десктопный авторитет для мобильного поиска
Патент Google описывает механизм для решения проблемы недостатка сигналов ранжирования в мобильном вебе. Система идентифицирует корреляцию между мобильной страницей и её десктопным аналогом. Если мобильная версия недостаточно популярна сама по себе, она наследует сигналы ранжирования (например, обратные ссылки и PageRank) от авторитетной десктопной версии, улучшая её позиции в мобильном поиске.
  • US8996514B1
  • 2015-03-31
  • Техническое SEO

  • Ссылки

Как Google генерирует «синтетический анкорный текст», анализируя структуру и контекст ссылающихся страниц
Google анализирует структурно похожие страницы, ссылающиеся на различные ресурсы. Определяя, где известные поисковые запросы (Seed Queries) появляются в структуре этих ссылающихся страниц (например, в заголовках или Title), Google создает шаблоны. Эти шаблоны затем используются для извлечения текста из аналогичных мест на других страницах, создавая «синтетический описательный текст» (аналог анкорного текста) для целевых ресурсов. Это улучшает ранжирование, даже если фактический анкорный текст низкого качества.
  • US9208232B1
  • 2015-12-08
  • Ссылки

  • Структура сайта

  • Семантика и интент

Как Google классифицирует интент запросов (например, поиск порнографии), анализируя историю использования фильтров (SafeSearch)
Google использует данные о том, как часто пользователи включают или отключают фильтры контента (например, SafeSearch) при вводе конкретного запроса. Анализируя нормализованное соотношение фильтрованных и нефильтрованных поисковых операций, система классифицирует запрос как целенаправленно ищущий определенный тип контента (например, adult). Эта классификация затем используется для повышения или понижения релевантности соответствующего контента в выдаче.
  • US9152701B2
  • 2015-10-06
  • Семантика и интент

  • Безопасный поиск

  • Поведенческие сигналы

Как Google использует историю местоположений для определения физической активности пользователя и гиперперсонализации поиска
Google анализирует историю перемещений пользователя (местоположения и скорость), чтобы определить его текущую физическую активность (например, поход, шоппинг) и способ передвижения (например, пешком, на автобусе). Эта информация используется для радикальной персонализации: система корректирует ранжирование результатов, изменяет запросы и формирует подсказки, чтобы они соответствовали контексту реальных действий пользователя.
  • US20150006290A1
  • 2015-01-01
  • Поведенческие сигналы

  • Персонализация

  • Local SEO

Как Google использует ссылки, которыми делятся в почте, блогах и мессенджерах, как сигнал для корректировки ранжирования
Google запатентовал механизм (User Distributed Search), который учитывает, как пользователи делятся ссылками в коммуникациях (почта, блоги, мессенджеры). Если автор включает ссылку в сообщение, это дает ей первоначальную модификацию в ранжировании. Если получатели переходят по этой ссылке, её Ranking Score увеличивается ещё больше. Оба сигнала используются для влияния на позиции документа в будущей выдаче.
  • US8862572B2
  • 2014-10-14
  • Поведенческие сигналы

  • Ссылки

Как Google использует историю физических перемещений пользователя для фильтрации и персонализации результатов поиска
Google может собирать и хранить историю физических перемещений пользователя (Location History). Патент описывает интерфейс, позволяющий пользователю осознанно включать свои прошлые местоположения (например, «места, где я был на прошлой неделе») в качестве фильтра для нового поискового запроса, чтобы сделать результаты более релевантными личному опыту.
  • US8874594B2
  • 2014-10-28
  • Персонализация

  • Поведенческие сигналы

  • Local SEO

seohardcore