Семантика и интент

Патент Google описывает систему автоматической классификации видео, которая не требует ручной разметки и устойчива к неточным метаданным. Система сначала обучает классификаторы на основе аудиовизуального контента. Затем эти результаты используются для …
Google использует механизм для определения интента пользователя по редким или новым (long-tail) запросам, когда исторические данные отсутствуют. Система эффективно "прощупывает" вертикальные индексы (например, картинки), чтобы решить, стоит ли проводить полный …
Google использует систему для классификации сайтов по уровню качества и авторитетности в рамках конкретных тематик (Knowledge Domains). Система создает векторные представления (эмбеддинги) сайтов и сравнивает их с эталонными векторами высококачественных …
Патент раскрывает методы интерпретации голосового ввода на носимых устройствах. Система анализирует обширный контекст (недавние документы, местоположение, календари), чтобы определить намерение пользователя. Ключевой особенностью является генерация «неявных поисковых запросов» (Implicit Search …
Google группирует ресурсы, относящиеся к одной сущности (человек, продукт, книга), в кластеры. Патент описывает двухуровневую систему ранжирования: сначала ресурсы ранжируются внутри кластера на основе их общего качества (Quality Score) и …
Google создает персональную модель пользователя (User Model) на основе его личного контента (письма, контакты, документы). Эта модель используется для определения неявного намерения пользователя (личный поиск или общий) и для аннотирования …
Google использует масштабную инфраструктуру машинного обучения для понимания семантики. Система анализирует огромные объемы текста (например, поисковые сессии), чтобы автоматически выявить скрытые «концепции» (кластеры связанных слов) и вероятности их взаимодействия. Эта …
Google использует механизм для помощи пользователям в уточнении их поисковых запросов. Когда пользователь взаимодействует с определенной частью запроса в поисковой строке (например, наводит курсор или выделяет слово), система определяет контекст …
Google использует механизм для улучшения точности ответов, генерируемых LLM в ответ на мультимодальные запросы (изображение + текст). Система находит визуально похожие изображения, извлекает текст из их источников и генерирует ответ. …
Google использует системы на основе ИИ (Трансформеры) для анализа видеоконтента, объединяя визуальные, звуковые и текстовые сигналы в единые мультимодальные эмбеддинги. Этот механизм позволяет поисковой системе глубоко понимать содержание видео, оценивать …
Google использует данные о посещаемости и навигации пользователей для расчета популярности документов. Система классифицирует документы и запросы по темам, а затем вычисляет популярность документа внутри каждой конкретной темы (Per-Topic Popularity). …
Google использует механизм для динамического определения дубликатов в поисковой выдаче. Вместо сравнения документов целиком, система извлекает из них части, наиболее релевантные запросу (сниппеты). Если эти сниппеты у разных документов совпадают …
Патент описывает гибридную систему Google для генерации синонимов, комбинирующую статистический анализ логов запросов и лингвистический анализ. Ключевая особенность — механизм повышенного доверия к лексическим вариантам (например, словам с общим корнем, …
Google анализирует, что пользователи искали в прошлом, находясь рядом с определенными типами мест (например, в магазинах электроники или кафе). Когда новый пользователь начинает вводить запрос рядом с похожим местом, система …
Google использует систему для определения схожести между запросами путем объединения нескольких различных сигналов корреляции. Система комбинирует показатели, основанные на временных трендах (как часто запросы ищут одновременно в разных источниках) и …
Google использует процесс "согласования графов" для автоматического расширения Knowledge Graph. Система извлекает факты о потенциально новых сущностях из множества веб-документов, а затем проверяет их достоверность путем перекрестной сверки (corroboration). Если …
Патент описывает механизм обмена данными об интересах аудитории между разными платформами. Платформа-источник (например, YouTube) анализирует совместное потребление контента, группирует его в «бакеты» интересов и присваивает анонимные токены. Внешние сервисы (например, …
Google применяет архитектуру нейронных сетей («Two-Tower Model») для поиска изображений. Система создает семантические векторы (эмбеддинги) отдельно для запроса и для пары «изображение + посадочная страница» в общем пространстве. Это позволяет …
Google применяет механизм для интерпретации неоднозначных поисковых запросов, которые имеют несколько географических или категориальных значений. Система определяет доминирующий интент, анализируя, как пользователи в том же регионе ранее уточняли похожие запросы …
Патент описывает, как Google динамически определяет тематические "режимы поиска" (например, "Вакансии" или "Рецепты") на основе запроса. Система предлагает переключиться в специализированный режим, который использует структурированные данные вместо общего веб-индекса и …