Google использует механизм для улучшения релевантности результатов путем анализа недавней истории поиска пользователя. Если текущий запрос похож на предыдущие, система определяет ключевые контекстные термины, которые часто повторялись в истории (устойчивый интент), но отсутствуют в текущем запросе. Эти термины автоматически добавляются к запросу, чтобы предоставить более точные и персонализированные результаты.
Автор: Виктор Репин
Google использует систему для анализа конкуренции между видео на основе общих поисковых запросов и времени просмотра. Система выявляет поисковые запросы, которые приводят трафик на конкурирующие (например, производные) видео, и сравнивает их с метаданными оригинального видео. Если обнаруживаются релевантные термины, отсутствующие у оригинала, они рекомендуются автору для улучшения видимости.
Google анализирует огромные коллекции изображений, группируя точные и близкие дубликаты в кластеры. Используя метрики, такие как низкий CTR и большое количество ссылающихся сайтов, система идентифицирует кластеры, состоящие из шаблонных изображений (например, «Фото скоро будет»). Это позволяет фильтровать их в поиске по картинкам и улучшать качество продуктовой выдачи.
Этот патент описывает foundational-механизмы Search Generative Experience (SGE). Google генерирует AI-сводки, передавая контент из релевантных результатов поиска в Large Language Model (LLM) — техника, известная как Retrieval-Augmented Generation (RAG). Система также описывает, как эти сводки верифицируются, снабжаются ссылками на источники и адаптируются в реальном времени на основе контекста пользователя и его взаимодействия с выдачей.
Google динамически регулирует минимальный порог эффективности (например, CTR или сигналы вовлеченности). Если релевантность результата определена с низкой степенью уверенности (например, через семантическое расширение запроса), ему необходимо показать более высокую эффективность, чтобы пройти фильтры, по сравнению с результатами, точно соответствующими запросу.
Google использует этот механизм для улучшения результатов по навигационным (брендовым) запросам. Система определяет официальный сайт и связанный с ним верифицированный профиль в социальной сети. Свежий или популярный контент (посты, изображения) из этого профиля затем встраивается непосредственно в сниппет основного результата поиска, обеспечивая актуальность выдачи.
Google анализирует контент «интерактивных сессий» (например, видеоинструкций), используя распознавание объектов и речи, чтобы определить, какие инструменты и детали необходимы для конкретных задач. Система также вычисляет «профили надежности» продуктов, определяя, какие детали чаще всего ремонтируются. Эта информация используется для диагностики поломок и предоставления списков необходимых ресурсов в поиске.
Google описывает механизм для точной идентификации авторов контента. Система (например, плагин браузера) отслеживает отправку контента через веб-формы (CMS, комментарии), фиксирует личность пользователя и отправленный текст. Затем Google проверяет, появился ли этот текст по указанному адресу, и связывает контент с верифицированным автором.
Google использует систему для автоматического определения канонической формы URL. Система активно тестирует различные комбинации параметров в URL, чтобы определить, какие из них влияют на контент, а какие нет (например, tracking-коды или session ID). Неважные параметры удаляются с помощью правил перезаписи, что позволяет свести множество дублирующихся URL к единой канонической версии, экономя краулинговый бюджет.
Google использует систему для персонализации рекомендаций контента, анализируя характеристики документов (например, через TF-IDF) и создавая динамические профили интересов пользователей. Система обучается на основе поведения: разные типы взаимодействий (просмотр, печать, сохранение) по-разному влияют на профиль пользователя, а влияние этих поведенческих сигналов со временем ослабевает (Signal Decay).
Google анализирует логи локальных поисковых запросов для обнаружения новых бизнесов. Система отслеживает термины, отсутствующие в текущей базе данных. Если частота использования такого термина в определенном регионе резко возрастает по сравнению с историческим уровнем, система идентифицирует его как название нового бизнеса и инициирует процесс его проверки (включая анализ отзывов) и добавления в индекс.
Патент Google описывает механизм валидации качества внутренних правил синонимов. Система анализирует логи запросов, чтобы изолировать влияние конкретного синонима на поведение пользователя. Если пользователь кликает на результат, содержащий ТОЛЬКО синоним (а не исходный термин), это засчитывается как «Решающий Клик». Если пропускает такой результат — как «Решающий Пропуск». На основе этих данных система вычисляет оценку уверенности для правила и удаляет неэффективные синонимы.
Google анализирует скорость появления (Velocity) и метаданные (геолокацию, время, распознанные объекты на фото) постов в социальных сетях. При обнаружении всплеска активности («тренда») по теме или в конкретном месте система генерирует автоматическую сводку события или индикатор тренда, показывая его вместе с релевантными социальными постами.
Google использует этот метод для анализа больших наборов тегов (таких как ключевые слова или сущности) с целью выявления пересекающихся тематических кластеров («сообществ»). Система строит взвешенный граф на основе частоты совместного появления тегов, агрессивно удаляет шум (случайные совпадения) и определяет тесно связанные группы, где каждый элемент сильно коррелирует с остальными. Это помогает Google понимать тематическую релевантность и рекомендовать связанные концепции.
Патент Google, описывающий интерфейс для Карт и локального поиска, который упрощает сбор отзывов о географических объектах (ресторанах, магазинах). Система одновременно показывает список результатов, существующие комментарии и поле для ввода нового отзыва для каждого объекта. Собранные данные используются для индексации и ранжирования, при этом учитывается анонимность автора и социальные связи пользователя.
Патент описывает систему (Agent Rank), позволяющую Google идентифицировать авторов контента с помощью цифровых подписей. Система рассчитывает репутационный балл для каждого автора на основе качества подписанного им контента и ссылок на этот контент от других авторитетных авторов. Этот балл используется для повышения в поиске контента от авторитетных агентов.
Google анализирует, как часто и когда пользователи вводят разные запросы. Если временные графики (распределения) двух запросов совпадают (одинаковые пики и спады популярности), система считает эти запросы семантически близкими или переводом друг друга, даже если они на разных языках. Это используется для улучшения понимания запросов и поиска релевантных документов на других языках.
Google анализирует вероятность того, что запрос является запросом информации об акциях, даже если он введен в поле общего поиска. Система сравнивает, как часто термин (тикер) используется в общем контексте (в логах запросов) по сравнению с интересом к соответствующей акции (объем торгов). Это позволяет системе отличать финансовый интент от общего для неоднозначных терминов и отображать специализированные результаты фондового рынка.
Google анализирует поведение пользователей для оценки правил, которые меняют порядок слов в запросе (Reordering Rules). Если пользователи кликают на результаты с измененным порядком слов, правило считается полезным (Click Count). Если пропускают такие результаты ради нижестоящих (Skip Count), правило отключается. Это позволяет системе автоматически понять, когда порядок слов критичен для смысла запроса, а когда им можно пренебречь.
Google использует механизм для сравнения и совместного ранжирования веб-страниц и нативных мобильных приложений. Поскольку оценки для веба и приложений рассчитываются по разным шкалам, система нормализует оценки приложений, приводя их к единой шкале с веб-результатами. Это позволяет Google формировать унифицированную поисковую выдачу (Universal Search), включающую как ссылки на сайты, так и контент из приложений (Deep Links).