Патент Google, описывающий технологию интеграции интерактивных 3D-моделей непосредственно в страницу результатов поиска (SERP) и другие веб-страницы. Система использует семантическую информацию для идентификации объекта и встраивает 3D-просмотрщик в специальный блок выдачи (например, Панель Знаний). Это позволяет пользователям взаимодействовать с трехмерной моделью, не покидая поиск, с адаптацией под производительность устройства.
Автор: Виктор Репин
Google анализирует, как пользователи взаимодействуют (открывают, читают, сохраняют) с шаблонными B2C сообщениями (email, SMS). Система определяет интересы (бренды, темы, сущности), связанные с этими сообщениями. Если вовлеченность высока, эти интересы добавляются в профиль пользователя и используются для изменения ранжирования результатов поиска.
Google извлекает даты и географические локации непосредственно из контента веб-страниц. Это позволяет системе визуализировать результаты поиска на интерактивной временной шкале и на карте, даже если запрос не содержал явных указаний на время или место. Пользователи могут использовать эти визуализации для навигации и уточнения запросов, а сниппеты могут фокусироваться вокруг извлеченных фактов.
Google использует двухэтапный процесс для ответа на описательные запросы о медиаконтенте (например, по сюжету или персонажам). Сначала система выполняет веб-поиск по запросу. Затем она анализирует топовые веб-страницы, чтобы определить, какие фильмы или сериалы (медиа-сущности) упоминаются чаще всего. Эти сущности используются для поиска в специализированной базе медиаконтента.
Google использует механизм для эффективного определения семантической схожести документов. Система генерирует «Сигнатуру Документа» — вектор, состоящий из абстрактных тем (Topics) и весов (Weights), показывающих значимость каждой темы. Схожесть вычисляется путем сравнения этих векторов с использованием Косинусного Сходства (Cosine Similarity), что позволяет системе понимать тематические взаимосвязи в масштабе.
Google использует метод для определения, является ли последовательность слов значимой фразой. Система анализирует, насколько часто и последовательно слова появляются в определенных позициях относительно друг друга (позиционная согласованность). На основе этого вычисляется «вес фразы», который позволяет идентифицировать ключевые концепции в тексте и запросах, выходя за рамки простого совпадения ключевых слов.
Google использует механизм для улучшения навигации при уточнении запросов, особенно в визуальном поиске. Система генерирует визуальные превью результатов для подсказок (Query Suggestion Groupings). Ключевая особенность: подсказка отображается, только если ее результаты значительно отличаются от исходной выдачи (не достигают Overlap Threshold), гарантируя пользователю реальное разнообразие выбора.
Google использует механизм для поддержания поискового контекста при исследовании связанных тем. Когда пользователь изучает коллекцию сущностей одного типа (например, породы собак или фильмы актера), система отображает постоянный навигационный элемент (карусель). Это позволяет быстро переключаться между сущностями, обновляя результаты поиска и информационные блоки, не покидая исходную страницу выдачи.
Google использует систему для определения того, насколько важна конкретная сущность (человек или бренд) для документа. Система анализирует количество упоминаний, их расположение (заголовок, тело) и упоминания других сущностей для расчета «Entity Score». Этот механизм используется для предложения пользователям контента о них самих для распространения в социальных сетях, а также учитывает «Traffic Spike Score» (всплески трафика) для выявления актуальных документов.
Google использует многоступенчатую систему для определения, ищет ли пользователь медиа-контент. Система анализирует результаты из товарного индекса, поисковые подсказки (Candidate Queries) и списки ключевых слов. Если эти сигналы указывают на медиа-интент, система запускает обязательную дополнительную верификацию, например, путем распознавания имен актеров или артистов в запросе, для финальной классификации.
Анализ патента Google, описывающего интерфейс (слайдер), позволяющий пользователю динамически регулировать влияние его личных интересов на ранжирование. Система рассчитывает тематические «Boost Values» для сайтов на основе анализа ссылок и отправляет несколько вариантов ранжирования в браузер для мгновенного переключения на стороне клиента без перезагрузки страницы.
Google использует Большие Языковые Модели (LLM) для автоматической генерации синтетических обучающих данных (Задачи, Запросы и Пассажи). Эти данные применяются для обучения универсальных моделей эмбеддингов методом «Instruction Tuning». Это позволяет поисковым моделям понимать не только содержание текста, но и конкретную задачу пользователя (например, ответ на вопрос или проверка фактов), повышая точность поиска.
Google анализирует структуру веб-страницы, включая списки и заголовки, чтобы определить семантическое расстояние между ключевыми словами. Система выявляет семантические блоки, даже если они не размечены явными HTML-тегами, путем анализа повторяющихся паттернов форматирования. Расстояние между терминами рассчитывается на основе этой структуры: слова внутри одного элемента списка считаются близкими, а слова в разных элементах — далекими, независимо от физического расстояния.
Google использует технологию визуального поиска для идентификации текста в изображениях (визуальных запросах). Система оценивает качество распознанного текста (OCR), находит соответствующие строки в своей базе канонических документов (например, веб-страниц или книг) и генерирует комбинированный результат. Этот результат может накладывать чистый текст или изображение из канонического источника поверх исходного визуального запроса, создавая «исправленную» версию изображения.
Google анализирует списки на веб-страницах (например, списки моделей авто, городов, ингредиентов), чтобы выявить термины, которые часто встречаются вместе, но не являются синонимами (например, «кошка» и «собака», «январь» и «февраль»). Эти «коррелирующие пары» добавляются в черный список, чтобы предотвратить их ошибочную замену в запросе и избежать смещения тематики выдачи.
Google использует автоматизированную систему для поддержания актуальности и полноты Knowledge Graph. Когда система обнаруживает пробел (например, отсутствует свойство у сущности согласно схеме) или устаревшие данные (на основе анализа логов запросов), она генерирует точный, disambiguated поисковый запрос. Ответ, полученный от поисковой системы или QA-системы, используется для обновления Базы Знаний.
Google использует легковесную модель машинного обучения для мгновенной классификации запросов в реальном времени, когда стандартные методы слишком медленные из-за задержек (latency constraint). Эта модель обучается офлайн и классифицирует новые запросы, используя только их характеристики (термины, язык, местоположение, время суток), без обращения к результатам поиска или логам поведения пользователей.
Google персонализирует поисковые подсказки (Autocomplete), используя профиль интересов пользователя, созданный на основе его прошлых запросов и кликов. Система сравнивает тематику потенциальных подсказок с интересами пользователя и повышает в списке те варианты, которые соответствуют его предпочтениям, с учетом актуальности этих интересов.
Google использует систему для обработки конфликтующих или неполных адресных данных о местах на карте, полученных от разных поставщиков (пользователей, владельцев бизнеса, сервисов). Система стандартизирует форматы, определяет, какие записи относятся к одному объекту, и объединяет их в единый, наиболее полный адрес. При конфликте данных, особенно координат, система выбирает информацию от наиболее доверенного источника.
Патент Google описывает интерфейс, который позволяет пользователям переключаться между посадочными страницами результатов поиска или рекламных объявлений напрямую, минуя необходимость возвращаться на исходную страницу выдачи. Система предварительно загружает связанные страницы и может динамически добавлять новые релевантные результаты в сессию на основе времени взаимодействия пользователя (dwell time) с текущей страницей.