Google использует механизм предварительной загрузки (префетчинга) для улучшения пользовательского опыта. Пока пользователь просматривает первую страницу результатов, система автоматически и асинхронно загружает следующую страницу в кэш браузера. Это обеспечивает мгновенное отображение при переходе, а механизм подтверждения просмотра гарантирует точный учет статистики и показов рекламы.
Автор: Виктор Репин
Google решает проблему неоднозначности ввода в языках без стандартной романизации (например, кантонский диалект). Система строит статистические языковые модели на основе предпочтений пользователей, чтобы распознавать разные фонетические варианты ввода латиницей (например, «lauta» и «lauda») как один и тот же иероглифический запрос, обеспечивая унифицированные подсказки автозаполнения.
Патент описывает правила разрешения конфликтов (Tiebreaker Rules) в Google Ads. Когда запрос соответствует нескольким ключевым словам одной кампании, система выбирает одно «контролирующее ключевое слово». Выбор учитывает специфичность соответствия, ставки (Bids) и показатели качества (Quality Score), при этом система может искусственно снижать ставки менее специфичных ключевых слов.
Яндекс патентует метод для ускорения и повышения точности поиска по картинке (CBIR). Вместо индексации отдельных элементов изображения («визуальных слов»), система использует «Композитный параметр визуальных характеристик» (КПВХ или «визуальная фраза»). КПВХ объединяет как минимум два элемента и их взаимосвязь (пространственную или визуальную). Это позволяет быстрее находить дубликаты и похожие изображения, устойчивые к изменениям (кадрирование, сжатие).
Google использует интерфейс «стена видео», отображающий множество роликов одновременно в виде версий с низкой частотой кадров (например, 1 кадр в секунду). Это позволяет пользователям быстро оценить содержание видео без когнитивной перегрузки. Система также может отображать и кластеризовать видео, которые загружаются в реальном времени, улучшая обнаружение свежего контента и событий.
Google использует метод квантования «Shape-Gain» для повышения точности и скорости поиска похожих изображений. Система разделяет векторы признаков на направление (Shape/Форма, определяющее визуальный паттерн) и магнитуду (Gain/Усиление, определяющее интенсивность). Раздельное кодирование этих компонентов позволяет создавать более точные компактные коды (хэши) для эффективного сравнения миллиардов изображений.
Google использует механизм для эффективного включения социальных результатов в поисковую выдачу. Система анализирует социальный граф пользователя, различая друзей (симметричные связи) и подписки на влиятельных пользователей (асимметричные связи). Если пользователь подписан на слишком много аккаунтов, система ограничивает их число при обработке запроса, чтобы избежать задержек. Приоритет отдается аккаунтам с высокой популярностью (Prominence) и высоким уровнем взаимодействия с пользователем (Affinity).
Google патентует механизм для понимания голосовых запросов, заданных во время просмотра видео (например, «Кто этот актер?»). Система синхронизирует мобильное устройство с устройством воспроизведения, фиксируя точную временную метку и идентификатор контента в момент запроса. Эти данные используются для выполнения контекстного поиска и предоставления точного ответа.
Google может использовать многоэтапный процесс поиска. Сначала система выполняет поиск по первой части запроса. Затем результаты этого поиска определяют ограниченную область (например, конкретный веб-сайт, домен или связанные страницы) для выполнения второго поиска по второй части запроса. Это позволяет итеративно уточнять результаты.
Патент Google, описывающий систему управления множественными «Персонами» внутри единого аккаунта пользователя. Система изолирует личные данные, историю поиска и интересы для каждой персоны, предотвращая утечку данных между ними. Это напрямую влияет на то, какие данные используются для персонализации поисковой выдачи в зависимости от текущего контекста пользователя.
Патент описывает внутренний механизм Google для преобразования запросов на естественном языке в структурированные операции (например, SQL) для доступа к Базе Знаний. Система анализирует запрос, строит дерево концептов и гиперграф. При возникновении сбоев (двусмысленность, ошибки парсинга) она пытается автоматически их исправить, пробуя альтернативные варианты разбора, или запрашивает уточнения у пользователя.
Яндекс патентует метод эффективного обновления поискового индекса, разделенного на сегменты (чанки). Система определяет «активные» (полезные) и «неактивные» (бесполезные) документы на основе поведенческих данных и свежести. Для обновления выбираются чанки с наименьшей долей активных документов. Эти чанки дефрагментируются: неактивные данные удаляются, а новые добавляются, обеспечивая плотное хранение данных и экономя ресурсы.
Этот патент описывает, как Google Flights анализирует доступные маршруты авиабилетов и автоматически группирует их в значимые кластеры на основе таких признаков, как цена, продолжительность и количество остановок. Эти кластеры затем представляются как динамические фильтры, помогая пользователям ориентироваться в сложных вариантах без ручной настройки стандартных фильтров.
Яндекс патентует метод генерации лент рекомендаций (например, для Дзена). Система анализирует множество прошлых запросов пользователей и для каждого запроса формирует список релевантных материалов. Затем она агрегирует, как часто и на каких позициях конкретный материал появлялся в этих списках, формируя итоговый рейтинг для ленты. Процесс может выполняться офлайн для ускорения ответа.
Патент описывает механизм интерфейса для поиска внутри социальной сети. Если система находит достаточное количество результатов определенного типа (например, профилей или тематических страниц), но они не отображаются в стандартной выдаче (например, постов), пользователю показывается всплывающая подсказка (tooltip). Эта подсказка предлагает переключиться на просмотр этих альтернативных типов контента.
Google использует механизм для повышения точности распознавания голосовых запросов. Система анализирует личную историю поиска пользователя и текущий контекст (время, местоположение, тип устройства), чтобы выбрать наиболее вероятную интерпретацию произнесенной фразы. Это позволяет отдавать предпочтение терминам, которые пользователь искал ранее в похожих обстоятельствах, даже если акустически они звучат неоднозначно.
Google использует механизм для обеспечения визуальной согласованности между 3D-моделями и 2D-изображениями в результатах поиска. Система определяет наиболее релевантное 2D-изображение по запросу и алгоритмически подбирает начальный ракурс (Initial Viewing Angle) 3D-модели так, чтобы он визуально соответствовал этому 2D-эталону. Это определяет, как пользователь впервые увидит 3D-объект в выдаче.
Патент описывает клиентскую технологию (Autolink), часто реализуемую через тулбары или расширения браузера. Система сканирует содержимое веб-страницы, распознает специфические форматы данных (например, адреса, номера отслеживания, VIN-коды) по шаблонам и автоматически преобразует их в кликабельные ссылки, ведущие на релевантные внешние ресурсы (например, карту или страницу отслеживания посылки).
Google патентует систему для автоматического создания форматированных «поисковых журналов» о трендовых темах. Система идентифицирует тренд, ищет новостные статьи, пользовательский контент (соцсети, фото, видео) и справочную информацию по теме, а затем компонует все это в виде «издания», адаптированного под конкретное мобильное устройство.
Патент описывает систему Google для автоматического обнаружения сайтов объявлений (например, Craigslist). Система использует эвристики (например, географические названия в URL) и ML-классификаторы для анализа структуры сайта (страницы списков и детальные страницы). Цель — идентифицировать такие сайты для последующего автоматического извлечения структурированных данных и оптимизации частоты сканирования.