Автор: Виктор Репин

Анализ патента Google, описывающего два ключевых механизма. Первый — адаптивная система верификации (CAPTCHA/SmartQuiz), которая динамически изменяет частоту проверок для борьбы с ботами. Второй — модель ранжирования (Pay-to-Surf), где порядок результатов определяется ставками, которые рекламодатели готовы платить за взаимодействие с конкретным демографическим профилем пользователя.

Google использует систему для интеграции личных данных пользователя (например, бронирований авиабилетов или заказов), извлеченных из его электронных документов (Gmail, Календарь), непосредственно в поисковую выдачу. Система анализирует запрос и стандартные результаты поиска, и если обнаруживает соответствие, отображает эти данные с различной степенью заметности, зависящей от близости события.

Google индексирует медиаконтент (фильмы, сериалы) из разных источников (стриминги, ТВ-каналы) и определяет, к чему у конкретного пользователя есть доступ (подписки, покупки). При поиске система фильтрует результаты, показывая только доступный контент, и предоставляет агрегированную информацию (например, количество доступных эпизодов или оставшееся время аренды).

Яндекс патентует систему для фильтрации поисковых подсказок (Автокомплит) с целью блокировки оскорбительного или нелегального контента. Система использует контекстную логику с двумя режимами: для одних слов подсказки разрешены по умолчанию и блокируются только специфические продолжения (Ban Markers); для других — запрещены по умолчанию и разрешаются только безопасные продолжения (Unban Markers).

Google использует механизм для автоматического определения и исправления запросов, введенных с ошибочной раскладкой клавиатуры. Если исходный запрос возвращает неудовлетворительные результаты, система анализирует контекст пользователя (язык интерфейса, местоположение, историю поиска), чтобы определить предполагаемый язык. Затем запрос перекодируется в правильный скрипт, и пользователю показываются релевантные результаты.

Фундаментальный патент Google, описывающий механизм ранжирования платной рекламы (Google Ads). Система рассчитывает рейтинг объявления, часто умножая показатель эффективности (например, CTR) на ставку рекламодателя (например, CPC). Это позволяет максимизировать доход Google и показывать пользователям более релевантные объявления, а не только те, за которые больше заплатили.

Google анализирует медиаконтент (например, эпизоды сериалов или обучающих курсов), чтобы автоматически понять, какие эпизоды связаны между собой. Изучая фрагменты повторов, транскрипты и визуальные элементы (включая распознавание лиц), система строит «Граф Зависимостей». Это позволяет рекомендовать пользователям необходимые для понимания предыдущие эпизоды, улучшая организацию и потребление сериализованного контента.

Яндекс патентует инфраструктурный метод для эффективного индексирования и поиска дубликатов аудиоконтента (включая аудиодорожки видео). Система создает короткие и длинные акустические отпечатки (Chromaprints) и использует специализированный иерархический инвертированный индекс для быстрого поиска совпадений. Это позволяет Яндексу идентифицировать одинаковый аудиоконтент, даже если файлы отличаются качеством или имеют временные сдвиги.

Google использует механизм для автоматического тегирования 3D-моделей зданий на основе данных Карт. Система определяет географические границы модели (Base Polygon) и проверяет, какие точки интереса (POI), например, магазины или рестораны, расположены внутри. Эти POI добавляются как системные теги, позволяя находить 3D-модель здания по названию бизнеса, который в нем находится.

Яндекс патентует двухэтапную систему для эффективного обнаружения дубликатов аудиофайлов (например, музыки или аудиодорожек видео). Система создает короткие и длинные аудиосигнатуры (отпечатки) на основе «хромаслов». Сначала она быстро находит кандидатов по коротким сигнатурам через специализированный инвертированный индекс, а затем проводит детальное побитовое сравнение длинных сигнатур для подтверждения дублирования.

Патент описывает механизм локального поиска на устройстве (например, смартфоне). Приложения передают («донатят») данные о действиях пользователя (поисковые запросы, просмотренный контент, выполненные задачи) в центральный локальный индекс. Это позволяет пользователю через единый интерфейс или Ассистента находить контент и возобновлять действия сразу в нужном приложении.

Google улучшает точность распознавания лиц в визуальном поиске, анализируя не только визуальное сходство, но и метрики социальной связанности (social connection metrics) между пользователем, отправившим запрос, и потенциальным кандидатом. Ранжирование учитывает объем общения, прямые связи в социальных сетях, общие интересы и данные геолокации.

Google использует систему для улучшения взаимодействия с изображениями в поиске. Анализируя запрос, исторические данные о поведении пользователей и личные предпочтения, система определяет наиболее релевантные объекты или детали на изображении. Эти области могут быть предложены как интерактивные подсказки или автоматически увеличены для экономии времени пользователя.

Патент описывает систему создания «Справочной страницы» (Reference Page) для оцифрованных печатных изданий (книг, статей). Когда пользователь находит книгу в поиске, система автоматически выполняет вторичные веб-запросы на основе атрибутов книги (автор, название). Результаты этих запросов (например, биографии автора, рецензии на книгу) агрегируются или извлекаются и отображаются на Справочной странице, предоставляя пользователю контекст из веба.

Google анализирует, как «навигационная» реклама (реклама, соответствующая названию бренда в запросе) работает в разных местах на странице (сверху, сбоку, снизу). Для каждой позиции рассчитывается поправочный коэффициент. Когда пользователь ищет бренд, Google использует эти коэффициенты для корректировки прогнозируемой эффективности (например, CTR) рекламы этого бренда, влияя на ее итоговый рейтинг и позицию в рекламном аукционе.

Анализ патента Google, описывающего автоматическую генерацию критериев таргетинга для рекламных кампаний. Система анализирует целевую страницу рекламодателя и сравнивает сущности, найденные на ней, с сущностями из тематических коллекций, соответствующих заявленному типу бизнеса. Пересечение этих данных формирует точные критерии выбора, улучшая релевантность рекламы.

Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.

Google использует специализированную архитектуру графовой базы данных (graphd) для хранения сущностей и фактов, применяя подход «Schema Last». Патент описывает низкоуровневые методы оптимизации сложных запросов к этому графу, включая динамическую cost-based оптимизацию, итераторы и бюджетирование ресурсов, что позволяет быстро извлекать связанные данные о сущностях.

Яндекс патентует метод повышения качества обучения моделей ранжирования при использовании данных от краудсорсинговых асессоров (например, Toloka). Вместо усреднения оценок, система анализирует надежность и строгость каждого асессора. Она корректирует (нормализует) значение оценки и присваивает ей вес (уверенность). Эти функции коррекции и взвешивания обучаются так, чтобы напрямую максимизировать качество финальной модели ранжирования, а не точность самих оценок.

Google может использовать историю местоположений устройства пользователя (GPS-логи или чекины) для поиска в интернете фотографий, сделанных другими людьми в тех же местах и в то же время. Система находит изображения с соответствующими метаданными (геокоординаты и время съемки) и предлагает их пользователю.