Автор: Виктор Репин

Как Google патентовал адаптивную CAPTCHA и ранжирование на основе ставок за демографический профиль пользователя

Анализ патента Google, описывающего два ключевых механизма. Первый — адаптивная система верификации (CAPTCHA/SmartQuiz), которая динамически изменяет частоту проверок для борьбы с ботами. Второй — модель ранжирования (Pay-to-Surf), где порядок результатов определяется ставками, которые рекламодатели готовы платить за взаимодействие с конкретным демографическим профилем пользователя.

2013 Индексация Патенты Google Персонализация

Как Google интегрирует персональные данные (бронирования, покупки) в результаты поиска

Google использует систему для интеграции личных данных пользователя (например, бронирований авиабилетов или заказов), извлеченных из его электронных документов (Gmail, Календарь), непосредственно в поисковую выдачу. Система анализирует запрос и стандартные результаты поиска, и если обнаруживает соответствие, отображает эти данные с различной степенью заметности, зависящей от близости события.

2012 Knowledge Graph Мультимедиа Патенты Google Персонализация

Как Google персонализирует поиск медиаконтента, определяя его доступность на основе подписок и покупок пользователя

Google индексирует медиаконтент (фильмы, сериалы) из разных источников (стриминги, ТВ-каналы) и определяет, к чему у конкретного пользователя есть доступ (подписки, покупки). При поиске система фильтрует результаты, показывая только доступный контент, и предоставляет агрегированную информацию (например, количество доступных эпизодов или оставшееся время аренды).

2017 Антиспам Асессоры Патенты Яндекс Поисковые подсказки

Как Яндекс использует комбинированные фильтры (Ban/Unban логику) для контроля контента в поисковых подсказках

Яндекс патентует систему для фильтрации поисковых подсказок (Автокомплит) с целью блокировки оскорбительного или нелегального контента. Система использует контекстную логику с двумя режимами: для одних слов подсказки разрешены по умолчанию и блокируются только специфические продолжения (Ban Markers); для других — запрещены по умолчанию и разрешаются только безопасные продолжения (Unban Markers).

2007 Мультиязычность Патенты Google Семантика и интент

Как Google исправляет запросы, введенные с неправильной раскладкой клавиатуры, используя контекст пользователя

Google использует механизм для автоматического определения и исправления запросов, введенных с ошибочной раскладкой клавиатуры. Если исходный запрос возвращает неудовлетворительные результаты, система анализирует контекст пользователя (язык интерфейса, местоположение, историю поиска), чтобы определить предполагаемый язык. Затем запрос перекодируется в правильный скрипт, и пользователю показываются релевантные результаты.

2002 Патенты Google Поведенческие сигналы

Как Google ранжирует платные объявления, используя комбинацию эффективности (CTR) и цены за клик (CPC)

Фундаментальный патент Google, описывающий механизм ранжирования платной рекламы (Google Ads). Система рассчитывает рейтинг объявления, часто умножая показатель эффективности (например, CTR) на ставку рекламодателя (например, CPC). Это позволяет максимизировать доход Google и показывать пользователям более релевантные объявления, а не только те, за которые больше заплатили.

2014 Мультимедиа Патенты Google

Как Google использует анализ видео и аудио для построения графов зависимостей между эпизодами сериализованного контента

Google анализирует медиаконтент (например, эпизоды сериалов или обучающих курсов), чтобы автоматически понять, какие эпизоды связаны между собой. Изучая фрагменты повторов, транскрипты и визуальные элементы (включая распознавание лиц), система строит «Граф Зависимостей». Это позволяет рекомендовать пользователям необходимые для понимания предыдущие эпизоды, улучшая организацию и потребление сериализованного контента.

2018 Антиспам Вертикальный поиск Индексация Патенты Яндекс Яндекс Музыка

Как Яндекс индексирует и находит дубликаты аудио и видео контента с помощью акустических отпечатков (Chromaprints)

Яндекс патентует инфраструктурный метод для эффективного индексирования и поиска дубликатов аудиоконтента (включая аудиодорожки видео). Система создает короткие и длинные акустические отпечатки (Chromaprints) и использует специализированный иерархический инвертированный индекс для быстрого поиска совпадений. Это позволяет Яндексу идентифицировать одинаковый аудиоконтент, даже если файлы отличаются качеством или имеют временные сдвиги.

2010 Knowledge Graph Патенты Google

Как Google автоматически определяет, какие бизнесы (POI) находятся внутри зданий, для улучшения поиска по 3D-моделям

Google использует механизм для автоматического тегирования 3D-моделей зданий на основе данных Карт. Система определяет географические границы модели (Base Polygon) и проверяет, какие точки интереса (POI), например, магазины или рестораны, расположены внутри. Эти POI добавляются как системные теги, позволяя находить 3D-модель здания по названию бизнеса, который в нем находится.

2017 Антикачество Антиспам Вертикальный поиск Индексация Патенты Яндекс Яндекс Музыка

Как Яндекс использует аудио-отпечатки (хромапринты) и двухэтапный индекс для быстрого поиска дубликатов аудио и видео контента

Яндекс патентует двухэтапную систему для эффективного обнаружения дубликатов аудиофайлов (например, музыки или аудиодорожек видео). Система создает короткие и длинные аудиосигнатуры (отпечатки) на основе «хромаслов». Сначала она быстро находит кандидатов по коротким сигнатурам через специализированный инвертированный индекс, а затем проводит детальное побитовое сравнение длинных сигнатур для подтверждения дублирования.

2023 Индексация Патенты Google Персонализация Ссылки

Как Google индексирует действия и контент внутри приложений для универсального поиска на устройстве (Cross-App Search)

Патент описывает механизм локального поиска на устройстве (например, смартфоне). Приложения передают («донатят») данные о действиях пользователя (поисковые запросы, просмотренный контент, выполненные задачи) в центральный локальный индекс. Это позволяет пользователю через единый интерфейс или Ассистента находить контент и возобновлять действия сразу в нужном приложении.

2010 Мультимедиа Патенты Google

Как Google использует социальные связи и личные данные для распознавания лиц в визуальном поиске

Google улучшает точность распознавания лиц в визуальном поиске, анализируя не только визуальное сходство, но и метрики социальной связанности (social connection metrics) между пользователем, отправившим запрос, и потенциальным кандидатом. Ранжирование учитывает объем общения, прямые связи в социальных сетях, общие интересы и данные геолокации.

2021 Matthew Sharifi Victor Carbune Мультимедиа Патенты Google Персонализация

Как Google автоматически определяет и предлагает наиболее релевантные области для увеличения на изображениях в поиске

Google использует систему для улучшения взаимодействия с изображениями в поиске. Анализируя запрос, исторические данные о поведении пользователей и личные предпочтения, система определяет наиболее релевантные объекты или детали на изображении. Эти области могут быть предложены как интерактивные подсказки или автоматически увеличены для экономии времени пользователя.

2004 Патенты Google Персонализация

Как Google обогащает информацию о книгах и публикациях с помощью данных из веба (Основы Google Books и Google Scholar)

Патент описывает систему создания «Справочной страницы» (Reference Page) для оцифрованных печатных изданий (книг, статей). Когда пользователь находит книгу в поиске, система автоматически выполняет вторичные веб-запросы на основе атрибутов книги (автор, название). Результаты этих запросов (например, биографии автора, рецензии на книгу) агрегируются или извлекаются и отображаются на Справочной странице, предоставляя пользователю контекст из веба.

2013 Патенты Google Поведенческие сигналы Семантика и интент

Как Google корректирует ранжирование рекламы в зависимости от ее расположения на странице и навигационного интента запроса

Google анализирует, как «навигационная» реклама (реклама, соответствующая названию бренда в запросе) работает в разных местах на странице (сверху, сбоку, снизу). Для каждой позиции рассчитывается поправочный коэффициент. Когда пользователь ищет бренд, Google использует эти коэффициенты для корректировки прогнозируемой эффективности (например, CTR) рекламы этого бренда, влияя на ее итоговый рейтинг и позицию в рекламном аукционе.

2013 Knowledge Graph Патенты Google Персонализация

Как Google автоматически генерирует критерии таргетинга для рекламы, сравнивая сущности на лендинге и в тематических коллекциях

Анализ патента Google, описывающего автоматическую генерацию критериев таргетинга для рекламных кампаний. Система анализирует целевую страницу рекламодателя и сравнивает сущности, найденные на ней, с сущностями из тематических коллекций, соответствующих заявленному типу бизнеса. Пересечение этих данных формирует точные критерии выбора, улучшая релевантность рекламы.

2014 Патенты Google Поведенческие сигналы

Как Google нормализует и объединяет разнородные сигналы для ранжирования критериев таргетинга в рекламных системах

Патент Google, описывающий методы ранжирования критериев распространения контента (например, ключевых слов или мест размещения для рекламы). Система объединяет основной сигнал (например, релевантность) с вспомогательными (CTR, показы), используя математические трансформации для уменьшения искажений данных (Skewness) и гарантируя, что отсутствие данных по сигналу не пессимизирует критерий. Патент относится к AdTech, а не к органическому поиску.

2010 Knowledge Graph Индексация Патенты Google

Как Google оптимизирует архитектуру и выполнение запросов в графовой базе данных (Knowledge Graph)

Google использует специализированную архитектуру графовой базы данных (graphd) для хранения сущностей и фактов, применяя подход «Schema Last». Патент описывает низкоуровневые методы оптимизации сложных запросов к этому графу, включая динамическую cost-based оптимизацию, итераторы и бюджетирование ресурсов, что позволяет быстро извлекать связанные данные о сущностях.

2017 Асессоры Краудсорсинг Обучение моделей Патенты Яндекс

Как Яндекс обучает алгоритмы ранжирования на зашумленных данных краудсорсинга (Toloka) путем нормализации и взвешивания оценок

Яндекс патентует метод повышения качества обучения моделей ранжирования при использовании данных от краудсорсинговых асессоров (например, Toloka). Вместо усреднения оценок, система анализирует надежность и строгость каждого асессора. Она корректирует (нормализует) значение оценки и присваивает ей вес (уверенность). Эти функции коррекции и взвешивания обучаются так, чтобы напрямую максимизировать качество финальной модели ранжирования, а не точность самих оценок.

2011 Мультимедиа Патенты Google Персонализация

Как Google использует историю местоположений пользователя для поиска чужих фотографий, сделанных в том же месте и в то же время

Google может использовать историю местоположений устройства пользователя (GPS-логи или чекины) для поиска в интернете фотографий, сделанных другими людьми в тех же местах и в то же время. Система находит изображения с соответствующими метаданными (геокоординаты и время съемки) и предлагает их пользователю.