Автор: Виктор Репин

Патент описывает инфраструктурный метод оптимизации хранения данных. Google может создать большой Фильтр Блума (структуру для быстрой проверки данных), заполнить его, а затем эффективно сжать до оптимального размера без необходимости повторного сканирования исходных данных. Это экономит память и ускоряет внутренние процессы обработки.

Патент описывает архитектуру локальной службы индексирования и поиска на устройствах (например, смартфонах). Система централизованно собирает данные из различных приложений (почта, контакты, файлы) и создает единый локальный индекс, оптимизированный для устройств с ограниченными ресурсами. Это позволяет выполнять быстрый унифицированный поиск по всему контенту устройства. Патент не связан с веб-поиском Google.

Патент описывает технический метод подготовки данных для обучения алгоритмов машинного обучения (например, CatBoost). Система упорядочивает обучающие примеры и генерирует признаки для каждого примера, используя информацию только из предшествующих данных. Это предотвращает «утечку меток» (target leakage), повышает устойчивость моделей к переобучению и улучшает их качество в реальных задачах, таких как ранжирование или классификация контента.

Яндекс патентует метод оптимизации рекламных аукционов (AdTech). Система проводит серию последовательных аукционов, ограничивая и меняя состав участников в каждом раунде. Анализируя результаты торгов, система итеративно уточняет оценку максимальной суммы, которую готов заплатить каждый рекламодатель (Reserve Price). Это позволяет максимизировать доход платформы.

Патент описывает технологию защиты авторских прав при просмотре контента. Чтобы пользователь мог оценить релевантность, но не мог скопировать весь текст, Google показывает релевантный фрагмент (Region of Interest) четко, а остальную часть страницы — в искаженном виде (размытие, пикселизация). Это инфраструктурный патент, не влияющий на SEO продвижение обычных сайтов.

Патент Google описывает механизм для рекламных систем (Offer Distribution System). Система определяет, является ли термин в запросе названием конкретного продавца или общим термином/брендом. Для этого она проверяет, как часто этот термин встречается в рекламе других продавцов. Если редко, система показывает пользователю рекламу только этого конкретного продавца.

Патент Яндекса, описывающий сложный механизм аукциона для рекламных слотов (например, в Яндекс.Директ). Система использует итеративные раунды отбора с ограниченным и меняющимся составом участников. Ключевая особенность — алгоритм итеративной корректировки индивидуальных резервных цен для каждого рекламодателя, чтобы оценить истинную максимальную сумму, которую он готов заплатить, и максимизировать доход платформы.

Система позволяет владельцам контента проверить, используются ли их материалы (текст, изображения, видео, аудио) в пользовательских базах данных (Custom Content), индексируемых Google. Система сообщает только факт наличия совпадения, не раскрывая сам найденный контент или его местоположение, чтобы защитить конфиденциальность владельцев этих баз.

Google автоматически находит и анализирует пользовательские видео (например, на YouTube), помеченные как «а капелла». Система извлекает из них чистые линии мелодии, сравнивает их для поиска наиболее точных версий (используя кластеризацию) и использует эти эталонные мелодии для обучения моделей аудио-распознавания, таких как «Hum to Search».

Патент описывает инфраструктурное решение для рекомендательных систем Яндекса. Он решает проблему рассинхронизации данных при обновлении векторных представлений (эмбеддингов) пользователей и контента. Система использует комбинацию распределенных и нераспределенных хранилищ с механизмом версионирования, чтобы гарантировать, что для расчета рекомендаций всегда используются векторы, созданные одной и той же версией модели.

Яндекс патентует технологию «Браузерного контекстного помощника». Когда пользователь выделяет информацию на странице, система анализирует этот фрагмент и окружающий контекст (включая местоположение), ищет его по разным поисковым вертикалям (Карты, Картинки, Веб и т.д.) и предлагает релевантные действия или данные в специальном всплывающем меню.

Яндекс патентует механизм улучшения пользовательского интерфейса (UI/UX), особенно для структурированного поиска (например, фильтров). Система динамически подсчитывает количество результатов по мере ввода пользователем критериев и показывает это число (например, на кнопке «Найти»), не загружая сами результаты. Это позволяет пользователю корректировать запрос на лету, не переходя на страницу выдачи.

Яндекс патентует механизм улучшения пользовательского интерфейса (UI/UX). Система динамически рассчитывает количество ожидаемых результатов по мере того, как пользователь вводит запрос или применяет фильтры. Это количество отображается непосредственно на кнопке «Найти» (или аналогичном компоненте), позволяя пользователю оценить объем выдачи без загрузки страницы результатов.

Яндекс запатентовал систему (приложение «Wonder»), которая агрегирует данные об активности друзей пользователя из нескольких социальных сетей (например, Facebook, Twitter, Foursquare) в единую базу. Система позволяет пользователю искать по этой агрегированной информации, используя запросы на естественном языке, чтобы находить персонализированные рекомендации. Эта система работает независимо от основного веб-поиска Яндекса.

Патент описывает систему (Yandex Wonder), которая собирает активность друзей пользователя из разных социальных сетей (Facebook, Twitter, Foursquare и др.) через API в единую базу данных. Система позволяет пользователю искать по этой агрегированной социальной информации (например, «какие рестораны посещали мои друзья») и обогащает данные информацией из внешних источников (например, iTunes, карты).

Яндекс патентует инфраструктурный механизм для эффективного обновления больших массивов данных (например, хеш-таблиц с факторами ранжирования или параметрами MLR-моделей). Система создает новую версию данных в фоновом режиме, пока поиск использует текущую стабильную версию. Переключение на новую версию происходит атомарно (мгновенно), что гарантирует согласованность данных и устраняет необходимость блокировок доступа во время обновлений.

Патент описывает систему (реализованную как приложение Yandex Wonder), которая собирает данные об активности друзей пользователя из нескольких разных социальных сетей (например, Facebook, Twitter, Foursquare, Instagram) в единую базу данных. Система позволяет пользователю искать исключительно по этому агрегированному контенту, используя запросы на естественном языке.

Яндекс патентует технологию расширения функциональности адресной строки браузера (Omnibox/Умная строка). Адресная строка используется не только для показа URL, но и для отображения информации, контролируемой издателем браузера: системных уведомлений, рекламы и истории навигации в виде «хлебных крошек», включающих исходный поисковый запрос.

Яндекс патентует метод улучшения интерфейса словарных сервисов. Система собирает определения слова из разных словарей, анализирует их на схожесть и объединяет одинаковые определения в единый кластер. Это позволяет избежать дублирования информации и предоставить пользователю компактный вид с указанием всех источников для каждого значения слова.

Яндекс патентует инфраструктурный алгоритм для повышения эффективности работы нейросетей (например, BERT, YATI). При обработке данных разной длины (например, текстов) система группирует их в пакеты (батчи). Изобретение минимизирует количество «пустых» токенов (padding), необходимых для выравнивания длины запросов в пакете, тем самым экономя ресурсы GPU/CPU и ускоряя обработку.