Автор: Виктор Репин

2009 Индексация Патенты Google

Как Google оптимизирует использование памяти, сжимая Фильтры Блума без повторного чтения данных (за один проход)

Патент описывает инфраструктурный метод оптимизации хранения данных. Google может создать большой Фильтр Блума (структуру для быстрой проверки данных), заполнить его, а затем эффективно сжать до оптимального размера без необходимости повторного сканирования исходных данных. Это экономит память и ускоряет внутренние процессы обработки.

2013 Индексация Патенты Google

Как Google организует локальный поиск и индексирование данных приложений на мобильных устройствах

Патент описывает архитектуру локальной службы индексирования и поиска на устройствах (например, смартфонах). Система централизованно собирает данные из различных приложений (почта, контакты, файлы) и создает единый локальный индекс, оптимизированный для устройств с ограниченными ресурсами. Это позволяет выполнять быстрый унифицированный поиск по всему контенту устройства. Патент не связан с веб-поиском Google.

2022 Обучение моделей Патенты Яндекс Ранжирование Рекомендательные системы

Как Яндекс предотвращает утечку целевых данных (Target Leakage) при обучении ML-моделей (CatBoost)

Патент описывает технический метод подготовки данных для обучения алгоритмов машинного обучения (например, CatBoost). Система упорядочивает обучающие примеры и генерирует признаки для каждого примера, используя информацию только из предшествующих данных. Это предотвращает «утечку меток» (target leakage), повышает устойчивость моделей к переобучению и улучшает их качество в реальных задачах, таких как ранжирование или классификация контента.

2021 SERP Антиспам Патенты Яндекс Яндекс Директ

Как Яндекс оптимизирует аукционы контекстной рекламы (Yandex Direct) путем итеративного уточнения максимальных ставок рекламодателей

Яндекс патентует метод оптимизации рекламных аукционов (AdTech). Система проводит серию последовательных аукционов, ограничивая и меняя состав участников в каждом раунде. Анализируя результаты торгов, система итеративно уточняет оценку максимальной суммы, которую готов заплатить каждый рекламодатель (Reserve Price). Это позволяет максимизировать доход платформы.

2004 Мультимедиа Патенты Google

Как Google использует искажение изображений для защиты контента от копирования при предварительном просмотре (например, в Google Books)

Патент описывает технологию защиты авторских прав при просмотре контента. Чтобы пользователь мог оценить релевантность, но не мог скопировать весь текст, Google показывает релевантный фрагмент (Region of Interest) четко, а остальную часть страницы — в искаженном виде (размытие, пикселизация). Это инфраструктурный патент, не влияющий на SEO продвижение обычных сайтов.

2015 Google Shopping Патенты Google

Как Google отличает названия магазинов от названий брендов для таргетинга рекламных предложений

Патент Google описывает механизм для рекламных систем (Offer Distribution System). Система определяет, является ли термин в запросе названием конкретного продавца или общим термином/брендом. Для этого она проверяет, как часто этот термин встречается в рекламе других продавцов. Если редко, система показывает пользователю рекламу только этого конкретного продавца.

2022 SERP Антиспам Патенты Яндекс Яндекс Директ

Как Яндекс использует итеративные аукционы для определения максимальной цены, которую готовы платить рекламодатели

Патент Яндекса, описывающий сложный механизм аукциона для рекламных слотов (например, в Яндекс.Директ). Система использует итеративные раунды отбора с ограниченным и меняющимся составом участников. Ключевая особенность — алгоритм итеративной корректировки индивидуальных резервных цен для каждого рекламодателя, чтобы оценить истинную максимальную сумму, которую он готов заплатить, и максимизировать доход платформы.

2007 Мультимедиа Патенты Google

Как Google обнаруживает несанкционированное использование контента в закрытых базах данных, сохраняя конфиденциальность

Система позволяет владельцам контента проверить, используются ли их материалы (текст, изображения, видео, аудио) в пользовательских базах данных (Custom Content), индексируемых Google. Система сообщает только факт наличия совпадения, не раскрывая сам найденный контент или его местоположение, чтобы защитить конфиденциальность владельцев этих баз.

2013 Matthew Sharifi Мультимедиа Патенты Google

Как Google использует пользовательские видео (UGC) для обучения системы распознавания музыки по голосу («Hum to Search»)

Google автоматически находит и анализирует пользовательские видео (например, на YouTube), помеченные как «а капелла». Система извлекает из них чистые линии мелодии, сравнивает их для поиска наиболее точных версий (используя кластеризацию) и использует эти эталонные мелодии для обучения моделей аудио-распознавания, таких как «Hum to Search».

2022 Обучение моделей Патенты Яндекс Рекомендательные системы Яндекс Дзен

Как Яндекс обеспечивает согласованность данных при обновлении векторов в рекомендательных системах

Патент описывает инфраструктурное решение для рекомендательных систем Яндекса. Он решает проблему рассинхронизации данных при обновлении векторных представлений (эмбеддингов) пользователей и контента. Система использует комбинацию распределенных и нераспределенных хранилищ с механизмом версионирования, чтобы гарантировать, что для расчета рекомендаций всегда используются векторы, созданные одной и той же версией модели.

2017 Вертикальный поиск Интент пользователя Патенты Яндекс Яндекс Браузер

Как Яндекс реализует контекстный поиск в браузере на основе выделенного пользователем контента

Яндекс патентует технологию «Браузерного контекстного помощника». Когда пользователь выделяет информацию на странице, система анализирует этот фрагмент и окружающий контекст (включая местоположение), ищет его по разным поисковым вертикалям (Карты, Картинки, Веб и т.д.) и предлагает релевантные действия или данные в специальном всплывающем меню.

2016 E-commerce SEO Вертикальный поиск Патенты Яндекс Яндекс Маркет

Как Яндекс динамически показывает количество результатов поиска до отправки запроса

Яндекс патентует механизм улучшения пользовательского интерфейса (UI/UX), особенно для структурированного поиска (например, фильтров). Система динамически подсчитывает количество результатов по мере ввода пользователем критериев и показывает это число (например, на кнопке «Найти»), не загружая сами результаты. Это позволяет пользователю корректировать запрос на лету, не переходя на страницу выдачи.

2016 E-commerce SEO Вертикальный поиск Патенты Яндекс Яндекс Маркет

Как Яндекс динамически показывает количество результатов поиска прямо на кнопке «Найти» во время ввода запроса

Яндекс патентует механизм улучшения пользовательского интерфейса (UI/UX). Система динамически рассчитывает количество ожидаемых результатов по мере того, как пользователь вводит запрос или применяет фильтры. Это количество отображается непосредственно на кнопке «Найти» (или аналогичном компоненте), позволяя пользователю оценить объем выдачи без загрузки страницы результатов.

2014 Индексация Патенты Яндекс Персонализация Рекомендательные системы

Как Яндекс пытался создать персонализированный поиск по активности друзей в разных социальных сетях (Yandex Wonder)

Яндекс запатентовал систему (приложение «Wonder»), которая агрегирует данные об активности друзей пользователя из нескольких социальных сетей (например, Facebook, Twitter, Foursquare) в единую базу. Система позволяет пользователю искать по этой агрегированной информации, используя запросы на естественном языке, чтобы находить персонализированные рекомендации. Эта система работает независимо от основного веб-поиска Яндекса.

2016 Вертикальный поиск Патенты Яндекс Персонализация Рекомендательные системы

Как Яндекс агрегирует и ищет информацию из социальных сетей друзей пользователя (на примере Yandex Wonder)

Патент описывает систему (Yandex Wonder), которая собирает активность друзей пользователя из разных социальных сетей (Facebook, Twitter, Foursquare и др.) через API в единую базу данных. Система позволяет пользователю искать по этой агрегированной социальной информации (например, «какие рестораны посещали мои друзья») и обогащает данные информацией из внешних источников (например, iTunes, карты).

2017 Индексация Обучение моделей Патенты Яндекс Ранжирование

Как Яндекс обеспечивает мгновенное и согласованное обновление данных в поиске без блокировок (Lock-Free механизм)

Яндекс патентует инфраструктурный механизм для эффективного обновления больших массивов данных (например, хеш-таблиц с факторами ранжирования или параметрами MLR-моделей). Система создает новую версию данных в фоновом режиме, пока поиск использует текущую стабильную версию. Переключение на новую версию происходит атомарно (мгновенно), что гарантирует согласованность данных и устраняет необходимость блокировок доступа во время обновлений.

2014 Вертикальный поиск Патенты Яндекс Персонализация Рекомендательные системы

Как Яндекс создал систему агрегации и поиска по активности друзей в социальных сетях (Yandex Wonder)

Патент описывает систему (реализованную как приложение Yandex Wonder), которая собирает данные об активности друзей пользователя из нескольких разных социальных сетей (например, Facebook, Twitter, Foursquare, Instagram) в единую базу данных. Система позволяет пользователю искать исключительно по этому агрегированному контенту, используя запросы на естественном языке.

2014 SERP Навигационные запросы Патенты Яндекс Яндекс Браузер

Как Яндекс использует адресную строку браузера для показа дополнительной информации, истории навигации и рекламы (Omnibox)

Яндекс патентует технологию расширения функциональности адресной строки браузера (Omnibox/Умная строка). Адресная строка используется не только для показа URL, но и для отображения информации, контролируемой издателем браузера: системных уведомлений, рекламы и истории навигации в виде «хлебных крошек», включающих исходный поисковый запрос.

2016 Вертикальный поиск Колдунщики Патенты Яндекс Структурированные данные

Как Яндекс агрегирует и дедуплицирует переводы из разных словарей в сервисе Яндекс.Словари

Яндекс патентует метод улучшения интерфейса словарных сервисов. Система собирает определения слова из разных словарей, анализирует их на схожесть и объединяет одинаковые определения в единый кластер. Это позволяет избежать дублирования информации и предоставить пользователю компактный вид с указанием всех источников для каждого значения слова.

2025 Индексация Обучение моделей Патенты Яндекс Семантический поиск

Как Яндекс оптимизирует скорость работы нейросетей (DNN) с помощью умного пакетирования запросов переменной длины

Яндекс патентует инфраструктурный алгоритм для повышения эффективности работы нейросетей (например, BERT, YATI). При обработке данных разной длины (например, текстов) система группирует их в пакеты (батчи). Изобретение минимизирует количество «пустых» токенов (padding), необходимых для выравнивания длины запросов в пакете, тем самым экономя ресурсы GPU/CPU и ускоряя обработку.