Антиспам

Яндекс патентует инфраструктурный метод для эффективного индексирования и поиска дубликатов аудиоконтента (включая аудиодорожки видео). Система создает короткие и длинные акустические отпечатки (Chromaprints) и использует специализированный иерархический инвертированный индекс для быстрого …
Яндекс патентует двухэтапную систему для эффективного обнаружения дубликатов аудиофайлов (например, музыки или аудиодорожек видео). Система создает короткие и длинные аудиосигнатуры (отпечатки) на основе "хромаслов". Сначала она быстро находит кандидатов по …
Яндекс патентует метод для ускорения и повышения точности поиска по картинке (CBIR). Вместо индексации отдельных элементов изображения («визуальных слов»), система использует «Композитный параметр визуальных характеристик» (КПВХ или «визуальная фраза»). КПВХ …
Яндекс патентует метод повышения качества данных, собираемых через краудсорсинг (например, Толока) для обучения ML-алгоритмов (включая ранжирование и Proxima). Система динамически корректирует оценки качества асессоров на основе взвешенного консенсуса, а не …
Яндекс патентует систему адаптивной фильтрации «таргетированного контента» (рекламы, рекомендаций). Система собирает данные, когда пользователи вручную блокируют нежелательный контент (негативные примеры), и сравнивает их с контентом, который не блокируется (позитивные примеры). …
Яндекс патентует метод повышения эффективности поиска по картинке (Image-to-Image/CBIR). Вместо индексации отдельных «визуальных слов», система создает «Visual Features Composite Parameters» (VFCP) — комбинацию как минимум двух визуальных элементов и их …
Яндекс патентует метод повышения качества моделей машинного обучения (в частности, деревьев принятия решений, используемых в ранжировании) путем введения случайного шума во время их обучения. Этот механизм регуляризации предотвращает переобучение модели …
Патент описывает внутренний механизм машинного обучения Яндекса (вероятно, часть CatBoost) для борьбы с переобучением (Overfitting). При обучении система намеренно добавляет случайный шум (Random Parameters of Interest) в данные для оценки …
Яндекс патентует метод повышения надежности и качества машинного обучения (в частности, CatBoost). Для борьбы с переобучением (overfitting) система намеренно вводит случайный шум в данные во время тренировки модели при оценке …
Яндекс использует систему для ускорения идентификации почти дубликатов (near-duplicates) видео во время индексации. Вместо медленного сравнения содержания каждого видеофайла система сначала проверяет схожесть их продолжительности. Допустимая разница (variance parameter) динамически …
Патент Яндекса (от авторов CatBoost) описывает инфраструктурный метод обучения ML-моделей. Чтобы предотвратить переобучение (overfitting) и утечку целевой переменной (target leakage), обучающие примеры упорядочиваются. Признаки (текстовые или векторные) для каждого примера …
Яндекс патентует метод обучения алгоритмов на основе деревьев решений (например, CatBoost). Вместо стандартного начала обучения, система создает начальные «шумовые деревья» со случайными значениями, в том числе в пустых узлах. Это …
Яндекс патентует метод оптимизации поиска почти дублирующихся видеофайлов. Чтобы избежать дорогостоящего сравнения всех видео, система сначала фильтрует кандидатов по длительности. Допустимое отклонение длительности рассчитывается динамически (например, как процент от оригинала) …
Яндекс патентует метод снижения нагрузки на серверы рекламного аукциона (например, Яндекс.Директ). Вместо расчета оптимальных параметров (таких как минимальная цена) в реальном времени, система использует машинное обучение для предварительного расчета этих …
Яндекс патентует двухэтапный метод идентификации аудиоконтента. Система создает короткие и длинные цифровые отпечатки (аудиосигнатуры). Сначала быстро сравниваются короткие отпечатки (используя «хромаслова») для выбора кандидатов, а затем проводится детальное побитовое сравнение …
Яндекс патентует метод оптимизации рекламных аукционов (AdTech). Система проводит серию последовательных аукционов, ограничивая и меняя состав участников в каждом раунде. Анализируя результаты торгов, система итеративно уточняет оценку максимальной суммы, которую …
Патент Яндекса, описывающий сложный механизм аукциона для рекламных слотов (например, в Яндекс.Директ). Система использует итеративные раунды отбора с ограниченным и меняющимся составом участников. Ключевая особенность — алгоритм итеративной корректировки индивидуальных …
Патент описывает внутреннюю механику рекламных аукционов Яндекса (например, Яндекс.Директ). Для предотвращения манипуляций ставками и снижения нагрузки на серверы, Яндекс использует офлайн машинное обучение для расчета оптимальных параметров аукциона (например, резервной …