2023

Яндекс патентует метод оптимизации ресурсов при проверке сайтов на вредоносный контент. Система строит граф связей между сайтами и присваивает им оценки доверия (Trust Scores) на основе истории ранжирования и поведения …
Яндекс патентует метод улучшения ранжирования для новых или редких запросов. Система использует модель (Second MLA), обученную предсказывать поведенческую схожесть запросов на основе их текста. Для нового запроса находятся похожие прошлые …
Патент Яндекса описывает многоэтапный процесс обучения моделей ранжирования (вероятно, трансформеров типа YATI). Система сначала обучается на огромном массиве данных о кликах пользователей, а затем дообучается на меньшем, но более качественном …
Яндекс патентует систему борьбы с фейковыми отзывами, основанную на анализе истории браузера пользователя со всех его устройств. Система ищет URL страниц подтверждения транзакций («Спасибо за покупку»), используя многоуровневые эмбеддинги (общие, …
Яндекс использует алгоритмы машинного обучения (включая DSSM) для глубокой персонализации Яндекс Карт. Система анализирует действия пользователя во всей экосистеме Яндекса (Поиск, Такси, Еда, Музыка и т.д.) и создает вектор его …
Яндекс патентует метод улучшения качества обучения алгоритмов ранжирования (MLA) путем автоматической генерации «сложных» отрицательных примеров (Hard Negatives). Если пользователь в рамках одной сессии уточняет запрос (с Q1 на Q2), система …
Яндекс патентует метод ранжирования, учитывающий схожесть между самими документами-кандидатами (D2D proximity). Система генерирует векторы документов и рассчитывает, насколько каждый документ близок к «среднему» результату в выдаче (Reference Vector) или к …
Яндекс патентует систему для приоритизации проверки сайтов на вредоносный контент. Система рассчитывает «Оценку надежности» на основе ранга в поиске и поведенческих факторов. Ключевой механизм: сайт наследует надежность по принципу «слабого …
Яндекс патентует механизм, который сравнивает фактическое качество сайта (Raw Quality Score), основанное на согласованности поведенческих метрик и лояльности пользователей, с эталонным качеством (Reference Score), ожидаемым для его уровня трафика. При …
Яндекс патентует многоэтапный процесс обучения трансформерных моделей (типа BERT/YATI) для ранжирования. Система сначала обучается на огромном массиве данных о кликах и метаданных, а затем дообучается на оценках асессоров. Ключевой шаг …
Яндекс патентует метод двухфазного обучения Трансформерных моделей (таких как BERT или YATI) для персонализации поиска. Модель сначала обучается предсказывать прошлые клики пользователя на широком наборе данных (Фаза 1), а затем …
Яндекс использует разделенную (двухфазную) нейросетевую архитектуру на базе Трансформеров (BERT/YATI) для ускорения персонализации. Первая фаза анализирует историю поиска пользователя и текущий запрос, создавая компактное представление интересов. Вторая фаза использует это …
Яндекс патентует метод автоматической генерации «сложных негативных примеров» для обучения алгоритмов машинного обучения (MLA), определяющих схожесть запросов. Система ищет пары запросов, которые текстуально очень похожи (например, отличаются одним словом), но …
Яндекс патентует двухступенчатую архитектуру на базе нейронных сетей (Трансформеры/BERT) для эффективного персонализированного ранжирования. Первая ступень анализирует историю поиска пользователя и текущий запрос, создавая единое пользовательское представление. Вторая ступень быстро сопоставляет …
Яндекс патентует антифрод-механизм, нацеленный на потенциально мошеннические коммерческие ресурсы. Система намеренно повышает, а затем понижает позиции сайта в выдаче в разные промежутки времени, используя случайные значения. Цель — создать резкие …
Яндекс патентует методы генерации сложных (hard negatives) обучающих примеров для улучшения точности ранжирования. Система использует граф связей между запросами и документами, а также анализ позиций общих документов в выдаче, чтобы …
Яндекс патентует метод для точной настройки порогов срабатывания в системах бинарной классификации (например, Спам/Не спам, Качественный/Некачественный), которые используют «вложенные метрики». Вложенные метрики основаны на взаимосвязанных событиях, таких как «Клики» и …
Яндекс патентует метод фильтрации и дедупликации поисковых подсказок и связанных запросов. Система определяет схожесть двух запросов-кандидатов на основе степени пересечения их результатов поиска (SERP Similarity). Если две подсказки ведут на …
Яндекс патентует метод обучения нейронных сетей (типа Трансформер) для генерации кратких ответов (например, для Алисы или быстрых ответов) на основе нескольких сниппетов из выдачи. Ключевая технология — «маска ограничения внимания». …
Яндекс использует систему аукционов в реальном времени для выбора не только того, какие рекламные объявления показать, но и как именно их расположить. Система перебирает различные шаблоны (макеты SERP) и для …