Яндекс патентует метод оптимизации ресурсов при проверке сайтов на вредоносный контент. Система строит граф связей между сайтами и присваивает им оценки доверия (Trust Scores) на основе истории ранжирования и поведения …
2023
Яндекс патентует метод улучшения ранжирования для новых или редких запросов. Система использует модель (Second MLA), обученную предсказывать поведенческую схожесть запросов на основе их текста. Для нового запроса находятся похожие прошлые …
Патент Яндекса описывает многоэтапный процесс обучения моделей ранжирования (вероятно, трансформеров типа YATI). Система сначала обучается на огромном массиве данных о кликах пользователей, а затем дообучается на меньшем, но более качественном …
Яндекс патентует систему борьбы с фейковыми отзывами, основанную на анализе истории браузера пользователя со всех его устройств. Система ищет URL страниц подтверждения транзакций («Спасибо за покупку»), используя многоуровневые эмбеддинги (общие, …
Яндекс использует алгоритмы машинного обучения (включая DSSM) для глубокой персонализации Яндекс Карт. Система анализирует действия пользователя во всей экосистеме Яндекса (Поиск, Такси, Еда, Музыка и т.д.) и создает вектор его …
Яндекс патентует метод улучшения качества обучения алгоритмов ранжирования (MLA) путем автоматической генерации «сложных» отрицательных примеров (Hard Negatives). Если пользователь в рамках одной сессии уточняет запрос (с Q1 на Q2), система …
Яндекс патентует метод ранжирования, учитывающий схожесть между самими документами-кандидатами (D2D proximity). Система генерирует векторы документов и рассчитывает, насколько каждый документ близок к «среднему» результату в выдаче (Reference Vector) или к …
Яндекс патентует систему для приоритизации проверки сайтов на вредоносный контент. Система рассчитывает «Оценку надежности» на основе ранга в поиске и поведенческих факторов. Ключевой механизм: сайт наследует надежность по принципу «слабого …
Яндекс патентует механизм, который сравнивает фактическое качество сайта (Raw Quality Score), основанное на согласованности поведенческих метрик и лояльности пользователей, с эталонным качеством (Reference Score), ожидаемым для его уровня трафика. При …
Яндекс патентует многоэтапный процесс обучения трансформерных моделей (типа BERT/YATI) для ранжирования. Система сначала обучается на огромном массиве данных о кликах и метаданных, а затем дообучается на оценках асессоров. Ключевой шаг …
Яндекс патентует метод двухфазного обучения Трансформерных моделей (таких как BERT или YATI) для персонализации поиска. Модель сначала обучается предсказывать прошлые клики пользователя на широком наборе данных (Фаза 1), а затем …
Яндекс использует разделенную (двухфазную) нейросетевую архитектуру на базе Трансформеров (BERT/YATI) для ускорения персонализации. Первая фаза анализирует историю поиска пользователя и текущий запрос, создавая компактное представление интересов. Вторая фаза использует это …
Яндекс патентует метод автоматической генерации «сложных негативных примеров» для обучения алгоритмов машинного обучения (MLA), определяющих схожесть запросов. Система ищет пары запросов, которые текстуально очень похожи (например, отличаются одним словом), но …
Яндекс патентует двухступенчатую архитектуру на базе нейронных сетей (Трансформеры/BERT) для эффективного персонализированного ранжирования. Первая ступень анализирует историю поиска пользователя и текущий запрос, создавая единое пользовательское представление. Вторая ступень быстро сопоставляет …
Яндекс патентует антифрод-механизм, нацеленный на потенциально мошеннические коммерческие ресурсы. Система намеренно повышает, а затем понижает позиции сайта в выдаче в разные промежутки времени, используя случайные значения. Цель — создать резкие …
Яндекс патентует методы генерации сложных (hard negatives) обучающих примеров для улучшения точности ранжирования. Система использует граф связей между запросами и документами, а также анализ позиций общих документов в выдаче, чтобы …
Яндекс патентует метод для точной настройки порогов срабатывания в системах бинарной классификации (например, Спам/Не спам, Качественный/Некачественный), которые используют «вложенные метрики». Вложенные метрики основаны на взаимосвязанных событиях, таких как «Клики» и …
Яндекс патентует метод фильтрации и дедупликации поисковых подсказок и связанных запросов. Система определяет схожесть двух запросов-кандидатов на основе степени пересечения их результатов поиска (SERP Similarity). Если две подсказки ведут на …
Яндекс патентует метод обучения нейронных сетей (типа Трансформер) для генерации кратких ответов (например, для Алисы или быстрых ответов) на основе нескольких сниппетов из выдачи. Ключевая технология — «маска ограничения внимания». …
Яндекс использует систему аукционов в реальном времени для выбора не только того, какие рекламные объявления показать, но и как именно их расположить. Система перебирает различные шаблоны (макеты SERP) и для …