Яндекс патентует метод генерации «Аннотационных векторов» для документов. Эти векторы агрегируют лингвистические характеристики всех запросов, по которым пользователи находили документ, и связанные с ними поведенческие метрики (CTR, Dwell Time). Система …
2019
Яндекс патентует механизм автоматического «Мгновенного Ответа». Если система определяет, что один документ значительно релевантнее остальных (Relevancy Differential) и с высокой вероятностью полностью удовлетворяет запрос (Likelihood Parameter, основанный на анализе Заголовка, …
Патент Яндекса, лежащий в основе алгоритма CatBoost, описывает методы обработки категориальных признаков (таких как URL, домены, имена авторов) в машинном обучении. Система преобразует эти признаки в числа, используя упорядоченную статистику …
Яндекс патентует систему динамического уточнения поисковой выдачи в реальном времени. Система отслеживает микровзаимодействия пользователя (скроллинг, выделение, остановка внимания) с конкретными словами или фразами в сниппетах. На основе этих сигналов вычисляется …
Яндекс патентует метод обхода ограничений традиционного краулинга для сайтов с огромным количеством динамических страниц (например, агрегаторов билетов, каталогов). Вместо индексации миллионов комбинаций, система использует шаблоны URL-адресов (Address Templates) для динамической …
Яндекс патентует метод использования «Фактора Привлекательности» (Appeal Factor) в ранжировании. Система использует модель машинного обучения (например, нейросеть), обученную на скриншотах страниц, чтобы предсказать, насколько визуально привлекательной или удобной найдет страницу …
Яндекс патентует метод для быстрых и релевантных контентных рекомендаций. Система заранее вычисляет набор общепопулярных материалов (офлайн). В момент запроса пользователя (онлайн) система находит материалы, похожие на его прошлые интересы, исключая …
Яндекс патентует метод обучения моделей ранжирования и смешивания (блендинга). Для определения истинной полезности результата (веб-страницы или вертикального блока) система намеренно рандомизирует его позицию в выдаче для тестовой группы пользователей. Анализируя …
Яндекс патентует метод ранжирования «ненативных» элементов (свежий контент без статистики кликов) в 2D-выдаче (например, Яндекс Картинки). Система обучается предсказывать «Оценку Полезности» нового элемента на разных позициях, анализируя, как пользователи взаимодействуют …
Яндекс патентует механизм выбора обогащенного ответа (Rich Suggest) в поисковых подсказках. Система агрегирует вероятность перехода на конкретный ресурс по всем подсказкам, соответствующим введенному префиксу. Обогащенный ответ показывается, только если ресурс, …
Яндекс патентует метод улучшения поисковых подсказок (саджестов) за счет добавления свежих, трендовых запросов. Система анализирует недавнюю поисковую активность и свежие документы из надежных источников. Она рассчитывает частоту новых запросов, оценивает …
Яндекс патентует механизм активного сбора поведенческих данных для документов с недостаточной статистикой. Система использует вспомогательную модель для прогнозирования качества документа (независимо от кликов). Затем ранг документа случайным образом изменяется (повышается …
Патент раскрывает ключевые механизмы библиотеки CatBoost, основного алгоритма ранжирования Яндекса. Он описывает метод преобразования категориальных факторов (например, URL, доменов, текста запроса) в числовые значения для машинного обучения. Для борьбы с …
Яндекс патентует двухэтапный механизм для ранжирования в рекомендательных системах. Сначала определяется персонализированная релевантность контента на основе вовлеченности. Затем независимый алгоритм классификации оценивает качество контента и его источника, генерируя «понижающую оценку» …
Яндекс патентует метод обогащения инвертированного индекса данными о кликах. Если пользователи кликают на документ, в котором отсутствует одно из слов запроса (найденный по «правилу кворума»), система добавляет «клик-постинг» для этого …
Яндекс патентует метод ускорения A/B тестов. Система использует машинное обучение (Gradient Boosting) для прогнозирования будущего поведения пользователей на основе данных, собранных в начале эксперимента. Это позволяет быстрее оценить долгосрочный эффект …
Яндекс патентует технологию улучшения навигации по сайтам. Система (например, браузер или поисковая система) автоматически определяет наиболее важные или популярные разделы сайта на основе его категории и поведенческих данных. Затем она …
Этот патент описывает ключевые механизмы алгоритма CatBoost, ядра машинного обучения Яндекса. Он раскрывает, как система эффективно преобразует категориальные (нечисловые) факторы ранжирования, такие как регион, тип сайта или URL, в числовые …
Яндекс патентует метод автоматического создания тезауруса путем анализа контекста, в котором встречаются слова и фразы в больших массивах текста. Система определяет семантические связи (синонимы, антонимы, гиперонимы) на основе схожести их …
Яндекс патентует механизм для борьбы с кликбейтом и нежелательным контентом в рекомендательных системах. Система использует два алгоритма: первый (MLA 1) определяет персональную релевантность на основе интересов пользователя. Второй (MLA 2), …