Яндекс патентует технологию для автоматического обогащения документов контекстной информацией. Система анализирует текст, идентифицирует объекты (сущности), определяет их точное значение в контексте (Дисамбигуация) и выделяет наиболее значимые из них (Salience). Для …
Патенты Яндекс
Яндекс патентует метод ускорения поиска по картинке (CBIR). Вместо индексации отдельных «визуальных слов» (Bag-of-Words), система использует «Составной параметр визуальных признаков» (VFCP). VFCP объединяет несколько визуальных слов и информацию об их …
Яндекс патентует метод исправления опечаток для запросов, которые система видит впервые. Поскольку статистики для нового запроса нет, система находит похожий по написанию и также редкий запрос в истории (запрос-прокси). Исторические …
Яндекс использует систему для определения оптимального соотношения типов контента (видео, статьи, изображения) в ленте рекомендаций для конкретного пользователя. Система сравнивает, насколько активно пользователь взаимодействует с определенным типом контента (CTR или …
Яндекс патентует метод выявления вредоносных сайтов путем анализа несоответствия между подозрительным автоматизированным трафиком и органической популярностью в поиске. Система анализирует логи браузеров, выявляя автоматические запуски сайтов неизвестными программами («первый запуск»). …
Яндекс патентует метод автоматического улучшения своих классификаторов (например, SafeSearch). Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей. Если пользователи массово делятся результатом поиска как примером ошибки (например, шок-контент …
Яндекс патентует систему автоматического контроля качества поиска. Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей, и анализирует посты пользователей (например, скриншоты выдачи с комментариями об ошибках). Обнаруженные ошибки …
Яндекс патентует метод автоматического улучшения классификаторов контента (например, фильтров SafeSearch). Если пользователи массово делятся примерами ошибок поиска (например, шокирующий контент в безопасном режиме), система обнаруживает связанный с этим всплеск трафика …
Патент описывает два метода генерации отрицательных обучающих примеров для моделей ранжирования. Яндекс строит граф связей между запросами и документами на основе поведения пользователей. Документы, находящиеся далеко в графе от исходного …
Яндекс патентует механизм оптимизации функции автодополнения (Search Suggest). Чтобы ускорить поиск, система может заранее загружать страницу результатов (SERP) для самой вероятной подсказки. Патент описывает, как Яндекс определяет, когда стоит выполнять …
Яндекс патентует метод кластеризации поисковых подсказок (саджеста). Система анализирует, насколько подсказка релевантна определенному вертикальному поиску (например, Картинкам или Видео), основываясь на прошлом поведении пользователей. Если связь сильная, подсказки группируются под …
Яндекс патентует метод кластеризации поисковых подсказок (саджеста). Система анализирует исторические данные о том, в какие вертикали (например, Картинки или Видео) пользователи переходили после ввода определенных запросов. Если связь сильная, подсказка …
Яндекс использует алгоритм для группировки похожих документов (например, в Яндекс.Новостях), который оценивает качество кластера по двум метрикам: Когезия (насколько документы внутри похожи друг на друга) и Фокус (насколько тема сконцентрирована …
Яндекс патентует метод для рекомендательных систем, позволяющий прогнозировать векторное представление (эмбеддинг) нового контента до того, как пользователи начали с ним взаимодействовать. Система обучается предсказывать, каким будет поведенческий эмбеддинг (основанный на …
Яндекс использует метод двойного ранжирования для генерации поисковых подсказок на основе изображений. Система формирует два списка: один оптимизирован по частоте (популярности), а второй — по «скрытому параметру интереса» (высокой релевантности, …
Яндекс патентует систему оптимизации рекламной выдачи. Система в реальном времени перебирает различные шаблоны (стенсилы) размещения рекламы, наполняет их наиболее ценными объявлениями (на основе ставок, CTR, релевантности) и выбирает тот шаблон, …
Яндекс патентует метод эффективного обучения системы исправления опечаток без ручной разметки данных. Система автоматически генерирует «реалистичные» и «нереалистичные» опечатки, анализируя частотность символов в логах запросов и физическое расположение клавиш. Затем …
Яндекс патентует метод генерации визуальных подсказок (image-based suggestions). Система использует два параллельных ранжирования: одно основано на частотности (популярности) запросов, а второе — на «скрытом интересе» (высокая релевантность независимо от частоты). …
Яндекс патентует систему для улучшения пользовательского опыта в новостных агрегаторах (например, Яндекс.Новости или Дзен). Система анализирует текст статьи и предсказывает вероятность того, что пользователь захочет искать дополнительную информацию об упомянутой …
Яндекс патентует метод предварительной оценки сайтов для использования в Системе Рекомендаций (например, Дзен). Система анализирует поведенческие метрики и источники трафика сайта (доля прямых заходов, из соцсетей, поиска и т.д.) с …