Яндекс использует гибридный метод для точного определения времени создания веб-страниц, когда эта информация неизвестна или ненадежна. Система сначала извлекает даты из URL и HTML, оценивая их надежность по иерархии доверия. …
2018
Яндекс использует механизм «Exploration vs. Exploitation» для решения проблемы «холодного старта» новых документов, у которых нет накопленных поведенческих данных. Система предсказывает их потенциальную релевантность на основе контента и структуры, вычисляет …
Яндекс патентует метод клиентской персонализации. Система отслеживает детальные взаимодействия пользователя (скорость скроллинга, движения мыши, копирование текста) прямо на его устройстве. На основе этих данных локально обучается персональная модель ранжирования. Затем …
Яндекс патентует систему персонализации агрегированного поиска (блендинга). Система анализирует историю кликов пользователя, чтобы определить его предпочтения к различным типам контента (веб, видео, изображения и т.д.). На основе этих данных вычисляется …
Яндекс патентует механизм балансировки между показом проверенных результатов (Эксплуатация) и тестированием новых документов (Экспериментирование), используя подход «Многорукий бандит». Система предсказывает релевантность документов без истории поведения, вычисляет «Оценку эксперимента» и принудительно …
Яндекс патентует метод оценки интересов пользователя путем перевода разнородных событий (поисковые запросы, посещенные сайты, геолокация) в единое векторное пространство. Система использует иерархию нейронных сетей для создания эмбеддингов, отражающих поведение на …
Яндекс автоматически создает тезаурус, анализируя большие объемы текста на основе дистрибутивной семантики. Система изучает контекст (соседние слова), в котором употребляются слова и фразы, и частоту их совместного появления в одном …
Яндекс патентует метод определения неизвестной даты создания веб-страницы путем анализа ссылочного графа. Система рассчитывает вероятность существования каждой ссылки на основе разницы в возрасте между страницами, их качества (Q) и скорости …
Яндекс использует машинное обучение для определения оригинального источника (первоисточника) контента, который был многократно перепечатан. Система группирует похожие публикации в тематические кластеры и анализирует исходящие ссылки внутри этого кластера. Учитывая репутацию …
Патент Яндекса описывает двухкомпонентную систему генерации персональных рекомендаций. Первый компонент (офлайн) оценивает качество и пригодность сайтов (Source Suitability) на основе агрегированных поведенческих метрик и трафика. Второй компонент (онлайн) формирует ленту, …
Яндекс патентует механизм предварительной квалификации сайтов для рекомендательных систем. Система использует машинное обучение для оценки «Параметра Пригодности Источника» (Source Suitability Parameter) на основе анализа поведенческих метрик (глубина просмотра, время на …
Яндекс патентует метод оценки важности предложений в тексте для создания резюме (сниппетов) и определения тематики документа без использования внешних словарей. Система разбивает текст на «концептуальные фразы» и оценивает их значимость …
Яндекс патентует систему рекомендаций медиаконтента (например, видео), которая определяет схожесть объектов, комбинируя совпадение тегов (тематика, жанр) с поведенческими метриками (время просмотра, CTR). Запатентованная формула использует сумму поведенческих показателей обоих объектов …
Яндекс патентует метод выявления вредоносных или нежелательных сайтов путем анализа логов браузера и истории поиска. Система отслеживает подозрительные автоматические открытия сайтов (не инициированные пользователем) и сравнивает их частоту с популярностью …
Яндекс патентует механизм интерактивных поисковых подсказок (саджеста). Система не просто дополняет запрос, но и выполняет фоновый «прокси-поиск» по вертикальным доменам (погода, карты, факты). Готовый ответ, ссылка или виджет выводится прямо …
Яндекс использует метод для рекомендации «Областей интереса» (AOI) на картах, основанный на анализе плотности геотегов пользовательских фотографий. Система автоматически определяет границы популярных зон и подбирает их размер в соответствии с …
Яндекс автоматически создает тезаурус, анализируя контекст использования слов и фраз в большом корпусе текстов. Система определяет семантические связи (синонимы, антонимы, гиперонимы, ассоциации), сравнивая, насколько похожи контексты разных слов и как …
Яндекс патентует метод оценки результатов A/B тестирования, который фокусируется на тренде вовлеченности пользователя, а не только на средних значениях. Используя Дискретное Преобразование Фурье, система вычисляет метрики «Амплитуда» (величина изменения) и …
Яндекс патентует метод создания краткого изложения текста (например, для сниппетов в SERP) путем анализа самого текста без внешних онтологических словарей. Система выделяет «концептуальные фразы» и оценивает их важность на основе …
Яндекс патентует метод автоматического создания тезауруса (базы синонимов, антонимов, гиперонимов и ассоциаций) путем анализа больших массивов текста. Система определяет семантическую связь между словами или фразами, сравнивая контекст, в котором они …