Ранжирование

Как Яндекс использует графы совместных посещений для выявления накрутки поведенческих факторов (ПФ)

2021 • Антикачество • Антиспам • Ранжирование

RU2019128025A 2021-03-05 2019-09-05

Яндекс патентует метод выявления аномального трафика (накрутки ПФ) путем анализа истории посещений пользователей. Система строит граф, связывающий сайты, которые часто посещаются одними и теми же пользователями. Если группа сайтов сильно …

Как Яндекс обучает модель ранжирования на основе детализированных поведенческих факторов (параметров постпросмотра)

2017 • Обучение моделей • Поведенческие факторы • Ранжирование

RU2608886C2 2017-01-25 2014-06-30

Яндекс патентует метод оптимизации ранжирования, основанный на детальном анализе поведения пользователей после просмотра выдачи («параметры постпросмотра»). Система автоматически определяет вес различных поведенческих сигналов (клики, время просмотра, пропуски, удовлетворяющие клики) для …

Как Яндекс нормализует оценку качества сайта, корректируя ее в зависимости от объема трафика и лояльности аудитории

2022 • Антиспам • Метрики качества поиска • Поведенческие факторы • Ранжирование

RU2020142447A 2022-06-22 2020-12-22

Яндекс использует механизм для корректировки оценки качества сайта, сравнивая ее с эталонным значением, ожидаемым для сайтов с аналогичным объемом трафика или уровнем лояльности. Если сайт показывает аномально высокие метрики качества …

Как Яндекс (в алгоритме CatBoost) обрабатывает категориальные признаки (Хосты, URL, Регионы) и борется с переобучением в ранжировании

2022 • Обучение моделей • Поведенческие факторы • Ранжирование

US11256991B2 2022-02-22 2018-06-05

Патент раскрывает ядро алгоритма CatBoost — основного метода машинного обучения Яндекса для ранжирования. Он описывает, как система преобразует категориальные признаки (например, URL, домен, регион) в числовые значения. Чтобы избежать переобучения …

Как Яндекс автоматически создает и проверяет относительные факторы ранжирования на основе контекста SERP

2022 • SERP • Обучение моделей • Ранжирование

US11308097B2 2022-04-19 2019-07-05

Яндекс патентует систему автоматического создания «мета-признаков» для улучшения ранжирования. Эти признаки рассчитываются не изолированно для документа, а в контексте всей поисковой выдачи (SERP). Например, система оценивает значение фактора (скажем, CTR) …

Как Яндекс прогнозирует популярность контента (видео, статей, музыки) используя данные о ссылках, встраиваниях и поведении пользователей

2017 • SERP • Обучение моделей • Ранжирование

RU2635905C2 2017-11-16 2015-09-23

Яндекс патентует систему прогнозирования популярности контента (например, просмотров видео), особенно размещенного на внешних платформах. Система агрегирует данные из трех источников: поисковые логи (клики в SERP), логи браузера (прямые заходы) и …

Как Яндекс обучает трансформерные модели (YATI) для ранжирования, комбинируя данные о кликах и оценки асессоров

2024 • Асессоры • Обучение моделей • Поведенческие факторы • Ранжирование

RU2824338C2 2024-08-07 2021-12-02

Яндекс использует многоэтапный процесс для обучения трансформерных моделей (типа BERT/YATI). Модель сначала обучается на миллиардах кликов (прогнозируя поведение), затем дообучается на миллионах оценок асессоров (понимая качество). Ключевой этап — перенос …

Как Яндекс использует долгосрочную историю поиска и контекст текущей сессии для глубокой персонализации ранжирования

2024 • Персонализация • Поведенческие факторы • Ранжирование

RU2023102134A 2024-07-31 2023-01-31

Яндекс применяет двухкомпонентную систему машинного обучения для персонализации выдачи. Первая модель агрегирует долгосрочную историю поиска пользователя в компактное векторное представление (профиль интересов). Вторая модель в реальном времени использует этот вектор …

Как Яндекс модифицирует инвертированный индекс на основе кликов, позволяя документам ранжироваться по терминам, которых в них нет

2020 • Индексация • Поведенческие факторы • Ранжирование

RU2718435C2 2020-04-02 2014-07-08

Яндекс патентует метод обогащения инвертированного индекса поведенческими данными. Если пользователи кликают на документ, в котором отсутствует один из терминов запроса (найденный благодаря «Правилу Кворума»), система добавляет в индекс «неявную словопозицию» …

Как Яндекс создает векторы аннотации документа, объединяя лингвистику запросов и поведение пользователей

2020 • Интент пользователя • Поведенческие факторы • Ранжирование

RU2720074C2 2020-04-23 2017-12-29

Яндекс патентует метод генерации факторов ранжирования, называемых «векторами аннотации». Система анализирует все прошлые запросы, по которым пользователи находили конкретный документ, изучает лингвистические характеристики этих запросов и фиксирует поведение пользователей (клики, …

Как Яндекс использует исторически успешные паттерны поиска (пары Запрос-Документ) для переранжирования текущей выдачи

2020 • SERP • Поведенческие факторы • Ранжирование

US20200012652A1 2020-01-09 2019-01-23

Яндекс использует механизм переранжирования, основанный на исторических данных (логи поведения или оценки асессоров). Система находит прошлые пары «запрос-документ», похожие на текущую ситуацию. Если прошлая пара была высоко оценена (например, имела …

Как Яндекс создает профиль релевантности документа на основе запросов, которые к нему приводят, и поведения пользователей

2019 • Поведенческие факторы • Ранжирование • Семантический поиск

US20190205385A1 2019-07-04 2018-11-14

Яндекс патентует метод генерации «Аннотационных векторов» для документов. Эти векторы агрегируют лингвистические характеристики всех запросов, по которым пользователи находили документ, и связанные с ними поведенческие метрики (CTR, Dwell Time). Система …

Как Яндекс использует алгоритмы «Многорукого бандита» для тестирования и продвижения новых документов в ТОП выдачи

2018 • SERP • Поведенческие факторы • Ранжирование • Холодный старт

US10102292B2 2018-10-16 2016-05-17

Яндекс использует механизм «Exploration vs. Exploitation» для решения проблемы «холодного старта» новых документов, у которых нет накопленных поведенческих данных. Система предсказывает их потенциальную релевантность на основе контента и структуры, вычисляет …

Как Яндекс обучает персонализированные модели ранжирования прямо на устройстве пользователя, используя данные о микроповедении (скроллинг, движение мыши)

2018 • Персонализация • Поведенческие факторы • Ранжирование

US10061820B2 2018-08-28 2015-01-27

Яндекс патентует метод клиентской персонализации. Система отслеживает детальные взаимодействия пользователя (скорость скроллинга, движения мыши, копирование текста) прямо на его устройстве. На основе этих данных локально обучается персональная модель ранжирования. Затем …

Как Яндекс индексирует и ранжирует страницы без ключевых слов в тексте, используя данные о поведении пользователей в сессии

2017 • Индексация • Поведенческие факторы • Ранжирование • Семантический поиск

RU2606309C2 2017-01-10 2015-06-09

Яндекс патентует метод создания «Аннотированного Поискового Индекса». Если пользователи в рамках одной поисковой сессии переходят с релевантной страницы на другую и проводят там значительное время (например, более 30 секунд), вторая …

Как Яндекс автоматически перенаправляет пользователя на сайт, минуя SERP, если уверен в результате

2019 • SERP • Интент пользователя • Навигационные запросы • Ранжирование

US10445384B2 2019-10-15 2014-05-29

Яндекс патентует механизм автоматического «Мгновенного Ответа». Если система определяет, что один документ значительно релевантнее остальных (Relevancy Differential) и с высокой вероятностью полностью удовлетворяет запрос (Likelihood Parameter, основанный на анализе Заголовка, …

Как Яндекс автоматически определяет вес поведенческих факторов для обучения формулы ранжирования

2016 • Обучение моделей • Поведенческие факторы • Ранжирование

US9501575B2 2016-11-22 2015-09-25

Яндекс патентует метод автоматического определения важности (веса) различных поведенческих сигналов (клики, dwell time, пропуски). Система создает и оптимизирует «Целевую функцию», которая оценивает релевантность на основе этих сигналов. Затем эта функция …

Как Яндекс использует текстовую схожесть для переноса поведенческих сигналов с известных запросов на новые при ранжировании

2023 • Обучение моделей • Поведенческие факторы • Ранжирование • Семантический поиск • Холодный старт

US11681713B2 2023-06-20 2019-02-15

Яндекс патентует метод улучшения ранжирования для новых или редких запросов. Система использует модель (Second MLA), обученную предсказывать поведенческую схожесть запросов на основе их текста. Для нового запроса находятся похожие прошлые …

Как Яндекс комбинирует клики пользователей и оценки асессоров для обучения нейросетевых моделей ранжирования (например, YATI)

2023 • Асессоры • Обучение моделей • Ранжирование

RU2021135486A 2023-10-05 2021-12-02

Патент Яндекса описывает многоэтапный процесс обучения моделей ранжирования (вероятно, трансформеров типа YATI). Система сначала обучается на огромном массиве данных о кликах пользователей, а затем дообучается на меньшем, но более качественном …

Как Яндекс (CatBoost) обрабатывает ключевые SEO-факторы (URL, домены, авторов) для улучшения ранжирования и борьбы с переобучением

2019 • Обучение моделей • Поведенческие факторы • Ранжирование

US20190164085A1 2019-05-30 2018-06-06

Патент Яндекса, лежащий в основе алгоритма CatBoost, описывает методы обработки категориальных признаков (таких как URL, домены, имена авторов) в машинном обучении. Система преобразует эти признаки в числа, используя упорядоченную статистику …