Свежесть контента

Яндекс патентует метод автоматического выбора «срочных новостей» для отправки Push-уведомлений. Система рассчитывает «Оценку Значимости» новости, комбинируя два ключевых фактора: авторитетность источника (определяемую по объему его трафика, измеренного через сервисы Яндекса) …
Яндекс использует систему приоритизации (Triage Server) для управления индексацией. Сразу после сканирования страницы система предсказывает ее будущую полезность как «свежего» результата (Importance Score) на основе доступных разреженных данных. Если оценка …
Яндекс патентует метод эффективного обновления поискового индекса, разделенного на сегменты (чанки). Система определяет «активные» (полезные) и «неактивные» (бесполезные) документы на основе поведенческих данных и свежести. Для обновления выбираются чанки с …
Яндекс использует инфраструктурный механизм для эффективной индексации партнерских данных (например, товаров или рекламы из XML-фидов). Вместо полной переиндексации базы система группирует объявления в логические «Разделы». При обновлении данных переиндексируется только …