Свежесть контента

Яндекс использует гибридный метод для точного определения времени создания веб-страниц, когда эта информация неизвестна или ненадежна. Система сначала извлекает даты из URL и HTML, оценивая их надежность по иерархии доверия. …
Яндекс патентует метод ранжирования, учитывающий свежесть пользовательской активности. Система анализирует агрегированную историю просмотров, присваивая более высокий вес страницам, которые посещались или были созданы недавно. Этот "Ранг Свежести Просмотра" (FBR) рассчитывается …
Яндекс патентует метод расчета авторитетности страниц (Fresh Browse Rank - FBR), который является эволюцией BrowseRank (аналог PageRank на основе логов посещений). FBR учитывает время: он повышает ранг страниц, которые были …
Яндекс патентует метод приоритизации сканирования новых страниц. Система прогнозирует не только общую будущую популярность (количество визитов) страницы, но и скорость, с которой этот интерес будет угасать. Страницы, которые, как ожидается, …
Яндекс использует модель машинного обучения для определения приоритета индексации новых или обновленных страниц. Система оценивает потенциальную «полезность» страницы сразу после сканирования (T1), используя только доступные на этот момент данные. Страницы …
Яндекс патентует метод улучшения поисковых подсказок (саджестов) за счет добавления свежих, трендовых запросов. Система анализирует недавнюю поисковую активность и свежие документы из надежных источников. Она рассчитывает частоту новых запросов, оценивает …
Яндекс патентует систему для быстрого вывода трендовых запросов в поисковые подсказки (саджест). Система решает проблему, когда новые популярные запросы проигрывают исторически частотным. Для этого Яндекс идентифицирует свежие запросы двумя способами: …
Яндекс патентует метод определения неизвестной даты создания веб-страницы путем анализа ссылочного графа. Система рассчитывает вероятность существования каждой ссылки на основе разницы в возрасте между страницами, их качества (Q) и скорости …
Яндекс использует вероятностную модель для определения времени создания веб-страницы, анализируя структуру и время появления ссылок в сети. Система находит дату, которая максимизирует вероятность наблюдаемой структуры ссылочного графа. Этот метод позволяет …
Яндекс патентует метод оценки времени создания веб-страниц, когда эта дата неизвестна или недостоверна. Система использует известные даты, извлекает даты из текста («временные выражения»), а затем распространяет эту информацию по графу …
Яндекс использует статистическую модель для определения времени создания веб-страницы, когда явные даты отсутствуют. Модель основана на предположении, что страницы чаще ссылаются на недавно созданный («Recency») и качественный («Quality») контент. Анализируя …
Яндекс патентует вероятностную модель для определения времени создания веб-страниц путем анализа структуры ссылок. Система максимизирует вероятность наблюдаемой сети ссылок, исходя из предположения, что вероятность ссылки экспоненциально зависит от разницы в …
Яндекс патентует метод определения точного времени создания веб-страницы, когда стандартные методы (анализ URL, контента, временных меток) ненадежны. Система строит сеть связанных страниц и вычисляет вероятность существования ссылок в зависимости от …
Яндекс патентует алгоритм Freshness Browsing Rank (FBR), который динамически оценивает авторитетность страниц на основе истории просмотров пользователей. FBR учитывает дату создания контента и недавнюю активность посещений. Ключевой особенностью является механизм …
Яндекс патентует вероятностный метод для определения времени создания веб-страницы, когда явные данные отсутствуют или недостоверны. Система анализирует граф ссылок, исходя из предположения, что страницы склонны ссылаться на контент схожего возраста …
Яндекс использует систему для оптимизации графиков сканирования, прогнозируя как долгосрочную популярность нового URL, так и скорость угасания этой популярности (краткосрочный интерес). Рассчитывая «Параметр выгоды от сканирования» на основе этих прогнозов, …
Яндекс патентует метод оптимизации очереди сканирования. Система прогнозирует не только общую будущую популярность новой страницы, но и то, как быстро эта популярность будет снижаться. Используя машинное обучение, обученное на исторических …
Яндекс патентует метод ранжирования «свежего» контента (Non-Native Items), по которому еще нет статистики, в 2D-выдаче (например, Яндекс Картинки). Система предсказывает «Оценку Полезности» (Usefulness Score), анализируя, как пользователи взаимодействуют с элементом …
Яндекс использует машинное обучение для оптимизации очереди сканирования. Система прогнозирует будущую долгосрочную популярность новой страницы и скорость угасания этой популярности, анализируя исторические данные похожих URL-структур (паттернов). На основе этого рассчитывается …
Яндекс патентует метод ранжирования свежего контента (например, картинок или видео) в 2D-сетке, по которому еще нет статистики. Система рассчитывает «Оценку Полезности» нового элемента, анализируя клики по нему (позитивный сигнал, Win) …