Яндекс использует гибридный метод для точного определения времени создания веб-страниц, когда эта информация неизвестна или ненадежна. Система сначала извлекает даты из URL и HTML, оценивая их надежность по иерархии доверия. …
Свежесть контента
Яндекс патентует метод ранжирования, учитывающий свежесть пользовательской активности. Система анализирует агрегированную историю просмотров, присваивая более высокий вес страницам, которые посещались или были созданы недавно. Этот "Ранг Свежести Просмотра" (FBR) рассчитывается …
Яндекс патентует метод расчета авторитетности страниц (Fresh Browse Rank - FBR), который является эволюцией BrowseRank (аналог PageRank на основе логов посещений). FBR учитывает время: он повышает ранг страниц, которые были …
Яндекс патентует метод приоритизации сканирования новых страниц. Система прогнозирует не только общую будущую популярность (количество визитов) страницы, но и скорость, с которой этот интерес будет угасать. Страницы, которые, как ожидается, …
Яндекс использует модель машинного обучения для определения приоритета индексации новых или обновленных страниц. Система оценивает потенциальную «полезность» страницы сразу после сканирования (T1), используя только доступные на этот момент данные. Страницы …
Яндекс патентует метод улучшения поисковых подсказок (саджестов) за счет добавления свежих, трендовых запросов. Система анализирует недавнюю поисковую активность и свежие документы из надежных источников. Она рассчитывает частоту новых запросов, оценивает …
Яндекс патентует систему для быстрого вывода трендовых запросов в поисковые подсказки (саджест). Система решает проблему, когда новые популярные запросы проигрывают исторически частотным. Для этого Яндекс идентифицирует свежие запросы двумя способами: …
Яндекс патентует метод определения неизвестной даты создания веб-страницы путем анализа ссылочного графа. Система рассчитывает вероятность существования каждой ссылки на основе разницы в возрасте между страницами, их качества (Q) и скорости …
Яндекс использует вероятностную модель для определения времени создания веб-страницы, анализируя структуру и время появления ссылок в сети. Система находит дату, которая максимизирует вероятность наблюдаемой структуры ссылочного графа. Этот метод позволяет …
Яндекс патентует метод оценки времени создания веб-страниц, когда эта дата неизвестна или недостоверна. Система использует известные даты, извлекает даты из текста («временные выражения»), а затем распространяет эту информацию по графу …
Яндекс использует статистическую модель для определения времени создания веб-страницы, когда явные даты отсутствуют. Модель основана на предположении, что страницы чаще ссылаются на недавно созданный («Recency») и качественный («Quality») контент. Анализируя …
Яндекс патентует вероятностную модель для определения времени создания веб-страниц путем анализа структуры ссылок. Система максимизирует вероятность наблюдаемой сети ссылок, исходя из предположения, что вероятность ссылки экспоненциально зависит от разницы в …
Яндекс патентует метод определения точного времени создания веб-страницы, когда стандартные методы (анализ URL, контента, временных меток) ненадежны. Система строит сеть связанных страниц и вычисляет вероятность существования ссылок в зависимости от …
Яндекс патентует алгоритм Freshness Browsing Rank (FBR), который динамически оценивает авторитетность страниц на основе истории просмотров пользователей. FBR учитывает дату создания контента и недавнюю активность посещений. Ключевой особенностью является механизм …
Яндекс патентует вероятностный метод для определения времени создания веб-страницы, когда явные данные отсутствуют или недостоверны. Система анализирует граф ссылок, исходя из предположения, что страницы склонны ссылаться на контент схожего возраста …
Яндекс использует систему для оптимизации графиков сканирования, прогнозируя как долгосрочную популярность нового URL, так и скорость угасания этой популярности (краткосрочный интерес). Рассчитывая «Параметр выгоды от сканирования» на основе этих прогнозов, …
Яндекс патентует метод оптимизации очереди сканирования. Система прогнозирует не только общую будущую популярность новой страницы, но и то, как быстро эта популярность будет снижаться. Используя машинное обучение, обученное на исторических …
Яндекс патентует метод ранжирования «свежего» контента (Non-Native Items), по которому еще нет статистики, в 2D-выдаче (например, Яндекс Картинки). Система предсказывает «Оценку Полезности» (Usefulness Score), анализируя, как пользователи взаимодействуют с элементом …
Яндекс использует машинное обучение для оптимизации очереди сканирования. Система прогнозирует будущую долгосрочную популярность новой страницы и скорость угасания этой популярности, анализируя исторические данные похожих URL-структур (паттернов). На основе этого рассчитывается …
Яндекс патентует метод ранжирования свежего контента (например, картинок или видео) в 2D-сетке, по которому еще нет статистики. Система рассчитывает «Оценку Полезности» нового элемента, анализируя клики по нему (позитивный сигнал, Win) …