Яндекс использует машинное обучение для идентификации оригинального источника контента среди множества перепечаток. Система группирует похожие публикации в «тематические кластеры» и анализирует исходящие ссылки внутри них. Оценивая репутацию источников, время публикации …
Яндекс Новости
Яндекс патентует метод идентификации оригинального источника информации среди множества перепечаток. Система кластеризует похожие документы по теме, извлекает исходящие ссылки и использует машинное обучение для определения первоисточника. Ключевые факторы анализа включают …
Яндекс патентует метод оценки важности новостных событий для push-уведомлений. Важность рассчитывается как произведение авторитетности источника (Source Weight), определяемой по его реальному трафику (логи браузеров, Метрика, клики из поиска), и свежести …
Яндекс использует машинное обучение для определения оригинального источника (первоисточника) контента, который был многократно перепечатан. Система группирует похожие публикации в тематические кластеры и анализирует исходящие ссылки внутри этого кластера. Учитывая репутацию …
Яндекс патентует метод анализа контента для автоматического предоставления контекстной информации. Система идентифицирует объекты (сущности) в тексте, определяет их наиболее вероятное значение (устраняет неоднозначность) и рассчитывает оценку значимости (Context Relevancy Score). …
Яндекс использует алгоритм для кластеризации документов (например, новостных статей), освещающих одну тему. Система рассчитывает «Обобщенную Метрику», основанную на том, насколько документы дополняют друг друга (Первая Метрика) и насколько они «разбавляют» …
Яндекс патентует метод автоматического выбора «срочных новостей» для отправки Push-уведомлений. Система рассчитывает «Оценку Значимости» новости, комбинируя два ключевых фактора: авторитетность источника (определяемую по объему его трафика, измеренного через сервисы Яндекса) …
Яндекс использует машинное обучение для анализа новостных статей и прогнозирования вероятности того, что пользователь захочет найти дополнительную информацию об упомянутых сущностях (людях, местах, событиях). Система анализирует исторические данные о поведении …
Яндекс патентует систему для новостных агрегаторов, которая анализирует текст статьи и предсказывает вероятность того, что пользователь захочет найти дополнительную информацию об упомянутых объектах (людях, местах). Система обучается на исторических данных …
Яндекс использует алгоритм для группировки похожих документов (например, в Яндекс.Новостях), который оценивает качество кластера по двум метрикам: Когезия (насколько документы внутри похожи друг на друга) и Фокус (насколько тема сконцентрирована …
Яндекс патентует систему для улучшения пользовательского опыта в новостных агрегаторах (например, Яндекс.Новости или Дзен). Система анализирует текст статьи и предсказывает вероятность того, что пользователь захочет искать дополнительную информацию об упомянутой …
Яндекс патентует метод кластеризации документов для агрегаторов (например, Яндекс.Новости). Система использует комбинированную метрику, которая балансирует, насколько документы дополняют друг друга (Complementariness), и насколько они повторяют информацию или размывают тему (Dilution). …
Яндекс патентует метод для автоматического определения авторства цитат в новостных агрегаторах (например, Яндекс.Новости). Система анализирует множество статей на одну тему, извлекает похожие цитаты и определяет потенциальных авторов для каждой из …
Яндекс патентует систему для сервисов агрегации новостей (например, Яндекс.Новости), которая анализирует множество статей на одну тему для определения точного авторства цитат. Система извлекает цитаты и кандидатов в авторы, кластеризует похожие …
Яндекс патентует инфраструктурный метод для высокоэффективного сжатия инвертированного индекса. Система использует блочное кодирование с предопределенными шаблонами (Encoding Patterns). Это позволяет уменьшить размер индекса в оперативной памяти и значительно ускорить декодирование …