Качество контента

Яндекс патентует метод идентификации объектов на веб-странице (таких как реклама, логотипы, карты) путем анализа их характеристик после рендеринга (размер, положение, стиль) и особенностей исходного кода. Система использует машинное обучение для …
Яндекс патентует метод кластеризации документов для агрегаторов (например, Яндекс.Новости). Система использует комбинированную метрику, которая балансирует, насколько документы дополняют друг друга (Complementariness), и насколько они повторяют информацию или размывают тему (Dilution). …
Яндекс патентует систему для сервисов агрегации новостей (например, Яндекс.Новости), которая анализирует множество статей на одну тему для определения точного авторства цитат. Система извлекает цитаты и кандидатов в авторы, кластеризует похожие …
Яндекс патентует метод для автоматического определения авторства цитат в новостных агрегаторах (например, Яндекс.Новости). Система анализирует множество статей на одну тему, извлекает похожие цитаты и определяет потенциальных авторов для каждой из …
Яндекс патентует метод машинного обучения для автоматической трансформации текста. Система анализирует пары «исходная фраза» и «целевая фраза», сравнивая грамматические и семантические признаки слов. На основе этого анализа она генерирует правила …
Яндекс патентует метод оптимизации производительности Progressive Web Applications (PWA). Система определяет общие статические элементы (шаблоны, скрипты), используемые на нескольких страницах (например, с общим префиксом URL), и сохраняет их в локальном …
Яндекс использует систему для ускорения идентификации почти дубликатов (near-duplicates) видео во время индексации. Вместо медленного сравнения содержания каждого видеофайла система сначала проверяет схожесть их продолжительности. Допустимая разница (variance parameter) динамически …
Яндекс патентует метод оптимизации поиска почти дублирующихся видеофайлов. Чтобы избежать дорогостоящего сравнения всех видео, система сначала фильтрует кандидатов по длительности. Допустимое отклонение длительности рассчитывается динамически (например, как процент от оригинала) …
Яндекс патентует метод для консолидации определений и переводов слов, полученных из разных источников (например, разных словарей). Система анализирует полученные данные, находит дубликаты или схожие варианты и объединяет их в кластеры. …
Яндекс использует систему для улучшения пользовательского опыта в сервисах перевода и словарей (например, Яндекс.Словари). Вместо показа повторяющихся определений из разных источников, система парсит ответы, определяет основной источник и кластеризует схожие …