Яндекс патентует механизм для повышения качества рекомендаций (например, в Дзен) путем выявления и пессимизации кликбейта. Система сравнивает популярность источника контента внутри рекомендательной платформы с его популярностью в интернете в целом. …
Антикачество
Яндекс использует метод для точной идентификации специфических объектов на веб-странице (реклама, логотипы, карты, формы) после ее полной отрисовки браузером. Система анализирует как визуальные характеристики (размер, положение, стиль), так и характеристики …
Яндекс патентует метод для точной настройки порогов срабатывания в системах бинарной классификации (например, Спам/Не спам, Качественный/Некачественный), которые используют «вложенные метрики». Вложенные метрики основаны на взаимосвязанных событиях, таких как «Клики» и …
Яндекс применяет систему фильтрации поисковых подсказок (Autocomplete) для удаления нежелательного контента. Если введенный запрос определяется как «потенциально запрещенный», система использует одну из двух логик: блокировку только специфических негативных продолжений (Черный …
Яндекс патентует гибридный метод точной идентификации объектов на веб-странице (рекламы, логотипов, карт). Система анализирует не только исходный код (теги, скрипты), но и финальные визуальные характеристики объекта после рендеринга (размер, позицию, …
Яндекс патентует метод автоматического улучшения своих классификаторов (например, SafeSearch). Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей. Если пользователи массово делятся результатом поиска как примером ошибки (например, шок-контент …
Яндекс патентует систему автоматического контроля качества поиска. Система отслеживает аномальные всплески поискового трафика, исходящие из социальных сетей, и анализирует посты пользователей (например, скриншоты выдачи с комментариями об ошибках). Обнаруженные ошибки …
Яндекс патентует метод автоматического улучшения классификаторов контента (например, фильтров SafeSearch). Если пользователи массово делятся примерами ошибок поиска (например, шокирующий контент в безопасном режиме), система обнаруживает связанный с этим всплеск трафика …
Яндекс патентует метод эффективного обновления поискового индекса, разделенного на части (шарды). Система классифицирует документы как «активные» (используемые в поиске) и «неактивные» (невостребованные). При обновлении приоритетно выбираются и перестраиваются те части …
Яндекс патентует метод идентификации объектов на веб-странице (таких как реклама, логотипы, карты) путем анализа их характеристик после рендеринга (размер, положение, стиль) и особенностей исходного кода. Система использует машинное обучение для …
Яндекс патентует двухэтапную систему для эффективного обнаружения дубликатов аудиофайлов (например, музыки или аудиодорожек видео). Система создает короткие и длинные аудиосигнатуры (отпечатки) на основе "хромаслов". Сначала она быстро находит кандидатов по …
Яндекс патентует двухэтапный метод для эффективного поиска дубликатов аудиофайлов. Система сначала быстро отбирает кандидатов, сравнивая короткие аудио-отпечатки (например, первые 21 секунды) через специализированный индекс (Pruning Index). Затем она проводит детальную …