Недавнее исследование, представленное Марком-Аурелио Ранзато и Амалем Раннен-Трики, бросает свет на проблемы эффективности современных моделей глубокого обучения (DL). В итоге масштабирования, многие из таких моделей требуют колоссальных вычислительных ресурсов. Когда новая информация появляется, их часто необходимо переобучать с нуля, что значительно затрудняет их применение.
Цель новой работы, озаглавленной NEVIS’22: A Stream of 100 Tasks Sampled From 30 Years of Computer Vision Research, заключается в создании базы для изучения эффективной передачи знаний между задачами. NEVIS’22 включает 106 задач из трех десятилетий, представляющих ключевые моменты в области компьютерного зрения.
Организация задач хронологически создает условия для эффективного обучения, где модели могут заимствовать знания из предыдущих задач. Исследования показывают, что наиболее эффективные модели используют подходы к переносу обучения, что открывает новые горизонты для исследований.
Откройте для себя NEVIS’22 и узнайте больше, прочитав наше исследование и загружаю наше программное обеспечение.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
