В рамках своей миссии создать открытые языковые модели для индийских исследователей, правительственный проект BharatGen представил новую языковую модель Param 1 с 2.9 миллиарда параметров. Эта двуязычная модель, разработанная с нуля, использует 25% индийских данных — в то время как другие известные модели, такие как Llama от Meta, имеют лишь 0.01%. Это важный шаг в развитии технологий ИИ в Индии.
BharatGen стремится преодолеть барьеры предобучения, предлагая прочную основу для адаптации под конкретные приложения. Модель будет доступна для разработчиков через платформу AIKosha, что позволит создавать разнообразные приложения, начиная от индийских чат-ботов до систем знаний.
Кроме того, команда разработчиков также представила 20 новых моделей речи для 19 индийских языков, что позволит улучшить голосовые интерфейсы для пользователей. Все эти модели созданы с использованием уникальных данных, собранных специально для индийских языков, и направлены на устранение недостатка качественных публичных моделей.
С запуском Param 1 BharatGen уверенно движется к созданию собственных ИИ-моделей, что поддерживает видение индийского правительства по развитию технологий ИИ в стране.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
