В рамках своей missão по созданию открытых LLM для индийских исследователей и разработчиков, инициатива BharatGen, при поддержке правительства, представила двухъязычную модель Param 1 с 2.9 миллиарда параметров. Эта модель, названная ‘BharatGen Param 1 Indic Scale’, построена с нуля и включает не менее 25% данных на индийских языках, что резко контрастирует с типичными 0.01% в моделях, таких как Llama от Meta.
BharatGen утверждает, что предварительная подготовка моделей — это гигантская задача. Команда теперь предлагает разработчикам возможность тонкой настройки модели через AIKosha, создавая приложения, от чат-ботов до систем знаний.
Кроме того, было запущено 20 новых моделей речи, охватывающих 19 различных индийских языков, что адресует пробел в области доступных высококачественных моделей. Эти достижения помогут ускорить инновации в области ИИ в Индии, как отметил Ganesh Ramakrishnan, руководитель проекта.
С целью создания моделей, которые действительно ‘говорят’ для Индии, BharatGen приглашает сообщество участвовать в этом проекте. Это пример того, как инициатива государственного масштаба может направить науку и технологии в полезное русло, обеспечивая среду для роста стартапов и интеграторов систем.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
