Исследователи Microsoft объединили силу компактных нейросетей и анонсировали BitNet b1.58 2B4T — первую в мире 1-битную модель весом 2 миллиарда параметров. Разработанная с использованием всего трёх значений для весов (-1, 0 и 1), эта модель обещает значительно улучшить производительность и экономить память на маломощных устройствах, включая процессоры Apple M2.
BitNet b1.58 2B4T демонстрирует высокую скорость работы, превосходя традиционные модели в некоторых задачах, таких как математические тесты и физический здравый смысл. Однако, для достижения этих результатов нужно использовать специальный фреймворк Microsoft, что ограничивает совместимость модели.
Лишь время покажет, сможет ли BitNet занять свое место в разнообразном мире ИИ, однако уже сейчас он представляет собой захватывающий шаг к более эффективным моделям для ограниченных устройств.
В то же время, исследователи из Университета Карнеги — Меллона презентовали LegoGPT — нейросеть, генерирующую схемы сборки моделей из деталей Lego. Она способна преобразовать текстовые описания в изображения и пошаговые инструкции, опираясь на обширный датасет Lego. Этот проект также открыт для использования, что вдохновляет на новые эксперименты в мире конструктора.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
