Компания ByteDance представила новинку — Seedream 3.0, новую модель для преобразования текста в изображения. Эта система работает быстрее, точнее и создает более реалистичные портреты, превосходя конкурентов вроде Midjourney v6.1. Seedream 3.0 обучалась на большем объеме данных, включая ранее исключённые изображения, и использует инновационные техники обучения для высокого качества даже при разных размерах изображений. Модель способна генерировать 2K изображения всего за три секунды.
Особенностью стал кооператив с текстом: модель отлично справляется с заданиями с множеством текста, достигая 94% точности при переводе на английский и китайский языки. Благодаря подробным эстетическим описаниям, показатели превосходят GPT-4o и соседи по рынку, такие как Canva, особенно в типографике и стилистике.
Также ByteDance показала SeedEdit — инструмент для редактирования изображений и текста, который точнее сохраняет изображение без искажений. В целом, Seedream 3.0 обещает стать конкурентоспособной альтернативой ведущим системам, а компании планируют интеграцию с платформой Doubao, расширяя возможности генерации и редактирования визуального контента.
