Nvidia приобретает стартап Gretel для генерации синтетических данных

Nvidia, известный игрок в сфере высокопроизводительных вычислений, объявила о приобретении стартапа Gretel за сумму в девятизначном диапазоне. Точные условия сделки не разглашаются, но по информации источников, цена превышает последнюю оценку Gretel в $320 миллионов. С командой из 80 сотрудников, Gretel станет частью растущего портфолио облачных сервисов Nvidia для разработчиков, включая инструменты генерации синтетических данных.

Синтетические данные, созданные на компьютере и имитирующие реальные данные, обещают решить проблему нехватки данных для обучения моделей ИИ. Эта технология позволяет разработчикам создавать впечатляюще обширные наборы данных, что особенно важно в условиях конфиденциальности личной информации. Например, больницы могут создавать модели для отслеживания заболеваний на основе анонимизированной информации.

Пока эксперты настороженно относятся к полному переходу на синтетические данные из-за потенциальных рисков, таких как возможность их «коллапса», Nvidia продолжает развивать эту область. В 2022 году компания запустила Omniverse Replicator, который предоставляет разработчикам возможность генерировать реалистичные 3D-данные для тренировки нейросетей. Синтетические данные становятся новой надеждой для многих в индустрии ИИ, однако главный вопрос остается: как сбалансировать использование синтетических и реальных данных для достижения наилучших результатов?