Google DeepMind анонсировала новый Frontier Safety Framework — подход к анализу и минимизации будущих рисков, связанных с продвинутыми моделями ИИ. Эта инициатива нацелена на то, чтобы предотвратить возможные негативные последствия, которых могут вызвать мощные ИИ-системы, например, в областях автономии, кибербезопасности и биобезопасности.
Новый фреймворк включает в себя набор протоколов для идентификации и смягчения опасных возможностей, которые могут возникнуть в будущем. Он направлен на оценку рисков от критических уровней способностей, которые могут быть использованы злоумышленниками для выполнения вредоносных действий. Например, важно выяснить, как ИИ может повлиять на распространение моделей с опасными характеристиками или ускорить эскалацию ИИ-возможностей.
DeepMind планирует полностью реализовать этот фреймворк к началу 2025 года и ожидает, что он будет развиваться по мере накопления знаний и практического опыта в этой области. Главное, чтобы мы могли сбалансировать инновации и меры по безопасности, что является важным аспектом ответственного развития технологий ИИ.
Также стоит отметить, что работы по этому направлению будут активно проводиться в партнерстве с Академией, правительственными структурами и другими игроками в сфере технологий.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
