Совсем недавно команда исследователей представила третью версию Фронтальной рамки безопасности (FSF), направленную на минимизацию рисков, связанных с мощными моделями ИИ. В условиях стремительных изменений в мире технологий важно уделять особое внимание не только достижению новых вершин, но и управлению потенциальными опасностями.
Ключевым моментом нового обновления стало введение уровня критической способности (CCL), который касается манипулятивных возможностей моделей ИИ. Эти возможности могут быть использованы для изменения восприятия и поведения пользователей, что создает серьезные риски, если такие технологии окажутся в неправильных руках. Команда активно сотрудничает с экспертами из разных областей, чтобы разобраться с такими угрозами и разработать стратегии минимизации.
Кроме того, обновленная рамка также адаптирована к сценариям, когда модели ИИ могут выходить из-под контроля, что требует от операторов повышенного внимания и готовности действовать. Авторы документа подчеркивают важность системных оценок, способствующих научному подходу к управлению рисками в области ИИ.
Следующим шагом станет внедрение предложенных улучшений в реальную практику, чтобы гарантировать, что ИИ будет служить на благо человечества, а не представлять собой угрозу.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
