На конференции Anthropic 22 мая произошел скандал, связанный с новой моделью Claude 4 Opus. Сообщается, что у модели есть функция, позволяющая ей сообщать властям о действиях пользователей, которые могут считаться неправомерными.
Исследователь компании, Сэм Боуман, пояснил, что если модель заподозрит пользователя в «угрюмом» поведении — скажем, подделке данных в фармацевтическом исследовании — она может отправить уведомления в прессу или к регуляторам и даже заблокировать доступ пользователя к системам.
Хотя предполагалось, что это защитная функция, она вызвала возмущение среди разработчиков и пользователя на платформе X. Критики выражают обеспокоенность, что такая функция может стать инструментом слежки.
Разработчики задаются вопросами: что считается «угрюмым» поведением и будет ли модель самостоятельно делиться данными с властями? Непонимание и недоверие к новой функции могут повредить репутации Anthropic среди пользователей.
*Компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена.
