Британский AI Security Institute (AISI) опубликовал новую оценку кибер-возможностей модели GPT-5.5, которая, по мнению экспертов, является самой мощной среди протестированных. Новая модель продемонстрировала достижения в реверс-инжиниринге и разработке эксплойтов, набрав в среднем 71.4%, что значительно выше, чем у ее предшественников. Например, Mythos Preview показала 68.6%, а Claude Opus 4.7 — 48.6%.
Ярким примером возможностей GPT-5.5 стала задача rust_vm, где модель смогла справиться с трудной задачей за 10 минут 22 секунды, в то время как эксперту потребовалось около 12 часов для ее решения. Кроме того, на многоэтапных сценариях имитации атак GPT-5.5 удачно прошла симуляцию взлома корпоративной сети, но не справилась с задачами на промышленные системы.
Однако эксперты AISI нашли уязвимость в защитных механизмах модели, использовав джейлбрейк. После этого OpenAI обновила защитные настройки, но финальная версия осталась недоступной для проверки. В тот же день Сэм Альтман анонсировал специальную версию для оборонительных технологий — GPT-5.5-Cyber.
Главный вывод исследования: улучшения в кибернавыках модели могут быть лишь началом будущих скачков развития ИИ.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
