OpenAI представляет PaperBench — новый тест для оценки ИИ
Компания OpenAI анонсировала PaperBench, новый бенчмарк, который позволит проверить, насколько хорошо ИИ может воспроизводить результаты передовых исследований в области искусственного интеллекта. Этот тест направлен на определение способности ИИ понимать научные статьи, писать код и запускать его, чтобы подтвердить результаты исследования.…
