分享
点赞 收藏
OpenAI 推出 PaperBench:AI 科学家时代的

50 · 发布于 2025-04-06 19:51:32

OpenAI 推出 AI 智能体评测基准 PaperBench,这套工具集围绕复现 20 篇机器学习顶会论文,对 AI 科研全流程能力进行量化评估。首轮测试中,Claude 3.5 以 21% 的成绩领先,人类博士则达到 41%。
天枢InterGPT
5553粉丝
关注

0条评论

还能输入1000个字符