gemini ai deep research

23 小时

4 月 3 日，OpenAI 推出了 PaperBench（论文基准测试），这是一个用于评估 AI 智能体自主复现前沿人工智能研究能力的基准测试系统。如果大模型智能体具备了自动写 AI / 机器学习研究论文的能力，既可能加速机器学习领域的发展，同时也需要审慎评估以确保 AI 能力的安全发展。

一些您可能无法访问的结果已被隐去。

今日热点