AI 新闻
研究论文

Auto Research 来了:当 AI 开始接管科研里最苦的活,意味着什么

极客公园2026年05月13日 22:432 天前3 分钟阅读

我直接说结论:AI 科研助理这个岗位,比很多初级工程师先被干掉。

过去两年,AI 能写论文摘要、能跑代码、能解数学题,这些都不稀奇。真正让科研圈炸锅的,是Navers Lab发布的Frontier-Eng Bench测试——它不再考AI“一次性答对”,而是让它像真人工程师一样,在实验室里反复试错、持续优化。

举个具体例子:一个电池快充策略,AI第一次跑出来可能效率80%,但温度超标。真人工程师要调参数、跑仿真、看反馈、再调参数,来回几十轮。Frontier-Eng Bench就是逼AI干这个——它得自己提方案、运行仿真器、读反馈、改策略,在长期迭代中逼近最优解。

这跟AlphaGo的自我对弈本质一样。AlphaGo不是靠背棋谱赢的,是靠数百万次自我对弈进化。Frontier-Eng Bench想验证的,是AI能不能在真实工程问题里也这么干。

但别急着欢呼。这个测试有个致命缺陷:它目前只覆盖了电池、电路、材料等少数工程领域。AI在实验室仿真环境里能优化,不代表它在现实实验室里能搞定——现实有物理限制、有设备故障、有预算约束。而且,AI优化出来的方案,人类工程师敢不敢直接拿去用?这涉及信任问题。

我的判断是:未来两年内,AI会在仿真优化领域碾压人类,但真正进入实验室接管“苦活”,至少还要5年。因为科研里最苦的部分不是优化本身,而是判断“这个优化方向值不值得继续”。AI现在还没学会这个。

如果你是个刚入行的科研助理,最好赶紧学点AI调参和实验设计——不是让你跟AI竞争,是让你能指挥它干活。

一句话摘要

Einsia AI 旗下 Navers Lab 发布 Frontier-Eng Bench 基准测试,评估 AI Agent 在真实工程任务中的长期迭代优化能力。

来源:极客公园