Auto Research 来了：当 AI 开始接管科研里最苦的活，意味着什么 | AI 瞭望台

我直接说结论：AI 科研助理这个岗位，比很多初级工程师先被干掉。

过去两年，AI 能写论文摘要、能跑代码、能解数学题，这些都不稀奇。真正让科研圈炸锅的，是Navers Lab发布的Frontier-Eng Bench测试——它不再考AI“一次性答对”，而是让它像真人工程师一样，在实验室里反复试错、持续优化。

举个具体例子：一个电池快充策略，AI第一次跑出来可能效率80%，但温度超标。真人工程师要调参数、跑仿真、看反馈、再调参数，来回几十轮。Frontier-Eng Bench就是逼AI干这个——它得自己提方案、运行仿真器、读反馈、改策略，在长期迭代中逼近最优解。

这跟AlphaGo的自我对弈本质一样。AlphaGo不是靠背棋谱赢的，是靠数百万次自我对弈进化。Frontier-Eng Bench想验证的，是AI能不能在真实工程问题里也这么干。

但别急着欢呼。这个测试有个致命缺陷：它目前只覆盖了电池、电路、材料等少数工程领域。AI在实验室仿真环境里能优化，不代表它在现实实验室里能搞定——现实有物理限制、有设备故障、有预算约束。而且，AI优化出来的方案，人类工程师敢不敢直接拿去用？这涉及信任问题。

我的判断是：未来两年内，AI会在仿真优化领域碾压人类，但真正进入实验室接管“苦活”，至少还要5年。因为科研里最苦的部分不是优化本身，而是判断“这个优化方向值不值得继续”。AI现在还没学会这个。

如果你是个刚入行的科研助理，最好赶紧学点AI调参和实验设计——不是让你跟AI竞争，是让你能指挥它干活。

一句话摘要

Einsia AI 旗下 Navers Lab 发布 Frontier-Eng Bench 基准测试，评估 AI Agent 在真实工程任务中的长期迭代优化能力。

来源：极客公园