实时追踪 AI 行业动态,涵盖模型、产品、融资、政策与研究
新模型在 MATH 基准测试中达到 92.3% 准确率,多模态交互体验进一步优化。
HumanEval 测试得分 94.1%,成为当前最强代码生成模型之一。
最新开源旗舰模型,在代码和数学推理方面接近 GPT-4o 水平,可商用许可。