
在刚刚落幕的2025年全国中学生数学奥林匹克竞赛(CMO)决赛中,除了涌现出一批数学天赋出众的年轻选手,还有一个特殊的“考生”引人注目——AI大模型。
CMO是中国最高规格的数学奥林匹克竞赛,今年,主办方首次设立AI测试环节,邀请大模型与人类同场答题,并交由相同的评委专家组阅卷打分。上海人工智能实验室旗下的书生科学多模态大模型(Intern-S1-20251122)拿到102分。
据公开信息,今年CMO考生前三名得分分别为126(满分)、110分、102分,Intern-S1取得的成绩位列总分榜第三,在AI中排名第一。
本届CMO共有700余名选手参赛,223人获得金牌,前60名选手获得清华北大保送资格并入选国家集训队。AI目前虽未超越人类选手最高分,但其表现已远超大多数参赛者,甚至超过了许多金牌得主,本次金牌线为78分。
“AI在奥赛中超越人类是未来一定会发生的事。”上海人工智能实验室青年领军科学家陈恺对第一财经表示。他认为,正如AlphaGo最终战胜世界围棋冠军,AI在数学竞赛上的进步也是一个逐步发展的过程。现在AI已经能拿奥赛金牌了,未来超过奥赛顶尖的人类选手也大有可能。
“数学是推理能力的代表性领域,也是目前很多大模型团队重点投入优化的方向之一,因此进展相对更快。”不过,陈恺强调,奥赛只是数学里的一个任务,因此AI在奥赛中超过人类,并不意味着AI在数学或更广泛的能力上就能超过人。
“数学是个很宽泛深奥的领域,也有很多前沿的研究,在这方面AI还要更长的时间积累。”陈恺补充道。
天津市瑞通预应力钢绞线有限公司中国人民大学附属中学教师、奥数金牌教练张端阳也是AI训练的“顾问”,在接触之初他对大模型的印象还停留在只能解答数学高考题的水平,大模型在CMO的表现,也让他惊讶于AI发展的速度之快,“就像 10 年前的围棋一样,突破可能就是一刹那。”
上海人工智能实验室发布的文章提到,此次Intern-S1 推理能力的提升得益于“通专融合”技术架构 SAGE(中文含义为智者),创新点在于以数学引理为核心的多轮分层推理机制,以及基于结果的过程校验模型,显著提升了模型在超长程思考和证明时的严谨,还有通用模型结合专业符号引擎,让通用模型掌握像人类科学家一样逐步推导、探索和修正的思路。
AI在数学和推理领域的突破意味着什么?陈恺认为,这对教育和科研领域的落地都会很有帮助,此外,预应力钢绞线数学能力也是复杂推理等各种能力的基础,因此这一能力的提升和演进能进一步帮助大模型提升智力水平。
志愿者身着统一服装,携带宣传单并逐户敲门走访。面对面向居民讲解可回收物、厨余垃圾、有害垃圾、其他垃圾的分类标准,结合家庭日常场景,重点演示剩菜剩饭、废旧电池、快递包装、过期药品等常见垃圾的正确分类方法。
3日,外交部发言人林剑主持例行记者会,针对“特朗普签署了一项法律,让国务院定期审议与台湾的关系”一事,林剑表示,中方敦促美方切实恪守一个中国原则和中美三个联合公报,慎之又慎处理台湾问题,停止美台官方往来,不向“台独”分裂势力发出任何错误信号。
让大模型辅助教育学习是已经在落地的方向之一,AI可以给出解答和思考过程。而AI在奥数能够拿金牌、达到人类第三的水平,就意味着在高中数学或者K12教育领域,AI的辅导能力更强了。此外,在科研方面,陈恺提到,有一些数学家已经在用大模型在其科研过程中帮助做一些定理证明、开阔思路。
对于这次Intern-S1的答卷,有阅卷专家认为,AI对第四题的解答是“一个新的解法,巧妙的调整法,在学生的解法中没有见过”。这意味着AI能突破人类解题思路局限,通过自主探索和分析找到新的解题方法,这对赋能科学发现有很大的意义。
上海人工智能实验室在官方发文中表示,计划将 Intern-S1 的长程推理能力拓展应用于物理、化学、生命科学等基础科研领域,通过与专业工具的打通与融合,实现从“长时间独立思考”向“长时间独立科研”转变,进而加速各领域科研范式的变革,为科学突破提供支撑。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者刘晓洁
相关阅读 AI进化速递丨中国首批L3级自动驾驶汽车开启规模化上路运行我国首部大模型国家标准实施,构建人工智能产业“标准基座”。
165 2025-12-26 20:49 研究称中国出现AI泡沫可能性不大,科技大厂资本支出约为美国1/10国内循环融资有限,资本支出较为审慎。
270 2025-12-05 17:02 DeepSeek上新!首个奥数金牌水平的模型来了“鲸鱼”回来了。
6 637 2025-11-28 07:10 “AI教母”李飞飞发布首款商用世界模型,空间智能更近了官方称这是“构建空间智能未来的基础”。
5 384 2025-11-13 09:17 席南华院士:减少对顶级期刊的盲目崇拜数学之美能像“初恋”般打动人心宜宾预应力钢绞线价格 。
95 2025-11-04 14:14 一财最热 点击关闭