1 月 26 日,我国科研团队研发的全球首个兼具自主出题与自动解题双重能力的通用人工智能系统 ——“通矩模型”(TongGeometry)相关成果,发表于国际权威期刊《自然・机器智能》。该模型原创的 3 道几何新题成功入选 2024 年全国中学生数学联赛(北京赛区)及美国精英奥赛,成为首个进入高规格人类数学竞赛的 AI 原创题目,标志着我国在自动化推理逻辑核心领域实现关键技术自研,跻身国际顶尖水平。
奥林匹克数学竞赛是人工智能逻辑推理能力的重要试金石。此前国际顶尖的 AlphaGeometry 系统仅能实现被动解题,且训练依赖大规模合成数据和昂贵算力集群。而通矩模型实现了从 “模仿解题” 到 “自主创造” 的范式转变,不仅能高效解答难题,更能像人类数学家一样创造兼具审美价值与区分度的优质题目。
据论文第一作者、北京通用人工智能研究院张驰博士介绍,团队通过建模几何命题的对偶性,让模型精准捕捉 “证明难度高于构建复杂度” 的优质题目,契合奥数命题的美学标准。技术层面,通矩模型创新采用 “规范化表示” 技术,将几何推理的搜索空间压缩数个数量级,彻底解决了传统方法的路径爆炸难题;同时依托神经符号引导树搜索架构,模拟人类数学家的直觉与推理逻辑。
在性能上,通矩模型展现出显著的国产技术优势,仅需单张消费级显卡,即可在 38 分钟内解决近 25 年所有国际数学奥林匹克竞赛的几何难题,推理效率和准确率均达世界顶尖。相较于依赖庞大算力集群的同类系统,通矩模型实现了 “小数据、大任务” 的范式转化,无需海量标注数据,通过内部逻辑自我演化完成推理与命题,为通用人工智能发展提供了关键路径。
该成果由北京通用人工智能研究院联合北京大学多院系科研团队研发,论文共同通讯作者、北京大学朱毅鑫助理教授表示,通矩模型的突破远超数学竞赛本身,其技术架构可为自动化数学证明、个性化智能教育及科学大模型开发提供重要支撑。
未来,研发团队将继续深耕 “通系列” 通用智能模型,推动算法架构向代数、数论等领域拓展,助力我国人工智能技术在复杂逻辑与科学发现领域持续领跑。