2025-07-19
顶尖模型数学推理突破
Gemini 2.5 Pro在IMO 2025大模型数学竞赛中以30%+总成绩遥遥领先,8B参数的Goedel-Prover-V2更击败671B模型重夺定理证明王座,显示小参数也能在形式化推理上实现越级打怪,数学成为检验大模型极限能力的“试金石”。
2025-06-07
数学与科学AI新工具
腾讯AI Lab与上海交大推出12.1万高难度数学题数据集,训练7B模型定理证明性能媲美Claude3.7;ICML 2025入选的CGFlow实现分子与合成路径协同设计,为AI驱动数学研究与新药发现提供强力工具。
2024-10-17
AI for Science与数学突破
陶哲轩领衔用AI在19天完成4694条定理蕴含图99.99%证明;扩散模型被重新定义为演化算法;GNNOpt、几何图学习等方法加速材料与酶工程研发,显示AI正在重塑基础科研范式,提升发现效率一个量级。
2024-10-13
AI数学推理突破
清华校友团队用LeanAgent系统成功证明162个高阶数学定理,攻克陶哲轩形式化难题;同时o1模型在复杂推理任务上再进化,显示大模型数学与逻辑能力正快速逼近甚至超越人类专家,为科研自动化打开新范式。
2024-08-18
数学大模型开源潮
DeepSeek开源专攻数学定理证明的大模型,刷新高中及大学级别基准SOTA,降低形式化数学门槛;同期亚马逊开源RAGChecker诊断工具,系统评估检索增强生成在数学问答中的事实忠实度,标志数学AI正从“做题”走向“证题”与“诊断”并行的新阶段。
2024-08-10
学术前沿与人才动态
CMU-清华LeanSTaR框架让LLM边思考边证明定理刷新miniF2F榜单,UCLA华人研究生联手MIT破解组合数学等差数列难题,吴恩达亲授Python AI新课降低入门门槛,顶级高校与在线教育平台持续为AI研究与应用输送新方法与人才。
2024-04-23
AI for Math与数学推理数据
陶哲轩发布AI数学资源清单,汇总OpenWebMath、Proof-Pile-2等高质量数据集,为训练专用数学大模型提供燃料,有望加速自动定理证明、科学计算与下一代科学大模型突破。