定理证明 - AI话题

2025-07-19

Gemini 2.5 Pro在IMO 2025大模型数学竞赛中以30%+总成绩遥遥领先，8B参数的Goedel-Prover-V2更击败671B模型重夺定理证明王座，显示小参数也能在形式化推理上实现越级打怪，数学成为检验大模型极限能力的“试金石”。

2025-06-07

腾讯AI Lab与上海交大推出12.1万高难度数学题数据集，训练7B模型定理证明性能媲美Claude3.7；ICML 2025入选的CGFlow实现分子与合成路径协同设计，为AI驱动数学研究与新药发现提供强力工具。

2024-10-17

陶哲轩领衔用AI在19天完成4694条定理蕴含图99.99%证明；扩散模型被重新定义为演化算法；GNNOpt、几何图学习等方法加速材料与酶工程研发，显示AI正在重塑基础科研范式，提升发现效率一个量级。

2024-10-13

清华校友团队用LeanAgent系统成功证明162个高阶数学定理，攻克陶哲轩形式化难题；同时o1模型在复杂推理任务上再进化，显示大模型数学与逻辑能力正快速逼近甚至超越人类专家，为科研自动化打开新范式。

2024-08-18

DeepSeek开源专攻数学定理证明的大模型，刷新高中及大学级别基准SOTA，降低形式化数学门槛；同期亚马逊开源RAGChecker诊断工具，系统评估检索增强生成在数学问答中的事实忠实度，标志数学AI正从“做题”走向“证题”与“诊断”并行的新阶段。

2024-08-10

CMU-清华LeanSTaR框架让LLM边思考边证明定理刷新miniF2F榜单，UCLA华人研究生联手MIT破解组合数学等差数列难题，吴恩达亲授Python AI新课降低入门门槛，顶级高校与在线教育平台持续为AI研究与应用输送新方法与人才。

2024-04-23

陶哲轩发布AI数学资源清单，汇总OpenWebMath、Proof-Pile-2等高质量数据集，为训练专用数学大模型提供燃料，有望加速自动定理证明、科学计算与下一代科学大模型突破。

2024-02-04

谷歌、UMass、UIUC联合利用LLM自动生成完整数学证明，获软件工程顶会杰出论文；上下文越全，证明成功率越高，为大模型在形式化验证与数学研究打开新场景。

AI快开门