2025-02-09
数学AI夺金突破符号推理极限
谷歌AlphaGeometry2在IMO几何题上拿到84%金牌级表现,结合辅助作图与符号引擎的新范式显著超越纯LLM,证明专用推理系统已逼近人类顶尖水平,为科学发现与自动形式化验证打开新空间。
2025-02-08
数学推理模型突破
DeepMind AlphaGeometry2、谷歌AI在IMO几何题正确率84%,超越金牌选手;李飞飞团队26分钟150元蒸馏出s1推理模型,验证“小参数+蒸馏”可行,预示高性能推理正走向低成本平民化。