AI快开门

发现最好的AI工具

2025-02-21

AI科研与数学推理升级

谷歌AI co-scientist独立提出可验证科研假设,普林斯顿ReasonFlux用500思维模板刷新奥数成绩,DeepSeek-R1通过步骤级对齐在AIME再提分,显示大模型在科研与数学深度推理上持续突破。
2025-01-11

小模型数学推理突破o1

微软亚洲研究院rStar-Math算法让7B参数Qwen2.5在美国数学奥赛AIME 2024中得分53.3%,媲美全美前20%高中生,首次证明小模型通过自我进化+蒙特卡洛树搜索可超越大模型,为端侧推理与低成本科研开辟新范式。