AI快开门

发现最好的AI工具

2025-01-10

小模型数学推理逆袭o1

微软rStar-Math、360-LLaMA-Factory等方法让7B参数模型在数学基准上超越OpenAI o1,结合自进化与后训练技术,打破“大即好”神话,为端侧低成本高精度推理开辟新路径。