AI快开门

发现最好的AI工具

2025-01-22

模型蒸馏与评测反思

中科院、北大等研究指出除Claude、Gemini、豆包外,多数主流模型存在“过度蒸馏”,性能反而下降;人大清华提出Search-o1框架,用自主搜索缓解推理模型知识幻觉,推动评测方法升级。