2025-11-09
大模型技术突破与开源竞争
国产Kimi开源推理模型K2 Thinking以1T MoE架构、32B激活在多项基准超越GPT-5,HuggingFace发布200页大模型实战指南,百度文心5.0 Preview国内实测领先,显示开源与闭源阵营同步加速,模型性能与落地门槛双降,重塑全球大模型竞争格局。
2025-05-05
预训练数据反噬现象
CMU等顶级高校发现“灾难性过度训练”:预训练数据过量反而损害下游微调性能,挑战“数据即燃料”信条,将促使行业重新制定数据配比、课程学习与早期停止策略。
2024-09-08
国产旗舰模型追赶OpenAI
智谱AI发布旗舰模型直接对标GPT-4o,国内仅剩不到十家大厂具备跟进能力。模型性能、推理成本与生态差距仍是核心壁垒,但国产供应链+场景数据优势可能带来差异化突围窗口,关乎中国大模型话语权。