模型性能 - AI话题

2025-11-09

国产Kimi开源推理模型K2 Thinking以1T MoE架构、32B激活在多项基准超越GPT-5，HuggingFace发布200页大模型实战指南，百度文心5.0 Preview国内实测领先，显示开源与闭源阵营同步加速，模型性能与落地门槛双降，重塑全球大模型竞争格局。

2025-05-05

CMU等顶级高校发现“灾难性过度训练”：预训练数据过量反而损害下游微调性能，挑战“数据即燃料”信条，将促使行业重新制定数据配比、课程学习与早期停止策略。

2024-09-08

智谱AI发布旗舰模型直接对标GPT-4o，国内仅剩不到十家大厂具备跟进能力。模型性能、推理成本与生态差距仍是核心壁垒，但国产供应链+场景数据优势可能带来差异化突围窗口，关乎中国大模型话语权。

2024-02-10

分析师Dylan Patel曝光GPT-4系统提示词膨胀至1700 token，冗余规则导致模型“偷懒”现象加剧，引发社区对OpenAI悄悄降级服务的质疑，凸显大模型持续迭代中的质量管控难题。

AI快开门