AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
评测作弊
相关话题
2025-04-13
大模型评测与信任危机
Llama 4因“特供版”刷榜被重测后排名暴跌,引发社区对Meta诚信的质疑;同期强化学习推理模型被质疑改进仅为“噪音”,凸显行业对评测公正性与技术真实进展的焦虑。事件折射出大模型竞技缺乏统一标准,信任成本正在升高。
Llama 4
评测作弊
强化学习
信任危机
大模型竞技
2025-04-08
Llama 4 争议与开源生态震荡
Meta 新旗舰 Llama 4 系列模型因被曝测试集训练、代码能力翻车、竞技场“特供版”刷榜而陷入信任危机;内部员工辞职、社区差评如潮,引发对开源模型透明度与评测公允性的集体反思,连带影响开源生态竞争格局与企业选型信心。
Llama 4
开源模型
评测作弊
社区信任