2025-09-21
大模型训练与推理新范式
Meta提出无数据自我博弈LSP、华为云百万卡CloudMatrix超节点、腾讯开源智能体平台ADP3.0,共同指向“数据-算力-平台”三维突破:无需增量数据即可持续迭代,弹性万卡集群把训练成本砍半,一站式智能体开发降低落地门槛,预示大模型进入“自进化+云原生+生态化”新阶段。
2025-06-02
数据瓶颈与自进化训练
CMU的SRT与Ubiquant熵最小化方法相继实现“零标注”自迭代,数学推理暴涨100%,10步即可收敛,宣告后训练告别昂贵RLHF,为互联网数据枯竭背景下的AGI路径提供可持续方案。
2025-06-01
无奖励自进化推理
UC伯克利提出仅靠“自信度”即可让LLM自我训练,无需外部奖励便在数学与编程任务上显著跃升,挑战传统RLHF范式,为低成本持续提升模型推理能力提供新思路。