自进化 - AI话题 - AI快开门

2025-09-21

Meta提出无数据自我博弈LSP、华为云百万卡CloudMatrix超节点、腾讯开源智能体平台ADP3.0，共同指向“数据-算力-平台”三维突破：无需增量数据即可持续迭代，弹性万卡集群把训练成本砍半，一站式智能体开发降低落地门槛，预示大模型进入“自进化+云原生+生态化”新阶段。

2025-06-02

CMU的SRT与Ubiquant熵最小化方法相继实现“零标注”自迭代，数学推理暴涨100%，10步即可收敛，宣告后训练告别昂贵RLHF，为互联网数据枯竭背景下的AGI路径提供可持续方案。

2025-06-01

UC伯克利提出仅靠“自信度”即可让LLM自我训练，无需外部奖励便在数学与编程任务上显著跃升，挑战传统RLHF范式，为低成本持续提升模型推理能力提供新思路。

自信训练自进化 LLM推理无奖励学习

2025-05-31

强化学习让机器狗从零学会羽毛球对打并涌现类人回位，EvoAgentX框架实现多智能体“一次部署终生自进化”，Hugging Face 250美元开源人形机器人降低硬件门槛，具身智能与智能体系统同步进入“自我迭代”时代。

# 自进化