AI快开门

发现最好的AI工具

2025-09-21

大模型训练与推理新范式

Meta提出无数据自我博弈LSP、华为云百万卡CloudMatrix超节点、腾讯开源智能体平台ADP3.0,共同指向“数据-算力-平台”三维突破:无需增量数据即可持续迭代,弹性万卡集群把训练成本砍半,一站式智能体开发降低落地门槛,预示大模型进入“自进化+云原生+生态化”新阶段。
2025-06-02

数据瓶颈与自进化训练

CMU的SRT与Ubiquant熵最小化方法相继实现“零标注”自迭代,数学推理暴涨100%,10步即可收敛,宣告后训练告别昂贵RLHF,为互联网数据枯竭背景下的AGI路径提供可持续方案。
2025-06-01

无奖励自进化推理

UC伯克利提出仅靠“自信度”即可让LLM自我训练,无需外部奖励便在数学与编程任务上显著跃升,挑战传统RLHF范式,为低成本持续提升模型推理能力提供新思路。
2025-05-31

机器人与智能体自主进化

强化学习让机器狗从零学会羽毛球对打并涌现类人回位,EvoAgentX框架实现多智能体“一次部署终生自进化”,Hugging Face 250美元开源人形机器人降低硬件门槛,具身智能与智能体系统同步进入“自我迭代”时代。