AI快开门

发现最好的AI工具

2026-01-11

大模型训练安全与优化新进展

港大在TPAMI揭示梯度反转攻击可高效窃取联邦学习隐私,英伟达提出GDPO算法解决多奖励对齐难题,Sakana引入“AI猎杀”进化策略,共同指向2025年大模型训练的安全、对齐与自动化优化三大前沿方向。