AI快开门

发现最好的AI工具

2024-05-20

模型训练与架构创新

Meta 34B Chameleon 10万亿token训练刷新SOTA,KAN卷积化、GPU高级语言、扩散模型替代湍流模拟等底层创新涌现;LoRA在数学编程任务上不敌全量微调,提示“参数高效”并非万能,训练范式仍在快速演化。