AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
Muon
相关话题
2025-02-24
国产大模型训练降本
月之暗面开源改进版Muon优化器,算力需求较AdamW锐减48%,已被用于DeepSeek架构新模型;华为诺亚提出高效稀疏注意力ESA,进一步降低长文本训练与推理成本,国产大模型进入“低成本、高效率”新阶段。
Muon
优化器
稀疏注意力
降本
2025-02-23
顶尖人才与优化器流动
谷歌Fellow吴永辉转投字节跳动负责Seed基础研究;月之暗面开源Muon优化器,算力需求较AdamW降48%,底层技术与人才双迁移重塑中美AI格局。
人才流动
优化器
Muon
字节跳动
谷歌