AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
解码加速
相关话题
2024-07-02
模型效率与架构革新
韩国团队提出拆分注意力机制的Transformer新架构,解码提速20倍;北大&腾讯等通过医疗持续预训练将8B模型推至GPT-4级性能;LayerNorm非线性表达研究挑战传统激活函数。后训练优化与高效架构成为降低算力门槛、推动端侧及垂直场景落地的关键。
Transformer
解码加速
医疗大模型
LayerNorm
模型压缩