AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
AdaCache
相关话题
2024-11-08
大模型效率与成本革命
NeurIPS 2024 Oral提出DuQuant 4-bit量化新SOTA,50秒完成7B模型压缩;无问芯穹MoA稀疏注意力长文本吞吐提升8倍;Meta免训练AdaCache让DiT视频生成快2.6倍,大模型“又快又小”成为新赛场。
模型量化
稀疏注意力
AdaCache
DuQuant
推理加速