AI快开门

发现最好的AI工具

2025-01-12

扩散模型极致压缩

北航与ETH提出BiDM,首次将扩散模型权重与激活完全二值化至1 bit,存储节省28倍、推理加速52倍,为端侧高保真生成铺平道路,或重塑AIGC部署格局。
2025-01-11

模型效率与知识蒸馏新思路

大连理工提出Wasserstein距离替代KL散度进行知识蒸馏,更好保留样本几何结构,在NeurIPS 2024引发关注;北航等首次把扩散模型全量化至1bit,存储压缩28倍、推理加速52倍,为端侧部署提供极致效率方案。