稀疏化 - AI话题 - AI快开门

2025-12-14

英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩，阶跃星辰8B框架解锁百万token测试时计算，苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理，小参数模型在边缘与实时场景逼近大模型性能，显著降低算力与能耗门槛。

2024-10-10

清华&微软Differential Transformer将注意力精度提升30%，NeurIPS 2024 SparseLLM实现全局剪枝，MIT SciAgents自动科研，多路研究共探大模型降本增效与科学发现自动化。

2024-02-22

谷歌Gemma以Gemini同源技术下放，笔记本可跑、可商用，登顶开源榜；微软SliceGPT实现单GPU 25%稀疏压缩不降性能，降低端侧部署门槛，预示“轻量开源+本地推理”将重塑生态。

2024-01-31

Mementos 漫画序列基准暴露 GPT-4V/Gemini 推理短板；MoE-LLaVA 以 3B 稀疏模型媲美 7B 稠密效果，多模态 LLM 在评测体系与模型压缩两端同步进化。

# 稀疏化