2025-12-14
小模型高效革命
英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩,阶跃星辰8B框架解锁百万token测试时计算,苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理,小参数模型在边缘与实时场景逼近大模型性能,显著降低算力与能耗门槛。
2024-10-10
模型效率与架构创新
清华&微软Differential Transformer将注意力精度提升30%,NeurIPS 2024 SparseLLM实现全局剪枝,MIT SciAgents自动科研,多路研究共探大模型降本增效与科学发现自动化。
2024-02-22
开源小模型竞速
谷歌Gemma以Gemini同源技术下放,笔记本可跑、可商用,登顶开源榜;微软SliceGPT实现单GPU 25%稀疏压缩不降性能,降低端侧部署门槛,预示“轻量开源+本地推理”将重塑生态。