AI快开门

发现最好的AI工具

2025-12-14

小模型高效革命

英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩,阶跃星辰8B框架解锁百万token测试时计算,苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理,小参数模型在边缘与实时场景逼近大模型性能,显著降低算力与能耗门槛。
2024-10-10

模型效率与架构创新

清华&微软Differential Transformer将注意力精度提升30%,NeurIPS 2024 SparseLLM实现全局剪枝,MIT SciAgents自动科研,多路研究共探大模型降本增效与科学发现自动化。
2024-02-22

开源小模型竞速

谷歌Gemma以Gemini同源技术下放,笔记本可跑、可商用,登顶开源榜;微软SliceGPT实现单GPU 25%稀疏压缩不降性能,降低端侧部署门槛,预示“轻量开源+本地推理”将重塑生态。
2024-01-31

多模态大模型评测与稀疏化

Mementos 漫画序列基准暴露 GPT-4V/Gemini 推理短板;MoE-LLaVA 以 3B 稀疏模型媲美 7B 稠密效果,多模态 LLM 在评测体系与模型压缩两端同步进化。