2025-06-09
端侧与高效推理创新
面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-04-30
端侧与低成本推理方案
Unsloth推Qwen3动态量化2.0、NVIDIA NIM Operator 2.0、14.9万元DeepSeek一体机及Simular Mac本地助手相继发布,目标在功耗、成本与隐私约束下把大模型塞进笔记本甚至DOS系统,端侧AI进入“平民化”拐点。
2024-05-11
高效训练与推理框架
Unsloth×Qwen2宣称训练提速47%、显存节省39%,国产开源方案将8GB级显存门槛打穿;Jacobi解码+一致性损失的新LLM并行生成方法再提速2.4-3.4倍;Medusa2级高效解码框架亦在跟进,大模型落地成本有望进一步腰斩。