2025-09-10
端侧Agent与开源工具链
上海交大开源MobiAgent全栈工具链,实现手机端个人助手本地部署,性能宣称超越GPT-5;清华开源GUAVA 0.1秒照片转3D数字人。标志着端侧智能体进入“人人可炼”阶段,降低开发者门槛,加速AI应用碎片化落地。
2025-08-16
端侧超小模型爆发
谷歌开源0.27B Gemma 3、4B Jan-v1等“小钢炮”模型,可在浏览器或手机本地运行,性能对标数十亿参数大模型,标志端侧AI进入实用阶段,将重塑移动应用、IoT与隐私计算生态。
2025-05-05
小模型推理革命
微软Phi-4系列以≤14B参数实现媲美甚至超越大模型的数学与推理表现,3.8B版本即可击败DeepSeek-R1蒸馏8B,宣告“本地可跑”的高性能时代到来,将重塑端侧AI、边缘部署与成本结构,引发模型瘦身与高效训练新赛道。
2025-04-10
开源代码模型竞速
Llama-4、Nemotron-253B、DeepCoder-14B、Cogito-v1等开源代码/推理模型相继上线,性能对标OpenAI o1/o3,参数效率与推理速度刷新SOTA,推动“本地部署+低成本微调”成为开发者新默认。
2024-12-01
本地部署与轻量模型新趋势
CPU可跑大模型、iPad AI绘画神器走红、无需Transformer的滤波器预测登顶NeurIPS,社区对“轻量化、端侧化、非Transformer架构”的探索升温。在算力垄断与云成本压力下,去中心化、低门槛的AI方案成为开发者新宠。
2024-03-06
端侧AI与本地大模型部署
苹果M3 MacBook Air号称“最佳消费级AI笔记本”,英特尔Ultra NPU助推32GB本机跑大模型;谷歌ScreenAI实现屏幕理解SOTA,端侧AI在性能、隐私与成本间寻找新平衡。
2024-02-15
英伟达本地AI聊天机器人
英伟达发布Chat With RTX,让消费级GPU在本地运行类ChatGPT大模型,无需联网即可对话,降低延迟并强化隐私,同时展示RTX生态对生成式AI的硬软件统治力,冲击云端主导的大模型部署模式。