本地部署 - AI话题

2025-09-10

上海交大开源MobiAgent全栈工具链，实现手机端个人助手本地部署，性能宣称超越GPT-5；清华开源GUAVA 0.1秒照片转3D数字人。标志着端侧智能体进入“人人可炼”阶段，降低开发者门槛，加速AI应用碎片化落地。

2025-08-16

谷歌开源0.27B Gemma 3、4B Jan-v1等“小钢炮”模型，可在浏览器或手机本地运行，性能对标数十亿参数大模型，标志端侧AI进入实用阶段，将重塑移动应用、IoT与隐私计算生态。

2025-05-05

微软Phi-4系列以≤14B参数实现媲美甚至超越大模型的数学与推理表现，3.8B版本即可击败DeepSeek-R1蒸馏8B，宣告“本地可跑”的高性能时代到来，将重塑端侧AI、边缘部署与成本结构，引发模型瘦身与高效训练新赛道。

2025-04-10

Llama-4、Nemotron-253B、DeepCoder-14B、Cogito-v1等开源代码/推理模型相继上线，性能对标OpenAI o1/o3，参数效率与推理速度刷新SOTA，推动“本地部署+低成本微调”成为开发者新默认。

2024-12-01

CPU可跑大模型、iPad AI绘画神器走红、无需Transformer的滤波器预测登顶NeurIPS，社区对“轻量化、端侧化、非Transformer架构”的探索升温。在算力垄断与云成本压力下，去中心化、低门槛的AI方案成为开发者新宠。

2024-03-06

苹果M3 MacBook Air号称“最佳消费级AI笔记本”，英特尔Ultra NPU助推32GB本机跑大模型；谷歌ScreenAI实现屏幕理解SOTA，端侧AI在性能、隐私与成本间寻找新平衡。

2024-02-15

英伟达发布Chat With RTX，让消费级GPU在本地运行类ChatGPT大模型，无需联网即可对话，降低延迟并强化隐私，同时展示RTX生态对生成式AI的硬软件统治力，冲击云端主导的大模型部署模式。

AI快开门