2025-10-18
多模态大模型与视频生成突破
Google AI Studio统一Playground、百度分钟级长视频与蒸汽机模型、北大-牛津CVM一致性挑战赛等,显示多模态生成正从“能生成”走向“高一致、可商用”。视频时长、角色一致、端侧推理速度等核心痛点被集中攻克,为广告、影视、UGC平台带来即刻落地的新产能。
2025-06-09
端侧与高效推理创新
面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-03-14
端侧与消费级AI
M3 Ultra芯片跑满血DeepSeek-R1仅需15万元家用设备;Windows记事本内测AI摘要;Android Studio Gemini多模态一键生成UI代码,显示大模型正快速下沉到个人开发者与消费场景。
2025-03-11
多模态与端侧推理提速
Zoom“草稿链”砍掉80%推理token,LayerSkip自推测解码加速大模型,字节开源MoE训练代码,RTX 5000 Ada成端侧新宠,显著降低延迟与成本,为端侧大模型规模化部署铺平道路。
2025-03-07
端侧与低成本推理
FP8训练显存省40%、速度提1.4倍,两台512G M3 Ultra即可跑满血DeepSeek-R1,阿里QwQ-32B笔记本可部署,Q-Filters无训练压缩KV缓存,端侧与消费级硬件正成为大模型推理新常态,边缘AI门槛快速降低。
2025-01-06
AI硬件创新潮
英伟达RTX 5090/5080显卡、三星Vision AI电视、Roborock机械臂扫地机、Circular Ring2智能戒等集中亮相,AI算力与场景硬件同步升级,边缘推理成本下降,端侧智能进入落地爆发期。
2024-08-12
AI硬件与端侧部署
哈佛初创推出ChatGPT专用芯片,微软亚研开源T-MAC让CPU跑大模型提速4-5倍,苹果被曝下一代iPhone SE将集成Apple Intelligence,显示AI正向低成本、低功耗、端侧普及快速渗透。
2024-08-09
端侧与CPU推理加速
微软亚研院开源新技术让大模型在手机CPU运行速度提升4-5倍,LG发布韩国首个开源模型Exaone 3.0,推动端侧部署门槛大幅降低,将加速边缘AI应用与隐私计算落地。
2024-07-03
模型效率与边缘AI创新
苹果端侧小模型、Prism框架把感知与推理解耦,2B参数即可媲美20B;上海理工卷积光神经网络成像视野扩大271倍,显示“小模型+专用硬件”成为端侧落地新范式,将加速手机、IoT、机器人场景商用。
2024-06-12
端侧推理与效率优化
上交PowerInfer-2让470亿大模型手机端提速29倍,Yandex YaFSDP打破LLM训练效率瓶颈,TiTok用32 token重建图像提速410倍,端侧与训练双重提效,为AI大规模普及扫清算力与能耗障碍。
2024-04-24
端侧小模型爆发
微软Phi-3系列以3.8B参数在手机端跑出ChatGPT级能力,引爆“边缘AI”赛道;OpenAI、谷歌同步加码,标志大模型轻量化进入可用阶段,将重塑移动应用、IoT与隐私计算格局。
2024-04-02
端侧与推理框架提速
Google JAX 在七项基准中超越 PyTorch/TF,成为 GPU 训练推理新标杆;Transformer-Lite 实现手机 GPU 高效运行 LLM;苹果发布设备端模型性能超 GPT-4。框架与硬件协同优化,让大模型离线和边缘部署进入实用阶段。
2024-01-22
视觉Mamba架构革新CV
华科王兴刚团队首次将Mamba引入ViT,精度超DeiT、速度提升5倍;中科院等推出VMamba,宣告视觉Mamba迎来Swin时刻。线性复杂度+全局感受野让Mamba成为CNN与Transformer之外的新主流,有望重塑端侧视觉芯片与推理框架。