【概览】国产大模型DeepSeek-R1以“绕过CUDA+纯强化学习”组合拳震动全球,英伟达市值承压、OpenAI遭遇围剿;与此同时,微软FP4训练框架、谷歌Med-PaLM 2临床级表现、ETH“推理模型蓝图”等成果密集发布,显示低成本、高推理、多模态正成为2025年AI主旋律。
01 | DeepSeek生态冲击波
DeepSeek-R1及其底层优化细节持续发酵:团队通过自研PTX内核绕过CUDA、以FP4精度完成训练、并用R1-Zero纯强化学习方案跳过监督微调,在多项基准上逼近OpenAI o1。该组合被视作对英伟达生态护城河的直接挑战,引发NVDA股价震荡、硅谷巨头联合围剿,同时点燃国产模型“效率革命”讨论,成为2025开年最具冲击力的技术事件。
02 | 推理模型蓝图发布
ETH Zurich等机构发布“推理语言模型(RLM)”统一蓝图,系统拆解o1、o3、DeepSeek-V3的强推理机制,指出其是迈向AGI的关键里程碑,为行业提供可复制的方法论,降低复杂问题求解门槛。
03 | 医疗AI再突破
谷歌Med-PaLM 2在MedQA等医学基准上达到专家级表现,通过领域微调与推理策略升级,显著缩小与大模型在真实临床场景中的差距,加速AI医生落地进程。
04 | 低精度训练新范式
微软首发FP4训练框架,在保持BF16精度的同时将显存与能耗减半,为大模型训练成本下降提供可扩展路径,利好国产卡与边缘算力部署。
05 | RNA结构预测突破
普渡大学深度学习模型实现5Å全原子RMSD精度,首次在Nature子刊展示RNA三级结构预测接近实验水平,为靶向药物与RNA疫苗设计打开新空间。
06 | 对齐方法创新
TeleAI在ICLR 2025提出好奇心驱动的探索对齐方法,让8B模型在多项任务上超越70B,展示小模型通过强化探索机制实现越级性能的新思路。
【展望】DeepSeek以“算法+系统”双重创新撕开英伟达生态裂缝,预示2025年大模型竞争将从“堆卡”转向“堆智”;低精度训练、推理蓝图与医疗、分子等垂直场景的快速落地,则进一步降低AI普及门槛。可以预见,成本骤降与性能跃升将并行发生,全球AI产业正步入“效率优先”的新周期。