2025-01-26 AI简报 - AI快开门

【概览】OpenAI深夜抛出首个L3级智能体Operator，宣告“能用人浏览器”的AGI节点到来；中国DeepSeek-R1以极致性价比震撼硅谷，同日百川开源医疗大模型，中美技术对撞再升级。资本端Meta豪掷650亿美元囤GPU，应用端零代码创作、VLA智驾、AI语音商业化全面提速，行业进入“模型+算力+场景”三线爆发期。

01 | Operator开启L3智能体新纪元

OpenAI正式发布Operator，成为首个可像人类一样自主操控浏览器完成多步骤任务的L3级智能体。其基于强化学习+视觉理解的新架构，能在无人工干预下网购、填表、做调研，被视作AGI路线图的关键跃迁，也迫使全球云厂商与SaaS平台连夜评估API改造方案。

02 | DeepSeek-R1低成本碾压o1

中国团队DeepSeek推出R1推理模型，在物理、数学、代码等极难基准上全面超越OpenAI o1与Claude，训练成本仅为同类方案的十分之一。硅谷巨头紧急组建“复现突击队”，担忧中国大模型借工程创新改写性价比规则，并可能引发全球算力需求重估。

03 | 百川开源医疗大模型

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview，并同步开源医疗增强版M1-14B，实现语言、视觉、搜索三模态融合推理。模型在循证问答、影像解读等任务中刷新SOTA，为医院与开发者提供可商用、可二次训练的医疗AI底座。

04 | Meta砸650亿美元囤130万块GPU

Meta宣布2025年资本支出高达650亿美元，年底AI GPU总量将增至130万块；同期“星际之门”项目首期投入1000亿美元，在全美开建20座超算中心。两项投资叠加，使Meta GPU规模达到微软+谷歌总和，标志着巨头算力军备竞赛进入“千亿级”白热化阶段。

05 | VLA模型改写智驾规则

视觉-语言-动作（VLA）大模型成为自动驾驶新范式，英伟达全栈支持的初创公司仅用4个月拿下全球10%高阶智驾方案订单。VLA用统一多模态网络直接输出驾驶动作，较传统“感知+规划”堆料方案降低30%硬件成本，迫使车企重估技术路线。

06 | AI语音与语言学习吸金

欧洲语音独角兽ElevenLabs完成2.5亿美元C轮，估值升至30亿美元；同期一款口音矫正小游戏靠TikTok裂变月入百万美元。高保真语音合成与互动语言学习需求刚性、付费场景清晰，正成为AI消费端最快变现赛道之一。

07 | 零代码AI创作走向大众

跃问App上线「AI创意板」，百度推出「自由画布」，用户用自然语言即可一键生成应用、游戏、拜年视频并直接分享。无需编程的“提示即产品”模式，大幅降低创作门槛，推动AI原生内容向春节社交场景渗透，预示2025年C端AI工具将迎来爆发式普及。

【展望】Operator与DeepSeek-R1同日登场，显示顶尖模型正朝“自主行动”与“极致效率”两极并进；Meta的天量算力投入则为下一代大模型提供“燃料”。随着医疗、智驾、语音、零代码等场景模型开源或商业化，2025年AI竞争焦点将从“炼大模型”转向“跑通场景闭环”，生态卡位战刚刚打响。

AI快开门

发现最好的AI工具

AI行业新闻简报 2025.01.26 周日