← 返回列表

AI行业新闻简报 2025.01.26 周日

📊 7 个话题 📰 24 条新闻 🕐 2025-01-26 05:30

【概览】OpenAI深夜抛出首个L3级智能体Operator,宣告“能用人浏览器”的AGI节点到来;中国DeepSeek-R1以极致性价比震撼硅谷,同日百川开源医疗大模型,中美技术对撞再升级。资本端Meta豪掷650亿美元囤GPU,应用端零代码创作、VLA智驾、AI语音商业化全面提速,行业进入“模型+算力+场景”三线爆发期。

01 | Operator开启L3智能体新纪元

OpenAI正式发布Operator,成为首个可像人类一样自主操控浏览器完成多步骤任务的L3级智能体。其基于强化学习+视觉理解的新架构,能在无人工干预下网购、填表、做调研,被视作AGI路线图的关键跃迁,也迫使全球云厂商与SaaS平台连夜评估API改造方案。

02 | DeepSeek-R1低成本碾压o1

中国团队DeepSeek推出R1推理模型,在物理、数学、代码等极难基准上全面超越OpenAI o1与Claude,训练成本仅为同类方案的十分之一。硅谷巨头紧急组建“复现突击队”,担忧中国大模型借工程创新改写性价比规则,并可能引发全球算力需求重估。

03 | 百川开源医疗大模型

百川智能发布国内首个全场景深度思考模型Baichuan-M1-preview,并同步开源医疗增强版M1-14B,实现语言、视觉、搜索三模态融合推理。模型在循证问答、影像解读等任务中刷新SOTA,为医院与开发者提供可商用、可二次训练的医疗AI底座。

04 | Meta砸650亿美元囤130万块GPU

Meta宣布2025年资本支出高达650亿美元,年底AI GPU总量将增至130万块;同期“星际之门”项目首期投入1000亿美元,在全美开建20座超算中心。两项投资叠加,使Meta GPU规模达到微软+谷歌总和,标志着巨头算力军备竞赛进入“千亿级”白热化阶段。

05 | VLA模型改写智驾规则

视觉-语言-动作(VLA)大模型成为自动驾驶新范式,英伟达全栈支持的初创公司仅用4个月拿下全球10%高阶智驾方案订单。VLA用统一多模态网络直接输出驾驶动作,较传统“感知+规划”堆料方案降低30%硬件成本,迫使车企重估技术路线。

06 | AI语音与语言学习吸金

欧洲语音独角兽ElevenLabs完成2.5亿美元C轮,估值升至30亿美元;同期一款口音矫正小游戏靠TikTok裂变月入百万美元。高保真语音合成与互动语言学习需求刚性、付费场景清晰,正成为AI消费端最快变现赛道之一。

07 | 零代码AI创作走向大众

跃问App上线「AI创意板」,百度推出「自由画布」,用户用自然语言即可一键生成应用、游戏、拜年视频并直接分享。无需编程的“提示即产品”模式,大幅降低创作门槛,推动AI原生内容向春节社交场景渗透,预示2025年C端AI工具将迎来爆发式普及。

【展望】Operator与DeepSeek-R1同日登场,显示顶尖模型正朝“自主行动”与“极致效率”两极并进;Meta的天量算力投入则为下一代大模型提供“燃料”。随着医疗、智驾、语音、零代码等场景模型开源或商业化,2025年AI竞争焦点将从“炼大模型”转向“跑通场景闭环”,生态卡位战刚刚打响。

× 公众号二维码

扫码关注公众号获取每日简报