← 返回列表

AI行业新闻简报 2025.02.19 周三

📊 6 个话题 📰 25 条新闻 🕐 2025-02-19 05:30

【概览】国产大模型DeepSeek-R1/V3以“低成本+高性能”横扫主流应用,微信、百度、腾讯、网易等巨头一日内全线接入,带动国产替代潮;大洋彼岸,马斯克xAI携20万块GPU推出Grok 3,刷新算力与榜单纪录,中美大模型竞速再升级。开源多模态、AI公务员、安全治理与评测基准同步更新,行业进入“落地+监管”双轨并行新周期。

01 | DeepSeek生态爆发

DeepSeek-R1/V3以1/10训练成本实现对标GPT-4o的性能,48小时内完成微信、百度App、腾讯元宝、网易有道SpaceOne、理想同学等头部产品的API深度集成,覆盖搜索、社交、教育、车载等全场景。国产模型首次在C端形成“默认选项”,带动芯片、框架、应用三层替代,大模型商业化进入“按调用量计费”的平价时代。

02 | Grok 3算力新王

马斯克xAI发布Grok 3,动用20万块英伟达H100,累计训练时长2亿GPU小时,竞技场得分首次突破1400,官方称“地球最聪明AI”。模型支持“深度搜索+工具调用+太空推理”三模式,并计划2026年随星舰部署至近地轨道,开启离线太空推理节点,算力竞赛从地面烧向太空。

03 | 开源多模态狂飙

阶跃星辰、昆仑万维、腾讯混元一日内集中开源5款多模态大模型,覆盖130B语音克隆、80秒单卡短剧生成、T2V高清视频,实现“零门槛”AIGC创作。国产开源首次在视频时长、语音情感、推理效率三项指标同时领先,开发者可在消费级显卡跑通商业级内容生产,UGC/PGC边界被彻底抹平。

04 | AI安全与治理

Hinton公开批评西方政要“轻视AI灭绝风险”,Anthropic悬赏2万美元发起全球越狱挑战赛,新护栏方案阻断95%提示注入;欧盟同步推进生成式AI伦理监管草案,要求模型备案与风险基金双轨并行。技术、政策、社区三方首次在同一周密集发声,预示“先发布后治理”时代结束。

05 | 政企AI公务员

深圳福田区一次性部署70名“AI数智员工”,基于DeepSeek大模型覆盖审批、客服、执法等240个高频政务场景,平均业务处理时长从小时级压缩至分钟级,效率提升10倍。广州同步跟进,计划年内上线200名数字员工,形成“人机协同”的基层治理新模板,为全国智慧城市提供可复制样本。

06 | 模型评测与基准

OpenAI发布真实软件工程悬赏平台SWE-Lancer,首次把自由职业级任务纳入模型评测,GPT-4o仅完成4%;北大团队基于DeepSeek-Coder推出几何定理模型,在IMO难度题库达到金牌水平,单卡4090即可跑通。新基准集体“升维”,倒逼模型从“答题”走向“干活”,科研与工业评价标准被重写。

【展望】DeepSeek的“平价API+开源权重”组合,正在把国产大模型从“能用”推向“默认用”;Grok 3的太空算力叙事则让军备竞赛跳出地球。当多模态创作门槛降至单机80秒、AI公务员批量上岗,行业即将面对“能力越界”与“治理追速”的新博弈:下一轮焦点不再是参数,而是谁能先跑出可持续的商业模式与可信赖的安全框架。

× 公众号二维码

扫码关注公众号获取每日简报