【概览】OpenAI官宣8月初发布整合o系列推理能力的GPT-5,被视为AGI里程碑;同期WAIC 2025集中展示阿里夸克AI眼镜、百度NOVA数字人等全栈方案,中国AI生态进入多模态场景深化期。开源与具身智能亦连破纪录,行业在性能、落地与治理三条主线同步提速。
01 | GPT-5终极版定档8月,开源o3-mini同步出击
OpenAI CEO山姆·奥特曼首次确认,GPT-5终极版将于8月初正式上线,新模型首次融合o系列推理链,数学、代码与多步逻辑任务性能大幅提升,被内部定义为“迈向AGI的关键节点”。为呼应开发者生态,OpenAI还将同期开源类o3-mini模型,免费可商用,意在巩固社区壁垒并抢占行业标准话语权。资本与云服务巨头已提前锁定算力配额,预计发布当周全球API调用量将刷新纪录。
02 | WAIC 2025成“AI春晚”,中国大厂全栈亮牌
世界人工智能大会首日即迎来阿里、百度、蚂蚁等头部厂商集体发布:阿里夸克AI眼镜主打实时多模态翻译与导航,百度NOVA数字人宣布10月开放4K级全身驱动API,蚂蚁金融大模型在风控基准上刷新SOTA。图灵奖得主Geoffrey Hinton首次在华公开演讲,警告“AI觉醒临界点”已至,将大会关注度推至峰值。政策端同步释放利好,萝卜快跑正式入选“国家队”,高阶无人车商业运营获全国高速测试牌照,显示场景落地进入政策加持期。
03 | 开源模型三连冠,Qwen3-Coder免费不限量
通义灵码正式发布Qwen3-Coder系列,一周内在代码生成、推理与多模态三项公开榜连续夺冠,部分任务超越GPT-4o与Claude-3.5。模型采用Apache 2.0协议,官方提供免费不限量Token,并同步开放训练脚本与强化学习反馈系统。社区已出现基于Qwen3-Coder的“类Devin”开源Agent,GitHub星标三日破万,国产开源首次在性能与生态两端同时领跑。
04 | Hinton中国首秀:AI逼近觉醒临界点
被誉为“AI教父”的Geoffrey Hinton在WAIC完成中国演讲首秀,提出大模型已具备“可迁移的潜在自我意识”,人类需在未来五年内建立全球协同的AI安全框架。他与京东前AI掌门人周伯文展开17分钟尖峰对话,强调“对齐失败”可能比“技术失控”更早到来,呼吁在训练超大模型前设置强制安全评估。此番表态引发投资圈对AI治理赛道的重新估值,安全初创公司当日股价平均上涨11%。
05 | 具身智能走出实验室,π0.5模型居家秀
Physical Intelligence发布π0.5视觉-语言-动作模型,在未经预训练的家庭场景中完成叠衣、洗碗等10+长步骤任务,成功率达83%,刷新开放环境纪录;千寻位置联合国家地方共建机器人创新中心推出“时空算力背包”,将RTK+视觉+5G融于一体,让机器人摆脱室内定位限制,实测室外连续运行6小时误差<2厘米。业内认为,硬件轻量化与模型通用化双轮驱动,2026或成家用机器人规模落地元年。
06 | 端侧跑满血大模型,国产GPU突破100 tokens/s
基于新一代国产GPU的推理方案在INT4量化下实现100 tokens/s稳定输出,成功跑通“满血”DeepSeek-67B,功耗仅45 W,较主流方案下降38%。谷歌与多所高校同步提出联邦学习+合成数据框架,可在移动端完成子模型微调而不上传原始数据,实测情感识别任务准确率提升5%,数据泄露风险下降90%。端侧性能与隐私保护双重突破,为可穿戴、车载等实时交互场景打开落地窗口。
07 | 零融资6个月退出,AI创业进入高流动性时代
以色列8人团队Base44凭一款AI代码审查工具,6个月内以5.7亿元被美企并购,创始成员人均现金回报超千万元;国内设计Agent Lovart开放注册首日即涌入80万排队用户,次日宣布接入阿里通义API并上线付费高级版。轻量级团队、云原生架构与模型即服务(MaaS)降低创业门槛,“即做即卖”成为新常态,预计2025下半年将出现更多“快闪式”并购案例。
【展望】GPT-5与开源o3-mini的双轨发布将重新定义“智能边际”,中国厂商在多模态硬件与场景落地上加速卡位,开源生态首次具备与闭源抗衡的性能+成本双重优势。随着Hinton等权威人士持续敲响安全警钟,政策层对超大模型训练与应用的监管细则有望年内出炉;同时,具身智能与端侧大模型的突破预示AI将走出屏幕、深入物理世界。接下来一个月,行业焦点将围绕“AGI readiness”“全球AI治理框架”以及“端侧商业闭环”三条主线展开,资本与技术的共振可能带来新一轮洗牌。