【概览】8月4日,国内开源阵营集体“上新”,XBai o4、混元、MindLink等模型在推理与轻量化维度正面挑战OpenAI;Gemini 2.5 Deep Think拿下IMO金牌,宣告AI数学推理逼近人类天花板;与此同时,巨头间封锁升级、Agent IDE重塑开发流程,具身智能与多模态AIGC同步进入商业化冲刺,行业竞争全面白热化。
01 | 开源大模型密集上新
问小白XBai o4携“反思型推理”架构率先开源,宣称全面碾压o3-mini;腾讯混元一口气放出0.5B-7B四档轻量模型,谷歌langextract、昆仑万维MindLink紧随其后,覆盖结构化抽取与深度推理。国产开源矩阵首次在性能、参数梯度与场景落地三条战线同步对标闭源标杆,大幅降低行业调用与微调门槛。
02 | 数学推理突破成焦点
谷歌Gemini 2.5 Deep Think在IMO赛场斩获金牌,字节Seed-Prover、清华校友提示词方案亦同步攻克2025赛题,大模型形式化推理能力已比肩人类顶尖选手。数学自动证明的“最后一公里”被打通,科研发现、个性化辅导等场景迎来自动化奇点。
03 | 巨头竞争升级
Anthropic切断OpenAI对Claude的模型访问,苹果组建“答案引擎”团队并罕见宣布ALL-IN AI,xAI则高调挖角Meta核心工程师。数据、人才与模型壁垒成为新一轮“零和博弈”的核心筹码,头部公司全面开启封锁与反封锁。
04 | AI Coding重塑开发
Android Studio免费Agent、Figma开发者模式与全球首个云端Agent IDE相继上线,实现“设计→代码→部署”全链路无人化。项目级自动开发从概念走向工程现实,软件生产关系加速由“人写代码”转向“人审代码”。
05 | 中美AI治理与地缘博弈
美方发布《赢得竞赛》AI行动计划,中方则在WAIC强调“共赢共治”,姚期智等学者呼吁全球协同治理。AI已成大国科技战核心议题,政策走向将直接左右技术供应链、资本流动与跨境人才合作。
06 | 具身智能与机器人热潮
宇树科学家加盟杭州、深谋科技WAIC异军突起、汉王仿生鸟/狗即将亮相世界机器人大会,政策与资本双轮驱动下,国产机器人正走出实验室,向量产与场景落地冲刺,争夺下一个千亿级硬件入口。
07 | 多模态内容生成激战
Grok 30秒一键短视频、Adobe Photoshop Harmonize光影匹配、B站AI原声翻译、小红书emoji爆款教程等密集上线,多模态AIGC从“能生成”跃迁至“能商用”,内容平台竞争进入秒级生产时代。
【展望】当开源模型在性能与生态两端同时逼近闭源标杆,IMO级数学推理被连续攻克,AI已不仅是效率工具,更成为大国、大厂与创业阵营的“战略武器”。随着Agent接管开发链路、具身智能走向量产、多模态生成进入秒级商用,下一轮竞争焦点将快速从“模型能力”转向“场景独占”与“治理话语权”。政策、资本与技术的三重变量交织,行业即将迈入更加激烈的零和博弈新周期。