【概览】6月6日,国产大模型在代码、多模态、向量模型三线齐发,性能对标OpenAI与谷歌,生态竞争进入白热化;与此同时,谷歌Gemini 2.5 Pro预览版重夺竞技场榜首,AI编程与视频生成赛道融资与产品爆发,具身智能、硬件优化、监管治理同步推进,全行业呈“模型-应用-治理”共振态势。
01 | 国产大模型密集升级
阿里通义千问一日内开源Qwen3向量与Embedding双系列,智源「悟界」Emu3多模态大模型首次实现宏观-微观双宇宙视觉统一,字节Seed-Coder携Mixture-of-Thoughts策略聚焦高质量代码推理。三大模型在MTEB、HumanEval、MMMU等基准上齐刷SOTA,标志国产开源模型正式在向量、多模态、编程三大核心场景对表OpenAI与谷歌,生态卡位战全面升温。
02 | Gemini 2.5 Pro再夺榜一
谷歌深夜放出Gemini 2.5 Pro预览版,以刷新代码生成、数学推理、复杂逻辑三大竞技场纪录的方式重回全球第一,同时上线Portraits功能,支持用户与虚拟专家多轮语音对话。闭源模型头部竞争再被拉高,也为下游AI编程、教育、创意场景提供新基座。
03 | AI编程工具新里程碑
Cursor 1.0正式版携“自动捉虫、秒改屎山”功能登场,母公司Anysphere完成9亿美元C轮,估值一年翻四倍至99亿美元;Trae第一时间集成Gemini 2.5 Pro,Figma推出设计转代码AI插件。AI编程正从“辅助”走向“零代码”,开发者生产力被重新定义。
04 | AI视频生成激战升级
PixVerse国内版「拍我AI」上线即登顶免费榜,Diffusion Studio Pro打出“本地版CapCut+Cursor”口号,Luma一键把抽象小视频变特效大片,Higgsfield数字人Speak功能实现口型级精度;可灵AI月付费连续破亿,国内创作者生态率先爆发,AI视频正式从“玩具”升级为“生产力”。
05 | 具身智能与机器人新范式
智源RoboBrain 2.0率先支持MCP(多模态-常识-规划)机制,上海AI实验室发布「通才」机器人大脑VeBrain,SmolVLA以1/10参数量实现视觉-语言-动作一体化,星尘智能与深圳养老护理院合作推进养老机器人落地。大模型从“对话”走向“行动”,具身智能进入多场景落地期。
06 | AI硬件与底层优化
AMD收购AI加速芯片公司Brium直接挑战英伟达;华为CloudMatrix 384超节点实现训推共卡,整体提速50%;清华与蚂蚁开源全异步RL框架AReaL,14B模型一夜击穿SOTA。系统级创新成为争夺下一波算力红利的主战场,国产方案开始崭露头角。
07 | AI安全与治理动态
美国法院考虑拆分谷歌并单列AI监管条款;马斯克旗下X平台更新政策禁止第三方用用户内容训练AI;Anthropic切断Windsurf模型访问,强调长期合作客户优先。全球对AI垄断、数据主权与模型安全的监管压力骤升,行业规则正在重写。
【展望】国产大模型在开源、多模态与代码方向完成关键卡位,与谷歌Gemini 2.5 Pro的闭源巅峰形成“双轨竞速”;AI编程与视频生成工具同步爆发,生产力场景进入零门槛时代;具身智能、硬件优化与监管治理三线并进,提示下一阶段竞争焦点将从“炼大模型”转向“用大模型”,谁能率先打通商业闭环,谁就能占得未来五年AI生态中枢。