【概览】谷歌、阿里、字节同日祭出多模态“大杀器”,数学证明、3D理解与视频编辑被统一模型打通,科研范式迎来“通用科学智能”拐点;美国再收紧半导体出口并将华为昇腾列为“全球违禁”,中国把数据中心送上太空,中美算力博弈升维。
01 | 多模态大模型突破
谷歌AlphaEvolve以Gemini自进化架构刷新数学证明、芯片设计与矩阵乘法纪录,训练速度提升32.5%;阿里通义万相Wan2.1-VACE率先开源视频编辑统一模型,实现“一句话改视频”;字节Seed1.5-VL在60项基准中夺下38项第一,3D空间理解能力逼近人类水平。三箭齐发标志多模态进入“通用科学智能”阶段,科研与产业落地同步加速。
02 | 美国出口管制再升级
美国商务部突然废止《AI扩散规则》并推出更严苛的半导体禁令,明确“任何地点使用华为昇腾即违规”,英伟达股价应声再破3万亿美元;中国“星算”计划把数据中心送入近地轨道,试图以太空计算绕开地面封锁,中美算力博弈首次延伸至太空维度。
03 | 视频生成军备升级
淘宝天猫上线“AI图生视频”一键生成商品短片,可灵2.0继续霸榜全球视频模型,Lightricks推出10秒级LTX-Video-13B,Poe报告显示可灵已占30%市场份额。视频生成进入“秒级高清+电商落地”双轨竞速,中美模型差距快速收敛。
04 | AI编程工具新贵崛起
25岁MIT辍学者带领Cursor两年估值飙至90亿美元、年收入2亿美元;OpenAI发布专攻编程的GPT-4.1并全员免费开放;谷歌确认Chrome浏览器将深度集成Gemini助手。AI编程正从“代码补全”走向“全自动开发”,软件工业链面临重塑。
05 | 语音模型人格化浪潮
MiniMax新一代语音模型在人格化与自然度上横扫OpenAI与ElevenLabs登顶;Stability AI开源341M超轻TTS,手机端8秒出音频;讯飞AI耳机三年调用破千亿次,端侧低延迟成为语音赛道新门槛。
06 | 国产开源模型集体提速
DeepSeek-V3公开低成本训练细节,Qwen3家族8款模型一次性开源并演示“大带小”蒸馏,阿里通义万相视频编辑模型同步开源。国产大模型通过开源+降本策略快速放大生态,创业门槛被大幅拉低。
07 | 大厂人才与资本洗牌
微软WizardLM团队集体跳槽腾讯混元,vivo启动“蓝极星计划”全球无上限挖角博士,百度2亿元落子山东,鸿海宣布自研AI ASIC。顶级人才与自研芯片成为新一轮军备竞赛焦点,中国AI人才地图正在重构。
【展望】当多模态大模型把数学、视频、3D空间统一进“科学智能”新范式,基础科研与产业应用将呈现指数级交叉放大;而出口管制与太空算力的“天地博弈”提示,技术突破与地缘政治将长期耦合。接下来,谁能率先把通用科学智能做成“云端自来水”,谁就能定义下一个十年创新节拍。