2025-05-16 AI简报 - AI快开门

【概览】谷歌、阿里、字节同日祭出多模态“大杀器”，数学证明、3D理解与视频编辑被统一模型打通，科研范式迎来“通用科学智能”拐点；美国再收紧半导体出口并将华为昇腾列为“全球违禁”，中国把数据中心送上太空，中美算力博弈升维。

01 | 多模态大模型突破

谷歌AlphaEvolve以Gemini自进化架构刷新数学证明、芯片设计与矩阵乘法纪录，训练速度提升32.5%；阿里通义万相Wan2.1-VACE率先开源视频编辑统一模型，实现“一句话改视频”；字节Seed1.5-VL在60项基准中夺下38项第一，3D空间理解能力逼近人类水平。三箭齐发标志多模态进入“通用科学智能”阶段，科研与产业落地同步加速。

02 | 美国出口管制再升级

美国商务部突然废止《AI扩散规则》并推出更严苛的半导体禁令，明确“任何地点使用华为昇腾即违规”，英伟达股价应声再破3万亿美元；中国“星算”计划把数据中心送入近地轨道，试图以太空计算绕开地面封锁，中美算力博弈首次延伸至太空维度。

03 | 视频生成军备升级

淘宝天猫上线“AI图生视频”一键生成商品短片，可灵2.0继续霸榜全球视频模型，Lightricks推出10秒级LTX-Video-13B，Poe报告显示可灵已占30%市场份额。视频生成进入“秒级高清+电商落地”双轨竞速，中美模型差距快速收敛。

04 | AI编程工具新贵崛起

25岁MIT辍学者带领Cursor两年估值飙至90亿美元、年收入2亿美元；OpenAI发布专攻编程的GPT-4.1并全员免费开放；谷歌确认Chrome浏览器将深度集成Gemini助手。AI编程正从“代码补全”走向“全自动开发”，软件工业链面临重塑。

05 | 语音模型人格化浪潮

MiniMax新一代语音模型在人格化与自然度上横扫OpenAI与ElevenLabs登顶；Stability AI开源341M超轻TTS，手机端8秒出音频；讯飞AI耳机三年调用破千亿次，端侧低延迟成为语音赛道新门槛。

06 | 国产开源模型集体提速

DeepSeek-V3公开低成本训练细节，Qwen3家族8款模型一次性开源并演示“大带小”蒸馏，阿里通义万相视频编辑模型同步开源。国产大模型通过开源+降本策略快速放大生态，创业门槛被大幅拉低。

07 | 大厂人才与资本洗牌

微软WizardLM团队集体跳槽腾讯混元，vivo启动“蓝极星计划”全球无上限挖角博士，百度2亿元落子山东，鸿海宣布自研AI ASIC。顶级人才与自研芯片成为新一轮军备竞赛焦点，中国AI人才地图正在重构。

【展望】当多模态大模型把数学、视频、3D空间统一进“科学智能”新范式，基础科研与产业应用将呈现指数级交叉放大；而出口管制与太空算力的“天地博弈”提示，技术突破与地缘政治将长期耦合。接下来，谁能率先把通用科学智能做成“云端自来水”，谁就能定义下一个十年创新节拍。

AI快开门

发现最好的AI工具

AI行业新闻简报 2025.05.16 周五