【概览】头部厂商在视觉-语言-语音一体化赛道正面硬刚,开源与闭源同时刷新SOTA;另一边,0.2B级“迷你”模型把性能塞进手机,端侧AI正式迈入可用时代。科研、人才、资本三线共振,AI正从“能用”走向“无处不在”。
01 | 多模态大模型争霸
Meta一夜开源70亿参数DINOv3,吞下17亿张图片重定义CV天花板;GPT-5医学多模态在多项临床推理任务上超越人类医生24%,视觉-语言-语音一体化成为OpenAI、Meta、谷歌的必争之地。开源与闭源齐头并进,预计自动驾驶、医疗影像、内容生成将在12个月内迎来批量落地。
02 | 端侧超小模型爆发
谷歌连续开源0.27B Gemma 3与4B Jan-v1,4个注意力头即可在浏览器里跑通多轮对话,性能对标数十亿级大模型;Perplexity Pro平替模型仅4B参数却免费可商用。端侧AI进入“本地部署、即时响应、隐私无忧”的实用阶段,移动应用、IoT与隐私计算生态将被重写。
03 | AI for Science突破
AI预测核聚变点火成功率突破70%,为清洁能源路线提供实时决策引擎;潘建伟团队借AI在60毫秒完成2024个原子精准重排,刷新量子操控极限;GeneAgent自验证机制把基因集分析耗时从天级缩到分钟级。基础科研正形成“AI先算、实验验证”的新范式。
04 | 人才与治理流动
OpenAI“波兰帮”与多名华人科学家被Meta以亿元薪酬挖角;Cohere获5亿美元融资并引入前Meta FAIR副总裁出任首席AI官。高端人才与资本同步洗牌,国家级AI大赛更抛出200万元奖金池争抢团队,下一代模型竞争格局提前锁定“人才密度”门槛。
05 | 算法机制可解释进展
斯坦福CS25课程最新实验首次观测到自注意力“位置记忆—语义理解”相变点,为解释大模型推理路径、幻觉来源提供可计算框架。DeepMind首席科学家亲授的一课显示,可解释性正从“可视化”走向“可控变量”,有望在下一代安全对齐中成为强制指标。
06 | 机器人产业链集结
FAIR plus 2026发布会推出3D生成质量榜单与提示词多样性标准,填补机器人“硬件-算法-场景”全链路评测空白;宇树机器人“撞人逃逸”事件倒逼行业完善安全协议。硬件性能、算法鲁棒性与场景标准同步推进,商用落地门槛被系统性降低。
07 | 合规与出海挑战
欧盟GDPR、北美IP保护、东南亚数据本地化要求差异显著,AI初创若未在股权架构、训练数据合规、资金出海(ODI)等环节提前布局,将面临高额罚款与市场禁入风险。合规正从“法律后置”变为“产品设计前置”。
08 | 行业泡沫与就业寒潮
美国CS毕业生狂投5000份简历0 Offer、被麦当劳拒绝的案例刷屏,科技巨头持续裁员并加速用AI替代初级编码岗位。高校与求职市场被迫重新评估“算力+算法”之外的软技能与跨学科能力,AI人才供给结构进入再平衡。
【展望】当多模态大模型与终端小模型在同一日各放异彩,AI的“云端霸权”与“边缘民主”不再是非此即彼,而是互为犄角。随着科研、制造、医疗等硬核场景被连续攻克,行业即将进入“模型即设施”时代;与此同时,人才流动、合规门槛与就业寒潮提醒所有玩家:技术狂奔之外,治理与生态建设已成下一赛段的胜负手。