【概览】国产大模型在推理与多语言任务上集体跃迁,部分指标首次超越国际闭源标杆;与此同时,可自主读文献、写代码、投稿的“AI科学家”将科研周期从月压缩到小时,全球学术范式面临重塑。具身智能、海洋、考古等垂直场景同步爆发,叠加算力成本骤降,AI进入“能力-成本-合规”三线并行的新拐点。
01 | 国产大模型技术突破
科大讯飞发布星火 X1.5,支持 130 种语言,深度推理与数学能力较上一代提升 42%,在 MATH500 等公开评测中超过 GPT-4o;月之暗面开源的 Kimi K2 Thinking 则以 320B 参数在代码、逻辑推理两项任务上刷新 SOTA,首次实现国产开源模型对闭源王座的“定点爆破”。两款模型均基于国产算力栈完成训练,标志着国产芯片-框架-模型全链路跑通,为后续千亿级行业大模型奠定自主生态底座。
02 | AI科学家与科研自动化
Kosmos-Scientist、AlphaEvolve 等系统可在 12 小时内完成 1500 篇文献综述、4.2 万行代码实验及整篇论文撰写,已产出 7 项材料学与组合数学新结果,并获 ICLR 2026 初审高分。数学家陶哲轩公开试用 AlphaEvolve 后表示,AI 在 67 个数学难题中给出 9 个更优解,科研流程从“假设-实验-发表”升级为“目标-生成-验证”,人类科学家角色向“AI 督导”迁移。
03 | 具身智能与机器人ChatGPT时刻
Generalist 发布 GEN-0,基于 27 万小时真实操作数据总结出首条“具身缩放定律”:模型参数每翻一倍,任务成功率提升 8.3%,边际成本却下降 14%;宇树科技 Embodied Avatar 实现 5 分钟真人动作克隆,延迟低于 40 ms,小鹏 IRON 机器人完成连续后空翻,打破“人穿机甲”质疑。业内认为,机器人基础模型已出现类似 2022 年底 ChatGPT 的“能力跃迁”,2026 或成家庭/工厂通用机器人规模部署元年。
04 | 生成式AI内容治理
国家网信办、卫健委、市场监管总局联合整治“AI 伪科普”,严禁使用生成式 AI 制作虚假医疗信息;抖音同步启动仿冒名人带货专项治理,首批下架违规视频 2.3 万条。上海知识产权法院对国内首例“AI 提示词著作权案”作出判决,认定单一提示词不具备独创性,但经结构化设计的提示模板可受反不正当竞争法保护,为行业划出“合理使用”与抄袭红线。
05 | AI基础设施与成本骤降
OpenAI 与 AWS 签署 380 亿美元五年协议,独家使用新一代 Trainium3 芯片,集群规模达 180 万卡,单位训练成本下降 58%;谷歌宣布在圣诞岛新建 1 GW 绿色数据中心,海水冷却使 PUE 低至 1.05。Gemini API 文件搜索功能免费开放,上下文长度扩展至 200 万 token,而行业平均调用价一年内下降 900 倍,“比一瓶矿泉水还便宜”的算力正快速抹平初创公司与巨头的资源差距。
06 | AI+垂直行业落地
中海油与鹏城实验室发布全球首个 AI 海洋大模型“瞰海”,10 天完成 600 米深海温度-盐度-流速预测,误差<0.8%,为海上油气平台节省数亿元运维成本;北大团队构建古希腊陶罐 3D-VQA 数据集,AI 可根据碎片自动复原纹饰并生成考古报告;谷歌 DS-STAR 多智能体系统实现从数据清洗到模型部署的全流程自动化,在 Kaggle 竞赛中夺得 3 金 2 银,显示“AI 数据科学家”已具备商用级能力。
【展望】当国产大模型在性能与成本两端同时实现“弯道超车”,科研、制造、内容、海洋等垂直场景正被快速重写规则。随着算力价格继续下探、政策红线逐步清晰,2026 年的 AI 竞争将不再是“单点模型之王”,而是“模型-数据-场景-合规”四位一体的生态之争。