2025-11-08 AI简报 - AI快开门

【概览】国产大模型在推理与多语言任务上集体跃迁，部分指标首次超越国际闭源标杆；与此同时，可自主读文献、写代码、投稿的“AI科学家”将科研周期从月压缩到小时，全球学术范式面临重塑。具身智能、海洋、考古等垂直场景同步爆发，叠加算力成本骤降，AI进入“能力-成本-合规”三线并行的新拐点。

01 | 国产大模型技术突破

科大讯飞发布星火 X1.5，支持 130 种语言，深度推理与数学能力较上一代提升 42%，在 MATH500 等公开评测中超过 GPT-4o；月之暗面开源的 Kimi K2 Thinking 则以 320B 参数在代码、逻辑推理两项任务上刷新 SOTA，首次实现国产开源模型对闭源王座的“定点爆破”。两款模型均基于国产算力栈完成训练，标志着国产芯片-框架-模型全链路跑通，为后续千亿级行业大模型奠定自主生态底座。

02 | AI科学家与科研自动化

Kosmos-Scientist、AlphaEvolve 等系统可在 12 小时内完成 1500 篇文献综述、4.2 万行代码实验及整篇论文撰写，已产出 7 项材料学与组合数学新结果，并获 ICLR 2026 初审高分。数学家陶哲轩公开试用 AlphaEvolve 后表示，AI 在 67 个数学难题中给出 9 个更优解，科研流程从“假设-实验-发表”升级为“目标-生成-验证”，人类科学家角色向“AI 督导”迁移。

03 | 具身智能与机器人ChatGPT时刻

Generalist 发布 GEN-0，基于 27 万小时真实操作数据总结出首条“具身缩放定律”：模型参数每翻一倍，任务成功率提升 8.3%，边际成本却下降 14%；宇树科技 Embodied Avatar 实现 5 分钟真人动作克隆，延迟低于 40 ms，小鹏 IRON 机器人完成连续后空翻，打破“人穿机甲”质疑。业内认为，机器人基础模型已出现类似 2022 年底 ChatGPT 的“能力跃迁”，2026 或成家庭/工厂通用机器人规模部署元年。

04 | 生成式AI内容治理

国家网信办、卫健委、市场监管总局联合整治“AI 伪科普”，严禁使用生成式 AI 制作虚假医疗信息；抖音同步启动仿冒名人带货专项治理，首批下架违规视频 2.3 万条。上海知识产权法院对国内首例“AI 提示词著作权案”作出判决，认定单一提示词不具备独创性，但经结构化设计的提示模板可受反不正当竞争法保护，为行业划出“合理使用”与抄袭红线。

05 | AI基础设施与成本骤降

OpenAI 与 AWS 签署 380 亿美元五年协议，独家使用新一代 Trainium3 芯片，集群规模达 180 万卡，单位训练成本下降 58%；谷歌宣布在圣诞岛新建 1 GW 绿色数据中心，海水冷却使 PUE 低至 1.05。Gemini API 文件搜索功能免费开放，上下文长度扩展至 200 万 token，而行业平均调用价一年内下降 900 倍，“比一瓶矿泉水还便宜”的算力正快速抹平初创公司与巨头的资源差距。

06 | AI+垂直行业落地

中海油与鹏城实验室发布全球首个 AI 海洋大模型“瞰海”，10 天完成 600 米深海温度-盐度-流速预测，误差<0.8%，为海上油气平台节省数亿元运维成本；北大团队构建古希腊陶罐 3D-VQA 数据集，AI 可根据碎片自动复原纹饰并生成考古报告；谷歌 DS-STAR 多智能体系统实现从数据清洗到模型部署的全流程自动化，在 Kaggle 竞赛中夺得 3 金 2 银，显示“AI 数据科学家”已具备商用级能力。

【展望】当国产大模型在性能与成本两端同时实现“弯道超车”，科研、制造、内容、海洋等垂直场景正被快速重写规则。随着算力价格继续下探、政策红线逐步清晰，2026 年的 AI 竞争将不再是“单点模型之王”，而是“模型-数据-场景-合规”四位一体的生态之争。

AI快开门

发现最好的AI工具