2025-07-13 AI简报 - AI快开门

【概览】

7月12日凌晨，月之暗面突然开源1T参数通用模型K2，刷新数学定理证明等多项SOTA，国产大模型首次迈入“万亿俱乐部”。同一日，扩散模型量化与端侧加速取得6倍无损提速，Meta、谷歌、OpenAI掀起新一轮“人才闪电战”，科研专用LLM评估基准SciArena上线，AI4Science在制糖、蛋白降解与深空探索连获突破，后Transformer架构探索与开源生态同步升温，行业进入“参数+人才+场景”三维竞速新阶段。

01 | Kimi K2开源冲击SOTA

月之暗面在24小时内连续发布并开源K2系列：先推代码与Agent专用模型，再深夜放出国内首个1T参数通用大模型。K2在数学定理证明任务上反超DeepSeek-Prover-V2，刷新多项SOTA，标志着国产模型正式跻身万亿参数时代，对闭源的OpenAI形成直接压力，也验证“发布即开源”策略可以快速聚拢社区算力与场景反馈。

02 | 扩散模型量化加速突破

港科大、北航与莫纳什大学联合提出TFMQ-DM框架，首次实现4-bit无损压缩+6倍推理加速，通过“时间特征维护”破解扩散模型量化敏感难题；配套EasyCache方案无需训练即可对视频扩散模型进行极简高速缓存。两项成果齐发，为端侧高清图像与视频生成铺平道路，入选TPAMI 2025。

03 | 顶尖人才大迁徙

Meta以2亿美元总包挖走苹果基础模型负责人，OpenAI两名多模态骨干同日转投Meta，谷歌DeepMind闪电截胡Windsurf核心团队。华人学者在Grok 4项目中占比高达八成，清华、上交校友站C位。密集跳槽背后，既有巨头对顶级AI人才的极度饥渴，也暴露部分公司内部文化危机与绩效内卷。

04 | 科研专用LLM评估新基准

Ai2、耶鲁、NYU联合上线全球首个科研LLM竞技场SciArena，23款顶级模型在学术写作、公式推导与实验设计等任务中同台竞技，o3夺冠、DeepSeek-R1位列第四。实验暴露传统自动指标难以捕捉科研人员偏好，将推动下一版学术辅助模型向“可解释、可溯源、可交互”方向迭代。

05 | AI for Science前沿进展

中科院团队实现无需光合作用的“二氧化碳制糖”，被视为深空探测前置技术；DRUGAI发布SE(3)等变框架DeepTernary，精准预测靶蛋白降解三元复合物结构；北大-腾讯优图提出正交子空间分解方法，破解AI生图检测在不同域下的泛化难题。AI正向生化、材料、深空探索等硬核科学纵深渗透。

06 | 模型架构新范式探索

Mamba作者再发论文提出无Tokenizer架构，直接对原始字节进行建模，挑战Transformer统治地位；北大与港中文借鉴大脑功能分化推出Fast-in-Slow VLA，实现“快行动”与“慢推理”统一；ICCV 2025新研究用自回归模型探索多视图生成，显示后Transformer时代多样化路线正加速涌现。

07 | AI创业与开源生态

Robinhood CEO跨界创立Harmonic AI，主打金融级可信大模型；Apache CoC Asia 2025首次设置AI专题论坛，Kimi选择开源打法迅速聚拢社区。金融、开源社区与模型公司加速融合，低成本、高性能、可商用方案将重塑AI创业生态。

【展望】

当“万亿参数”成为国产模型的新起点，人才、算力与数据的三重军备竞赛将愈发激烈；扩散模型端侧化与AI4Science纵深落地，则把竞赛焦点从“训练”推向“推理”与“场景”。随着开源生态与跨界资本持续注入，下半年行业或将迎来“低成本高性能”方案的密集爆发，进一步拉低创业门槛，加速AI在科研、工业与消费端的全面渗透。

AI快开门

发现最好的AI工具

AI行业新闻简报 2025.07.13 周日