← 返回列表

AI行业新闻简报 2025.07.13 周日

📊 7 个话题 📰 22 条新闻 🕐 2025-07-13 05:30

【概览】

7月12日凌晨,月之暗面突然开源1T参数通用模型K2,刷新数学定理证明等多项SOTA,国产大模型首次迈入“万亿俱乐部”。同一日,扩散模型量化与端侧加速取得6倍无损提速,Meta、谷歌、OpenAI掀起新一轮“人才闪电战”,科研专用LLM评估基准SciArena上线,AI4Science在制糖、蛋白降解与深空探索连获突破,后Transformer架构探索与开源生态同步升温,行业进入“参数+人才+场景”三维竞速新阶段。

01 | Kimi K2开源冲击SOTA

月之暗面在24小时内连续发布并开源K2系列:先推代码与Agent专用模型,再深夜放出国内首个1T参数通用大模型。K2在数学定理证明任务上反超DeepSeek-Prover-V2,刷新多项SOTA,标志着国产模型正式跻身万亿参数时代,对闭源的OpenAI形成直接压力,也验证“发布即开源”策略可以快速聚拢社区算力与场景反馈。

02 | 扩散模型量化加速突破

港科大、北航与莫纳什大学联合提出TFMQ-DM框架,首次实现4-bit无损压缩+6倍推理加速,通过“时间特征维护”破解扩散模型量化敏感难题;配套EasyCache方案无需训练即可对视频扩散模型进行极简高速缓存。两项成果齐发,为端侧高清图像与视频生成铺平道路,入选TPAMI 2025。

03 | 顶尖人才大迁徙

Meta以2亿美元总包挖走苹果基础模型负责人,OpenAI两名多模态骨干同日转投Meta,谷歌DeepMind闪电截胡Windsurf核心团队。华人学者在Grok 4项目中占比高达八成,清华、上交校友站C位。密集跳槽背后,既有巨头对顶级AI人才的极度饥渴,也暴露部分公司内部文化危机与绩效内卷。

04 | 科研专用LLM评估新基准

Ai2、耶鲁、NYU联合上线全球首个科研LLM竞技场SciArena,23款顶级模型在学术写作、公式推导与实验设计等任务中同台竞技,o3夺冠、DeepSeek-R1位列第四。实验暴露传统自动指标难以捕捉科研人员偏好,将推动下一版学术辅助模型向“可解释、可溯源、可交互”方向迭代。

05 | AI for Science前沿进展

中科院团队实现无需光合作用的“二氧化碳制糖”,被视为深空探测前置技术;DRUGAI发布SE(3)等变框架DeepTernary,精准预测靶蛋白降解三元复合物结构;北大-腾讯优图提出正交子空间分解方法,破解AI生图检测在不同域下的泛化难题。AI正向生化、材料、深空探索等硬核科学纵深渗透。

06 | 模型架构新范式探索

Mamba作者再发论文提出无Tokenizer架构,直接对原始字节进行建模,挑战Transformer统治地位;北大与港中文借鉴大脑功能分化推出Fast-in-Slow VLA,实现“快行动”与“慢推理”统一;ICCV 2025新研究用自回归模型探索多视图生成,显示后Transformer时代多样化路线正加速涌现。

07 | AI创业与开源生态

Robinhood CEO跨界创立Harmonic AI,主打金融级可信大模型;Apache CoC Asia 2025首次设置AI专题论坛,Kimi选择开源打法迅速聚拢社区。金融、开源社区与模型公司加速融合,低成本、高性能、可商用方案将重塑AI创业生态。

【展望】

当“万亿参数”成为国产模型的新起点,人才、算力与数据的三重军备竞赛将愈发激烈;扩散模型端侧化与AI4Science纵深落地,则把竞赛焦点从“训练”推向“推理”与“场景”。随着开源生态与跨界资本持续注入,下半年行业或将迎来“低成本高性能”方案的密集爆发,进一步拉低创业门槛,加速AI在科研、工业与消费端的全面渗透。