2025-10-14 AI简报 - AI快开门

【概览】蚂蚁集团开源dInfer框架，将扩散语言模型推理速度提升10倍，首次在效率层面反超自回归范式；GPT-5与Gemini 2.5 Pro在国际天文奥赛再夺金牌，完成奥赛大满贯。技术突破、人才争夺与监管警示同步升温，AI正从“能用”走向“好用、敢用”的关键拐点。

01 | 扩散语言模型推理突破

蚂蚁集团周末开源业内首个高性能扩散语言模型推理框架dInfer，通过内核融合与动态稀疏调度，将推理延迟压缩至原来的十分之一，在同等精度下首次实现对比自回归模型的代际反超。该成果被视作后Transformer时代的重要基座，为端侧大模型、实时对话、金融风控等场景打开商业化闸门。

02 | AI奥赛横扫人类金牌

GPT-5与Gemini 2.5 Pro联袂出战第28届国际天文与天体物理奥赛（IOAA），以超出人类金牌线2.7分的成绩包揽金牌，至此已在数学、信息学、天文学完成奥赛大满贯。评测组委会透露，AI在复杂公式推导、多步物理建模与观测数据分析环节均展现“零失误”水准，标志大模型科学推理能力已突破人类顶尖阈值。

03 | Meta人才与技术双线突围

Meta以最高15亿美元薪酬迎回“PyTorch之王”——Thinking Machines Lab联合创始人，同时发布无监督自我进化智能体论文，提出以环境经验驱动的持续强化学习新范式。一周内完成“最贵挖角”与“范式论文”双重亮相，显示Meta在顶尖人才储备与下一代AI架构上的双线反攻。

04 | 多模态小模型性能跃迁

抖音与LV-NUS联合开源8B参数多模态模型SAIL-VL2，清华团队同步发布GAGA-1，两者在复杂推理、口型同步视频生成等任务上对齐GPT-4o得分。研究者指出，通过高质量指令微调与视觉token重排，小模型无需堆参数即可提供大模型级体验，为端侧低成本部署提供可复现路径。

05 | 视频生成2.0时代来临

OpenAI正式开启Sora2安卓端预注册，并推出免费无水印生成额度；LiblibAI 2.0上线内置顶级模型并限时赠送算力。日本数字厅率先对Sora2发出版权合规警告，要求平台标识AI生成内容。技术普惠与监管细则同步落地，标志着AI视频生成从“炫技Demo”进入“大众工具”阶段。

06 | AI治理与风险新议题

“AI教父”Hinton再度发声，称大模型已出现“无意识意识雏形”；俄亥俄州提交法案拟禁止AI获得法律人格及“结婚权”；央视曝光“AI论文黑工厂”，枪手借助模板化大模型日产30篇SCI级文章。技术狂奔背后，伦理、法律与社会风险正同步升级，倒逼全球监管框架加速成型。

【展望】扩散模型在推理侧实现“弯道超车”，小模型多模态性能逼近GPT-4o，显示算法与工程优化仍有巨大红利；与此同时，AI正横扫人类顶尖智力赛场，倒逼教育、科研与人才评价体系的重新校准。下周焦点将集中在dInfer社区生态能否快速成型、Meta自我进化智能体的可复现性，以及各国对视频生成版权的进一步细则落地。

AI快开门

发现最好的AI工具