【概览】蚂蚁集团开源dInfer框架,将扩散语言模型推理速度提升10倍,首次在效率层面反超自回归范式;GPT-5与Gemini 2.5 Pro在国际天文奥赛再夺金牌,完成奥赛大满贯。技术突破、人才争夺与监管警示同步升温,AI正从“能用”走向“好用、敢用”的关键拐点。
01 | 扩散语言模型推理突破
蚂蚁集团周末开源业内首个高性能扩散语言模型推理框架dInfer,通过内核融合与动态稀疏调度,将推理延迟压缩至原来的十分之一,在同等精度下首次实现对比自回归模型的代际反超。该成果被视作后Transformer时代的重要基座,为端侧大模型、实时对话、金融风控等场景打开商业化闸门。
02 | AI奥赛横扫人类金牌
GPT-5与Gemini 2.5 Pro联袂出战第28届国际天文与天体物理奥赛(IOAA),以超出人类金牌线2.7分的成绩包揽金牌,至此已在数学、信息学、天文学完成奥赛大满贯。评测组委会透露,AI在复杂公式推导、多步物理建模与观测数据分析环节均展现“零失误”水准,标志大模型科学推理能力已突破人类顶尖阈值。
03 | Meta人才与技术双线突围
Meta以最高15亿美元薪酬迎回“PyTorch之王”——Thinking Machines Lab联合创始人,同时发布无监督自我进化智能体论文,提出以环境经验驱动的持续强化学习新范式。一周内完成“最贵挖角”与“范式论文”双重亮相,显示Meta在顶尖人才储备与下一代AI架构上的双线反攻。
04 | 多模态小模型性能跃迁
抖音与LV-NUS联合开源8B参数多模态模型SAIL-VL2,清华团队同步发布GAGA-1,两者在复杂推理、口型同步视频生成等任务上对齐GPT-4o得分。研究者指出,通过高质量指令微调与视觉token重排,小模型无需堆参数即可提供大模型级体验,为端侧低成本部署提供可复现路径。
05 | 视频生成2.0时代来临
OpenAI正式开启Sora2安卓端预注册,并推出免费无水印生成额度;LiblibAI 2.0上线内置顶级模型并限时赠送算力。日本数字厅率先对Sora2发出版权合规警告,要求平台标识AI生成内容。技术普惠与监管细则同步落地,标志着AI视频生成从“炫技Demo”进入“大众工具”阶段。
06 | AI治理与风险新议题
“AI教父”Hinton再度发声,称大模型已出现“无意识意识雏形”;俄亥俄州提交法案拟禁止AI获得法律人格及“结婚权”;央视曝光“AI论文黑工厂”,枪手借助模板化大模型日产30篇SCI级文章。技术狂奔背后,伦理、法律与社会风险正同步升级,倒逼全球监管框架加速成型。
【展望】扩散模型在推理侧实现“弯道超车”,小模型多模态性能逼近GPT-4o,显示算法与工程优化仍有巨大红利;与此同时,AI正横扫人类顶尖智力赛场,倒逼教育、科研与人才评价体系的重新校准。下周焦点将集中在dInfer社区生态能否快速成型、Meta自我进化智能体的可复现性,以及各国对视频生成版权的进一步细则落地。