DeepSeek-R1-0528、通义VRAG-RL、华为昇腾MoE等国产模型密集升级或开源,数学、推理、多模态、训练效率全面对标o3/Gemini 2.5 Pro,形成“无需GPU的国产闭环”,标志着中国大模型进入第一梯队,全球开源生态格局被重写。
FLUX.1 Kontext、可灵2.1、Gemini视频OCR等新架构同时接受文本+图像输入,流匹配与上下文内生成带来8倍速率和物理真实感提升;RISEBench揭示现有模型编辑准确率不足30%,倒逼新基准与算法同步进化。
10个7B模型并联无额外训练即可在多项任务上跑赢GPT-4.1,TON选择性推理把推理长度砍90%准确率反增17%,阿里通义“推理+搜索”框架让小模型在开放域问答媲美大模型,预示“小而精”成为普惠AI新主流。
智源大会聚焦“自主智能体+科学共生”,DeepMind开源数学证明习题集,三组分微反应数据集规模刷新纪录,科学智能大赛首次设中学生赛道,产学研联动为AI驱动科研提供标准、数据与人才三重底座。
强化学习让机器狗从零学会羽毛球对打并涌现类人回位,EvoAgentX框架实现多智能体“一次部署终生自进化”,Hugging Face 250美元开源人形机器人降低硬件门槛,具身智能与智能体系统同步进入“自我迭代”时代。