【概览】上海交大等团队把“人类最后的考试”拉过30分线,国产大模型综合推理能力首次领跑全球;同日,3B-4B多模态小模型集体开源、长视频生成提速3.7倍、欧美同步收紧AI治理规则,技术突破与政策博弈同频升温。
01 | 国产模型刷新“最难考试”纪录
在被誉为“人类最后的考试”的综合性基准上,上海交大、昆仑万维等联合开源方案首次突破30分,超越OpenAI o1、Gemini Ultra,标志着国产大模型推理能力跻身全球第一梯队,为AGI竞赛注入关键中国变量。
02 | 多模态小模型爆发
Hugging Face、阿里、腾讯、字节24小时内连发3B-4B参数多模态小模型,支持128K上下文、链式推理与按需搜索,在端侧实时场景逼近大模型效果,“小而强”范式正式开启。
03 | 视频生成效率革命
MIT、Vidu、Moonvalley、谷歌Veo3同步公布新架构,长视频生成提速3.7倍、成本降4.4倍,原生1080P、多图参考与静态图驱动成为标配,AI影视工业化再进一步。
04 | AI安全与治理升级
美国拟设“敌对AI清单”,欧盟重申AI法案2025落地不变;金砖国家通过全球治理宣言。与此同时,聊天机器人被证实可被“信息过载攻击”诱导违规,技术风险与地缘博弈交织,AI治理步入深水区。
05 | 巨头人才与资本暗战
OpenAI四天挖角特斯拉、xAI、Meta四名顶级工程师,加码“星际之门”;Meta反向收割苹果基础模型负责人;Mistral寻求10亿美元融资争夺欧洲AI王座,头部厂商围绕人才与资金全面开火。
06 | 企业级AI办公全家桶
飞书、钉钉同日发布AI表格、知识问答等新品,打造“企业豆包”式智能办公生态;苹果、谷歌内测AI客服与视频生成工具,To B与To C场景同步渗透,办公智能化进入批量复制期。
07 | 具身智能与机器人IPO
美团再投星海图超1亿美元,镁伽科技冲刺港股105亿估值IPO;VLA模型从RT-2到FiS-VLA快速迭代,机器人“即知即行”能力逼近落地,资本与产业双轮驱动,具身智能赛道进入上市窗口期。
【展望】当国产大模型在最难基准上率先撞线,全球竞赛已从“参数崇拜”转向“推理效能+场景落地”的多维比拼;多模态小模型与高效视频生成技术同步成熟,端侧实时应用和AI影视工业化将加速商业化闭环。与此同时,地缘政治驱动的“敌对AI清单”与信息过载攻击研究提醒行业:技术突破越激进,治理与安全的配套就要越前置。可以预见,下半年人才、资本与监管三线并行,AGI竞速赛将比任何时候都更考验“速度”与“平衡”的双重艺术。