【概览】OpenAI与DeepMind围绕IMO“金牌”隔空互呛,把AI高阶推理首次逼近人类顶尖水平的里程碑变成公关翻车现场;与此同时,国产开源模型集体登顶全球榜单,具身智能单周吸金超20亿元,AI编程进入“零代码”落地期,安全与商业化同步提速,行业在狂欢与反思中双线狂奔。
01 | IMO数学奥赛AI夺金争议
OpenAI抢先宣布其内部模型在2025国际数学奥林匹克(IMO)“达到金牌线”,谷歌DeepMind随后亮出官方认证的“唯一金牌”,双方隔空互呛。IMO组委会罕见发声,指责部分厂商“未提交正式答卷、未接受91位评委评分”就自封冠军,数学泰斗陶哲轩亦撰文质疑“过度营销”。一场本可载入史册的推理突破,演变为关于竞赛伦理与公关规则的全民讨论。
02 | 中国开源模型领跑全球
LMArena最新榜单被国产模型“包场”:Kimi K2、DeepSeek、Qwen3包揽前三,384专家MoE、FP8量化、235B参数等创新把同等尺寸模型甩出3-5分。海外开发者社区出现“中文README潮”,Hugging Face趋势库前十中半数源自中国团队,标志全球开源重心正在向中文生态迁移。
03 | AI编程颠覆开发范式
腾讯CodeBuddy、Trae 2.0 SOLO、TRAE Context Engineer三款原生AI IDE同日亮相,均支持“一句话需求→可执行代码”全流程,并引入自主Debug、在线灰度等“自主开发”能力。实测显示,0基础用户可在10分钟内完成带支付功能的H5页面,传统开发周期被压缩90%,“零代码”时代正式从概念走向生产级。
04 | 具身智能融资与模型双爆发
字节跳动发布VLA通用机器人模型GR-3,浙大vivo联手刷新导航SOTA,京东、美团两周内连投5家具身企业,总融资额超20亿元。行为基础模型、高层语义-低层控制接口等新技术让机器人“手速”逼近电竞选手,资本与算法共振推动人形机器人从“秀肌肉”进入“真上岗”。
05 | AI安全与伦理风险升温
英伟达被曝GPUHammer漏洞,可令大模型准确率瞬间跌去99.9%;DuckDuckGo紧急上线AI图片隐藏功能,厦大与腾讯优图联合发布AIGI-Holmes打假系统。从硬件底层攻击、搜索结果污染到深度伪造内容,AI安全链条各环节首次同时告急,业内呼吁建立“芯片-模型-应用”一体化防御框架。
06 | AI应用落地与数据新基建
Netflix首次将生成式AI写进制作管线,预计缩短30%后期耗时;蚂蚁数科苏州AI数据基地投产,年产3万PB标注数据;零一万物推出“万智”企业平台2.0,提供可私有化部署的Agent工厂。头部公司正围绕“数据-模型-场景”加速闭环,AI商业化进入规模扩张与精细运营并重的新阶段。
【展望】IMO“金牌”闹剧为行业敲响警钟:技术突破必须与伦理规范同步。国产开源模型已验证“参数效率”路径的可行性,具身智能与AI编程的落地让“物理世界代码化”加速到来。当模型能力逼近天花板,竞争焦点将从“刷榜”转向“安全+场景+数据”的综合效率,下一轮洗牌已悄然开始。