【概览】英伟达发布可一次性吞下百万Token的Rubin CPX GPU,Meta用“自举进化”让大模型单步涨点22%,硬件与算法同频刷新天花板;国产开源工具链把Agent、3D数字人塞进手机,多模态生图集体升级2K,机器人更是走进街头与养老院。资本端继续狂飙,Mercor直奔百亿美金估值,AI产业全面逼近AGI临界点。
01 | 超大规模模型与硬件迭代
英伟达新一代Rubin CPX GPU首次实现单机推理承载百万级Token上下文,为超长文档、视频理解类应用打开算力闸门;谷歌把Gemini与树搜索结合,可自动编写科研级软件并生成可验证实验数据;Meta提出的ExIt自举进化框架则让LLM在单步训练中自我改进22%,显著降低对人工标注的依赖。硬件与算法协同突破,为下一代AGI奠定算力与智能基础。
02 | 端侧Agent与开源工具链
上海交大开源MobiAgent全栈框架,支持安卓手机本地部署个人助手,官方实测多项任务超越云端GPT-5;清华GUAVA把单张照片0.1秒转成可驱动的3D数字人,推理全程在移动GPU完成。两大项目同步放出训练与量化工具链,端侧智能体进入“人人可炼”阶段,大幅降低开发者门槛,加速AI应用碎片化落地。
03 | 多模态生图升级与商业落地
腾讯开源HunyuanImage 2.1,原生支持2K分辨率与精准中文写字,复杂多主体提示词准确率提升40%;Freepik向Premium+会员无限开放豆包Seedream 4.0,实测商业插画效率翻倍;国产Vidu Q1同时接受7张参考图,实现角色与场景一致性生成。国产模型在画质、中文场景与易用性上全面追赶Midjourney,加速设计、电商、广告商业化。
04 | 具身智能与机器人场景爆发
DeepMind让8支机械臂在共享空间零碰撞协同,登上Science Robotics封面;港大提出任务自适应感知框架,提升机器人在杂乱场景中的抓取成功率;18岁创业者推出的养老机器人Sam上线2天售罄千台;特斯拉Optimus现身街头卖爆米花并与路人互动。机器人从实验室走向服务、零售、养老等真实场景,具身智能进入小批量商用期。
05 | AI幻觉治理与可信知识
OpenAI最新研究指出,训练阶段奖励模型“猜对即可得分”会强化幻觉,呼吁行业引入“我不知道”评估指标;百度发布文心X1.1,通过检索增强与溯源标记降低事实错误率;智谱BigModel深知服务提供可追踪信源与置信度评分。头部厂商同步行动,系统治理幻觉,提升大模型在医疗、金融等高风险场景的可用性。
06 | AI招聘与求职双杀困局
支付宝上线AI就业助手“晓叶”,求职者报名即可进入AI面试间完成初筛;与此同时,HR普遍采用AI关键词过滤,导致大量AI优化简历仍被“误杀”。AI同时改写供需两端,却制造信息茧房与反馈黑洞,揭示招聘市场亟需新的评价与治理机制。
07 | 资本高热与巨额融资
AI人才平台Mercor年收入近5亿美元,正在寻求100亿美元C轮估值;阿里领投爱诗科技6000万美元B轮,加码AI内容生成;甲骨文因云+AI收入预期上调,股价单日飙升27%。资本继续押注AI基础设施、人才与内容生成,估值与市值屡创新高。
【展望】当GPU能一次性读完百万Token、模型学会自我进化,AGI的硬件与算法底座已基本就绪;端侧开源浪潮和具身智能商业化,则把AI推向每个人的口袋与街头。幻觉治理、招聘双杀等新问题提醒行业:技术狂奔的同时,可信机制与社会规则需同步迭代。可以预见,下一轮竞争将不只是参数与算力,更是标准与生态的争夺。