【概览】国内大厂与研究机构一日内集中发布十余款多模态大模型,2K高清生成、3D真人手办、超长视觉推理同步进入“可用级”;另一边,OpenAI、阿里、Anthropic的编程Agent相继上线,可连续编码7小时并自主重构大型项目,软件生产范式面临重塑。技术狂奔之际,中国《人工智能安全治理框架》2.0版与全球首个具身智能安全可信EAI框架同日亮相,为产业落地划出红线。
01 | 多模态大模型爆发
阿里、腾讯、上海AI Lab在24小时内连发五款多模态模型,覆盖语音、图像、3D与超长视觉推理。腾讯HunyuanImage 2.1率先开源2K分辨率文生图权重,登顶Hugging Trending;混元3D 3.0将人脸几何误差压至0.2 mm,可直接打印真人手办;上海AI Lab的Lumina-DiMOO首次实现“生成即理解”的统一架构,支持1K token超长视觉推理。业界认为,多模态正式跨过“可用”门槛,短视频、游戏、电商内容管线将被重塑。
02 | 编程Agent颠覆开发者
OpenAI凌晨发布GPT-5-Codex,可在无人工干预情况下连续编码7小时、自主完成代码审查与大型项目重构;阿里Qoder Pro同档上线,月费20美元提供私有库长程记忆;Anthropic把Claude塞进Xcode 26,一键生成Swift UI。一线开发者坦言,“95%时间花在给AI当保姆”,软件团队组织架构、绩效考核与交付流程面临系统性重构。
03 | 国产模型生态加速
腾讯一日内宣布混元3D、图像、翻译模型全链路开源,并同步完成国产芯片适配;豆包AI App月活突破6800万,登顶QuestMobile国内AI原生应用榜;火山引擎发布PromptPilot,用可视化编排把提示词调试时间从小时级压缩到分钟级。国产大模型正从“可用”走向“好用”,底层硬件、框架、应用首次在同一节奏下迭代。
04 | 具身智能与安全框架
宇树开源机器人世界大模型,支持零样本跨机型任务迁移;OpenAI时隔五年重组机器人团队,目标直指“通用机器人大脑”。能力狂飙背后,外滩大会发布全球首个安全可信EAI框架,提出“能力-安全”双维度评估红线,为即将量产的轮式、人形机器人设置强制安全门槛。
05 | AI治理与伦理新规
国家网信办等六部门推出《人工智能安全治理框架》2.0版,把深度伪造、数据投毒、模型窃取列为“高风险”场景并给出技术处置细则;美国FTC同步调查AI聊天机器人对未成年人的心理影响;谷歌因AI摘要项目裁员200名外包员工,同时英国新数据中心年排放57万吨二氧化碳引发环保争议。全球监管节奏明显加快,技术、伦理、环保三重压力同步上升。
06 | AI商业落地新场景
阿尔巴尼亚任命全球首位“AI部长”,用算法100%公开审批政府采购,试图以技术对抗腐败;MarqVision获4800万美元B轮,用生成式AI秒级锁定电商假货;MuleRun上线全球首个Agent交易市场,允许开发者上架“数字员工”并按任务分成。AI正走出实验室,成为政务、知识产权、劳动力交易等细分市场的标准配置。
【展望】多模态与编程Agent的“双引擎”把内容创作与软件生产同时推向“零门槛”时代,国产芯片+开源模型的闭环让生态主导权开始东移;具身智能与安全治理的同步提速,则预示AI不再只是“性能竞赛”,合规与伦理将成为下一阶段的核心竞争力。接下来,关注多模态生成内容的版权界定、Agent编码带来的责任归属,以及人形机器人量产前的安全认证,将是产业与监管共同面对的必答题。