← 返回列表

AI行业新闻简报 2025.04.19 周六

📊 6 个话题 📰 31 条新闻 🕐 2025-04-19 05:30

【概览】OpenAI发布首批“用图像思考”的推理模型o3与o4-mini,性能较o1跃升10倍,标志视觉推理与Agent能力迈入新阶段;国内大厂同步开源多模态视频与角色一致性模型,资本端智谱再获5亿元加持,端侧轻量化与MCP生态亦全线提速,AI进入“多模态+Agent”实用爆发期。

01 | OpenAI o3/o4-mini 推理革命

OpenAI推出o3及轻量版o4-mini,首次实现“看见就能深度推理”:模型可直接读取图像并自主调用代码、搜索等工具,在数学、代码、科学基准上平均提升10倍,同步开源Codex CLI,开发者5分钟可拼装视觉Agent。业内普遍认为,这是AGI路线图上首个同时打通视觉、工具与推理的里程碑。

02 | 多模态生成大爆发

快手可灵2.0、阿里通义万相Wan2.1-FLF2V-14B、腾讯InstantCharacter、生数多模态模型一日内集中升级或开源,实现首尾帧高清视频、角色姿势与风格任意定制、实时交互式生成,把AIGC推向“完全个性化”阶段,创作者无需Prompt工程即可产出影视级内容。

03 | Agent 与 MCP 生态成型

腾讯知识引擎、蚂蚁支付、AWS 工具链同日接入MCP(模型上下文协议),Blender-MCP、Supermemory MCP等开源项目让“3分钟搭Agent”成为现实;配合OpenAI 34页官方指南,开发者可用自然语言把大模型一键变成会画图、会下单、会写代码的自主智能体,智能体落地门槛首次降到“脚本级”。

04 | 端侧 AI 与硬件加速

微软1-bit BitNet把2B模型压至0.4GB内存,联发科天玑9400+提出AGENTIC AI UX,RTX 5060 Ti凭DLSS 4可在本地跑32B大模型并实时4K光追;FramePack技术让6GB显存笔记本1.5秒出1帧高清视频,端侧“轻量化+消费级”部署进入可用阶段,PC与手机将成个人Agent第一载体。

05 | 中国大模型开源与资本加速

智谱Z基金3亿元支持全球开源社区,再获北京AI产业基金2亿元追加;Moonvalley 4300万美元B轮、X-ORIGIN-AI近亿元A轮同日披露,叠加通义万相、混元InstantCharacter连续开源,国产模型“开源+资本”双轮驱动进入快车道,官方资金与市场化基金共同押注中国大模型生态。

06 | AI 安全与治理新规

美国拟对国产模型DeepSeek实施新限制,OpenAI“星际之门”计划扩张欧洲,AWS联合Intuit提出零信任框架防御MCP工具中毒,地缘政治与数据安全成为AI产业新变量;企业需在合规、模型可信与跨境部署之间寻找平衡,安全治理将伴随技术突破同步升级。

【展望】o3/o4-mini的“视觉推理+工具调用”验证了多模态Agent的可行性,国内开源与资本迅速跟进,预计下月将出现大量基于MCP的垂直场景智能体;同时轻量化模型让端侧跑大模型成为默认选项,创作、办公、硬件入口将同步洗牌。行业短期看“多模态Agent”落地速度,长期则需关注日益收紧的跨境数据与模型流动政策。

× 公众号二维码

扫码关注公众号获取每日简报