← 返回列表

AI行业新闻简报 2025.04.28 周一

📊 6 个话题 📰 24 条新闻 🕐 2025-04-28 05:30

【概览】GPT-4o图像生成向全体开发者敞开,Step1X-Edit、Kimi-Audio同日开源,多模态能力首次进入“可用+可改”阶段;微软UFO²、百度现货超级智能体、Fellou浏览器等集中落地,Agent生态告别邀请码,进入“即装即用”时代。边缘侧、车企、数据人才与治理议题同步升温,AI正从“炫技”转向“规模化落地”。

01 | 多模态大模型突破

GPT-4o把图像生成能力写进自定义GPTs,开发者零门槛就能做出“会画画的聊天机器人”;阶跃星辰开源Step1X-Edit,在多项基准上与闭源模型打平,Moonshot AI顺势放出Kimi-Audio,文本-语音-音效一体化。图像、音频双双开源,标志多模态正式跨过“可用”拐点,C端创意工具、教育、电商视觉素材将迎来爆发式供给。

02 | 智能体生态爆发

微软UFO²直接嵌入Windows 11内核,可跨Office、浏览器、CRM一键串连任务;百度“现货超级智能体”取消排队,纳米AI发布MCP万能工具箱,Fellou把Agent做成浏览器默认主页。从“概念演示”到“下载即用”,Agent正成为PC与移动端的新交互入口,办公自动化、销售流程、网页操作率先被重构。

03 | 边缘与端侧AI提速

Liquid Hyena Edge把1B模型塞进手机SoC,推理功耗低于300mW;芯驰4nm座舱芯片X10在车内跑7B模型,RockAI演示树莓派零2版实时对话与记忆更新。端侧成本曲线陡峭下降,机器人、车载、IoT设备“本地大脑”成为默认配置,云端只负责训练与同步。

04 | 车企智能化竞速

宝马新5系与X3全系接入DeepSeek-R1,车内语音助手支持复杂多轮推理;BMW新世代概念车把全景视域桥、AR HUD与大模型融合,哈弗则用电四驱Hi4把AI扭矩分配做成标配。传统车企用AI重塑差异化体验,“轮上大模型”进入标配期,智能座舱成为下一款爆款App的必争入口。

05 | AI数据与人才争夺

OceanBase CTO亲自挂帅AI一号位,锁定“数据底座”战略;上海AI Lab开源垂域数据合成框架,零人工标注即可生成专业QA;谷歌发布601个真实场景生成式AI案例库,却被曝GPT-4.5核心功臣遭“变相驱逐”。高质量数据与顶尖人才成为稀缺筹码,企业组织架构正围绕“数据-模型-场景”闭环重新排兵布阵。

06 | AI安全与治理

微软披露其安全团队年内拦截40亿美元AI驱动诈骗,假包攻击“Slopsquatting”在开源社区扩散,DeepMind员工因不满军工合同启动工会组建。技术狂奔的另一面,安全与伦理风险同步升级,倒逼企业把红队、供应链审查与伦理评估写进CI/CD流程。

【展望】当多模态模型开源、Agent无门槛调用、端侧算力成本打穿地板,AI创新正从“技术秀”转向“场景深耕”。下一步,谁能把开源模型与行业知识库无缝衔接,谁就能在垂直赛道复制“抖音式”爆发;同时,数据主权、模型安全与人才流动将决定竞争终局。

× 公众号二维码

扫码关注公众号获取每日简报