2025-06-15
AI原生浏览器变革
Comet、Dia、Fellou、豆包等“Agentic Browser”集中亮相,内置多模态Agent可自主比价、写高考作文、跨网页执行任务,传统浏览器厂商被迫跟进,人机交互入口或迎来新一轮洗牌。
2025-02-26
多模态Agent与机器人
微软开源多模态AI Agent“Magma”可同时操控网页下单与机器人动作,智元发布AgiBot Digital World仿真框架,宇树机器人秀中国功夫,MIT扩散算法突破千帧长视频,AI开始打通数字与物理世界边界。
2024-05-08
端侧与多模态Agent爆发
斯坦福Octopus V3以20亿参数实现端侧多模态Agent,函数调用性能超GPT-4,能耗降95%;亚马逊、苹果M4芯片同步强调本地AI算力。端侧轻量化+多模态交互成为新战场,将加速AI在手机、汽车、机器人等场景落地,重构边缘计算生态。
2024-05-04
国产多模态Agent竞速
在中国AIGC产业峰会上,美图、阿里等厂商强调“大模型+垂直工作流+创意场景”才是国产突围路线,多模态Agent成为落地关键,赛事与峰会同步推动生态繁荣。
2024-02-20
多模态Agent与AIGC应用落地
腾讯AppAgent实现“大模型操作手机App”,Meta Agent可自动剪辑视频,LGM 5秒生成高质量3D资产,中国AIGC产业峰会集中展示商业案例,显示多模态Agent正走出实验室,进入广告、电商、短视频、设计等场景,2024年或迎批量落地潮。