谷歌Gemini 3、阿里Z-Image、字节Vidi2、华为扩散语言模型等密集发布,文本-图像-视频-音频统一架构成为主流,推理成本骤降、上下文突破32K,标志生成式AI进入“原生多模态”新阶段,直接重塑内容生产、搜索与终端交互体验。
Runway Gen-4.5、PixVerse V5.5、可灵O1、爱诗科技等模型在光影物理、导演级分镜、音画同步上集体突破,120人团队盲测夺冠,宣告“秒级出片”进入工业可用阶段,冲击影视广告传统流程。
MIT OpenAGI、英伟达Alpamayo-R1、蚂蚁Agentar、阶跃GUI Agent等推出“先思考后行动”的推理型智能体,把链式思考引入自动驾驶与终端操控,降低幻觉提升决策可信度,开启物理AI落地元年。
GPT-5预训练受阻、内部命名混乱、广告代码曝光,奥特曼一年态度逆转并启动“红色警报”,同时以技术换股权绑定Thrive,显示头部厂商在模型瓶颈与盈利压力下的战略焦虑。
墨尔本大学三场国际论坛聚焦“智能鸿沟”、集体行动与隐私边界;AI耗电量或占澳12%电力、模型在高压提示下性能骤降,凸显能耗、对齐与安全已成为全球政策核心议题。
字节联合中兴推出3499元“豆包手机”,夸克AI眼镜、小猿学练机等硬件密集上市,搭配自研Agent深度植入系统,显示国内厂商正把大模型从App下沉到终端入口,抢占移动AI流量。