Grok4、Gemini、Phi-4-mini等新一代旗舰密集发布,性能刷新公开榜;OpenAI罕见宣布开放权重模型,标志闭源策略松动。巨头模型迭代+开源释放双重推力,将直接重塑API定价、开发者生态与下游应用竞争格局,行业进入“性能-成本-可控性”三维比拼新阶段。
谷歌Veo 3升级“照片转视频”并开放150国付费使用,7周生成4,000万条短片;阿里开源ThinkSound自动为视频配音效;爱诗PixVerse入选联合国AI for Good案例。生成式视频正从Demo走向广告、动漫、UGC等商用场景,内容生产成本骤降,创意产业面临供应链重塑。
Perplexity推出Comet浏览器,OpenAI被曝年内发布AI浏览器,谷歌Chrome搜索份额遭前后夹击。AI摘要、对话式入口、自动生成网页等原生能力,将流量入口从“搜索框”升级为“意图代理”,站长广告模式进一步承压,在线广告与搜索生态面临重构。
vivo发布3B多模态模型BlueLM-2.5,可在手机端理解GUI界面;微软Phi-4-mini推理提速10倍,笔记本可跑;港大&字节4B数学模型用RL逼近235B性能。小参数+高能力+本地部署,降低推理成本与隐私风险,为移动、IoT、边缘计算打开增量市场。
谷歌MedGemma系列上新,单GPU即可运行的开源医疗多模态模型;MedGemma登顶多项医学视觉任务,并配套HAI-DEF开发者框架。轻量级+开源降低医院与初创公司接入门槛,加速影像诊断、患者沟通等场景落地,医疗AI进入“可私有、可微调、低成本”阶段。
人形机器人MagicBot Z1发售、Reachy Mini开源预定、伯克利ViTacFormer提升灵巧手稳定性;Meta发布40页报告提出“心智世界模型”。AI+机器人硬件结合进入小批量落地,家庭服务、餐饮制作、科研教育等场景出现商业化案例,产业链关注“大脑+小脑+本体”一体化平台。