3D - AI话题 - AI快开门

2026-01-08

物理AI与具身智能爆发

Mobileye 9亿美元收购Mentee Robotics、小鹏/FF/Arm齐推“物理AI”战略，阿里开源3D动画模型，割草机器人海外落地。资本、整车厂、芯片巨头同步押注“具身智能”，2026年被视为量产元年，硬件载体与AI模型深度融合。

具身智能物理AI 机器人收购 3D动画量产

2025-12-31

多模态大模型竞速

谷歌Gemini-3-Pro在SuperCLUE-VLM榜单断层领先，国产商汤、豆包、Qwen3-VL紧随其后；阿里开源Qwen-Image、腾讯开源HY-Motion1.0文生3D动作模型，显示中美在视觉-语言-动作一体化赛道进入密集迭代期，直接决定下一代交互与内容生成标准。

多模态 Gemini 国产大模型视觉语言模型 3D生成

2025-12-25

具身智能与机器人升级

京东物流“智狼”机器人海外仓规模化落地，原力灵机发布GeoVLA赋予机器人3D视觉，清华-开创电气联合研究中心揭牌，亚马逊整合芯片+模型+机器人转向实体AI，显示具身智能正走出实验室进入产业闭环。

具身智能机器人 3D视觉自动化仓产学研

2025-12-12

视频/3D生成与多模态应用

Runway发布通用世界模型GWM-1，智谱开源视频生成核心技术，港大ViMax实现AI自编自导自演，谷歌升级虚拟试穿，Medeo AI推视频Agent一键改剧本，多模态生成从2D图像迈向可推理、可交互的3D世界，内容生产门槛进一步降低。

视频生成世界模型多模态 3D 虚拟试穿

2025-12-09

多模态大模型突破

原生多模态架构NEO、Gemini 3、GPT-5.2等新一代模型密集发布，实现视觉-语言-3D统一生成与推理，推动“零门槛”创作与交互，标志生成式AI进入全模态时代。

多模态 Gemini 3 GPT-5.2 NEO 3D生成

2025-12-07

谷歌Gemini 3高价争议

谷歌发布迄今最强Gemini 3 Deep Think，草图秒变可交互3D场景，创意能力惊艳业界，但付费定价在DeepSeek等开源冲击下被批“太贵”。该事件凸显闭源巨头与开源社区之间的性价比鸿沟，或加速企业客户转向更具成本优势的替代方案，倒逼谷歌调整商业策略。

Gemini 3 3D生成定价争议开源冲击

2025-11-23

具身智能融资与低成本硬件

蚂蚁投资腾讯系具身智能公司、范浩强凭5000元“丐版硬件”获10亿融资，显示资本对高性价比机器人方案的追捧；同时3D仿真生成技术降低训练门槛，推动具身智能从Demo走向落地。

具身智能低成本硬件 3D仿真融资机器人训练

2025-11-22

多模态大模型激战升级

谷歌连发 Nano Banana Pro、Gemini 3 融合 Veo 3，一键 UI 与 3D 重建引爆设计圈；Meta SAM 3D 单图生成可遮挡 3D 模型；xAI Grok 4.1 推理版反超 Gemini，马斯克同步启动 150 亿美元融资，多模态军备赛再提速。

多模态 Gemini Nano Banana Pro SAM 3D Grok

2025-11-21

多模态大模型军备竞赛

OpenAI、谷歌、腾讯、Meta 72 小时内连环发布 GPT-5.1/Codex-Max、Gemini 3 系、HunyuanVideo 1.5、SAM-3D 等旗舰模型，上下文窗口、视频生成、3D 理解同步刷新 SOTA。巨头以「周」为单位迭代，标志生成式 AI 进入多模态长序列新战场，直接决定云算力需求与开发者生态归属。

GPT-5.1 Gemini 3 HunyuanVideo SAM-3D 多模态

2025-11-19