Genie - AI话题 - AI快开门

2025-08-11

谷歌Genie 3、阿里Wan2.1-I2V-Flash、虚拟试穿Voost、图生视频SkyReels-A3等密集发布，实现秒级交互式3D世界、高保真纹理还原及语音对口型，显示多模态生成正从“可用”走向“好用”，重塑电商、影视、UGC内容生产链。

2025-08-07

DeepMind 发布 Genie 3 通用世界模型，一句话生成可交互 3D 场景，720p@24fps 保持分钟级一致性，被誉“宇宙模拟器”，同步上线编程助手 Jules，异步修 bug 集成 GitHub，显示谷歌在生成式物理世界与开发工具双线重注。

2025-08-06

Google DeepMind 发布 Genie 3，被誉首次“超真实”模拟物理世界；Gemini 故事书生成器、Qwen-Image 精准文字渲染、ElevenLabs 商用音乐生成等集中亮相。生成式 AI 从单模态迈向时空一致的多模态世界模型，为游戏、影视、教育等内容产业解锁沉浸式生产流程。

2025-04-30

TesserAct提出4D场景理解框架，谷歌Genie 2生成可交互3D环境，Luma Ray2 API实现电影级镜头控制，阶跃发布开源图像编辑SOTA，显示多模态正从“看得清”走向“看得懂+控制得了”，为机器人、影视及XR应用打开新空间。

2024-12-06

谷歌Genie 2单图生成可交互3D世界，复旦等发布智能体社会综述，哈工深Optimus-1横扫Minecraft长任务。世界模型与智能体快速进化，为通用机器人与虚拟训练环境奠定新基座。

2024-12-05

OpenAI、Google DeepMind、亚马逊、字节跳动等头部公司密集发布新一代多模态大模型或核心能力升级，涵盖3D场景生成、长视频理解、代码生成、天气预测等方向，标志着生成式AI正从“对话”走向“世界建模”，算力需求与商业化落地同步加速。

2024-08-13

Genie、Qwen2-Math等最新模型在代码推理、数学解题上超越GPT-4o，84秒完成项目级代码，展示大模型在软件工程领域的“人类思维”水平，直接冲击程序员生产力结构与教育培养体系。

# Genie