2025-08-22
AI视频/3D生成爆发
可灵、即梦、VAST、清华GUAVA等相继升级,首尾帧控制、10图长镜头、4000万3D数据集、0.1秒单图生3D化身等功能集中落地,视频创作从“抽卡”迈向“精准导演”,UGC长镜头与专业3D资产生成门槛骤降,短视频、游戏、XR内容产业迎来生产力革命。
2025-07-08
多模态大模型技术突破
阿里HumanOmniV2、腾讯Hunyuan3D-PolyGen、Vidu Q1等国产多模态模型在视频生成、3D建模、参考生成等方向取得SOTA成绩,标志国内从单模态追赶转向多模态并跑,奠定下一代内容生产基础设施。
2025-06-24
大模型空间推理瓶颈突破
SolidGeo、SolidLM等立体几何基准与3D结构化建模新范式集中出现,标志着多模态大模型在三维空间理解与推理上的关键短板被系统评估并给出解决路径,为机器人、AR/VR、自主驾驶等应用奠定认知基础。
2025-06-10
多模态大模型技术突破
近期多模态大模型在视觉理解、视频生成、3D建模等方向密集突破:港大-英伟达高分辨率视觉注意力提速84倍,小红书开源1420亿参数“dots.llm1”,谷歌Veo 3一键生成360° 3D视频,Direct3D-S2以8卡GPU实现影视级3D开源。技术簇呈现“高质量+高效率+开源”趋势,将显著降低内容创作与具身智能门槛,推动XR、机器人和设计工业落地。
2025-03-10
效率工具与创意生成新范式
Browser Use、MeshPad、Finer-CAM、LanPaint等开源或新品让浏览器自动化、3D建模、图像重绘等任务秒级完成,AI正从“对话”走向“操作”,重塑创意与办公工作流。
2024-07-23
AI生成内容升级
Luma AI无限循环视频、LensGo FaceSync音唇同步、Stable Audio Open立体声输出、Aiuni 30秒单图转3D等工具密集发布,表明生成式AI正从“可用”走向“好用”,大幅降低短视频、游戏、XR等内容生产门槛。
2024-01-05
AI硬件消费化
商汤将“元萝卜”机器人塞进1699元台灯,可实时纠正儿童坐姿与注意力;李飞飞团队Wild2Avatar用单目4秒视频重建遮挡3D人体,解锁VR/AR内容生产。AI算法与日常硬件结合,使智能设备从“连接”走向“认知”,开启消费电子3.0时代。