2026-01-14
国产多模态大模型突破
智谱-华为开源首个全流程国产芯片训练的SOTA多模态模型GLM-Image,采用自回归+扩散解码器混合架构,在国产昇腾芯片上完成训练,实现图像生成与语言模型深度融合,标志着国产算力与算法协同的重大进展,对打破国外技术垄断具有重要意义。
2024-12-28
多模态与3D生成落地
2024年4o、Gemini2、Emu3验证多模态性能,VAST Tripo系列全球生成700万3D模型,零门槛3D创作时代来临;北大开源VE-Bench填补视频编辑评估空白,多模态正从炫技走向工业级工具,加速内容产业3D化升级。
2024-08-02
多模态与3D生成新霸主
谷歌Gemini 1.5 Pro实验版在多项基准上超越GPT-4o,FLUX.1、Stable Fast 3D等开源模型在图像、3D生成速度和质量上刷新SOTA,冲击Midjourney与DALL·E生态。