AI快开门

发现最好的AI工具

2025-12-02

多模态大模型井喷

谷歌Gemini 3、阿里Z-Image、字节Vidi2、华为扩散语言模型等密集发布,文本-图像-视频-音频统一架构成为主流,推理成本骤降、上下文突破32K,标志生成式AI进入“原生多模态”新阶段,直接重塑内容生产、搜索与终端交互体验。
2024-08-26

多模态大模型爆发

国内外厂商密集发布视觉-语言-语音一体化大模型:Meta推出Sapien视觉分析、云知声发布山海多模态、摩尔线程开源音频理解MooER,标志着通用感知能力正快速收敛到统一架构,为端侧Agent与沉浸式交互奠定基座。