2025-05-27
多模态交互体验升级
豆包视频通话实时读时钟、Veo 3逼真脱口秀破恐怖谷、GPT-4o上线唱歌模式,显示多模态模型在时序一致性、情感表达、实时交互等维度逼近人类水平;谷歌Chrome实时屏幕感知、阿里AR眼镜全彩光波导落地,则让“所见即所得”的AI体验走向消费级。
2025-05-24
多模态大模型开源竞速
字节开源GPT-4o级图像生成模型,豆包上线实时视频通话多模态交互,上海AI Lab推出通专融合、思维链透明的新架构,标志国产大模型在视觉-语言一体化与开源生态上加速追赶,降低行业落地门槛并激发应用创新。