谷歌Gemini Live、xAI Grok-2、腾讯VITA、Mini-Monkey等中外新模型密集发布,均强调实时语音、图像生成与跨模态交互,标志多模态能力成为2024年大模型主战场,直接冲击OpenAI GPT-4o领先地位,推动终端应用与生态竞争升级。
谷歌Pixel 9系列、Opera One浏览器、快手“飞船”等终端集成原生大模型,实现本地图像生成、语音对话、智能截图等体验,预示AI正从云端向端侧迁移,带动芯片、系统与应用全新迭代,加速消费级AI硬件普及。
文远知行获加州载客许可,毫末智驾里程破2亿公里,AgentQ、跨系统智能体基准等新框架将自动驾驶与通用智能体评测推向L4+及百任务级别,显示AI在物理世界交互能力快速成熟,商业化落地进入规模验证期。
微软披露伊朗用生成式AI干预美大选,怀俄明州记者伪造报道,AI简历造假泛滥,凸显深度伪造、选举操控与信息真实性挑战;Abnormal Security获2.5亿美元融资,表明AI攻防两端同步升级,安全治理需求紧迫。
Eleven Labs全自动配音、昆仑万维Melodio/Mureka、RWKV-6中文小说模型、AI meme生成器等新工具覆盖音频、音乐、文本、视频全链路,降低创作门槛,推动内容产业从PGC向AIGC迁移,催生全新版权与商业模式讨论。