2024-08-14 AI话题 - AI快开门

多模态大模型激战

谷歌Gemini Live、xAI Grok-2、腾讯VITA、Mini-Monkey等中外新模型密集发布，均强调实时语音、图像生成与跨模态交互，标志多模态能力成为2024年大模型主战场，直接冲击OpenAI GPT-4o领先地位，推动终端应用与生态竞争升级。

谷歌Pixel 9系列、Opera One浏览器、快手“飞船”等终端集成原生大模型，实现本地图像生成、语音对话、智能截图等体验，预示AI正从云端向端侧迁移，带动芯片、系统与应用全新迭代，加速消费级AI硬件普及。

文远知行获加州载客许可，毫末智驾里程破2亿公里，AgentQ、跨系统智能体基准等新框架将自动驾驶与通用智能体评测推向L4+及百任务级别，显示AI在物理世界交互能力快速成熟，商业化落地进入规模验证期。

微软披露伊朗用生成式AI干预美大选，怀俄明州记者伪造报道，AI简历造假泛滥，凸显深度伪造、选举操控与信息真实性挑战；Abnormal Security获2.5亿美元融资，表明AI攻防两端同步升级，安全治理需求紧迫。

Eleven Labs全自动配音、昆仑万维Melodio/Mureka、RWKV-6中文小说模型、AI meme生成器等新工具覆盖音频、音乐、文本、视频全链路，降低创作门槛，推动内容产业从PGC向AIGC迁移，催生全新版权与商业模式讨论。

蚂蚁T空间入驻3000+技术人才、2024应届生AI就业报告、Zero-Chatgpt开源全链路训练教程，反映行业对高端人才饥渴与培养体系加速完善；同时AI工具普及让简历、作文等基础技能“外包”，重塑招聘与教育场景。