Gemini Live - AI话题

2025-11-13

谷歌Gemini Live新增语速/口音调节，ElevenLabs推出150毫秒延迟的Scribe v2实时语音转文本并上线名人声音市场，OpenAI GPT-5.1内置6种人格语音模式，语音大模型在延迟、情感、多语言上集体突破，推动实时翻译、直播、虚拟人场景快速普及。

2025-06-03

Google AI Edge Gallery、Gemini Live登陆iOS、三星弃Gemini牵手Perplexity，巨头围绕手机离线算力、隐私计算与搜索入口展开争夺，端侧AI体验成旗舰机新战场。

2024-09-15

谷歌向安卓用户免费开放 Gemini Live 新助手，苹果 Apple Watch 将原生支持打鼾/睡眠呼吸暂停检测。巨头把大模型能力下沉到手机、可穿戴，加速边缘 AI 普及并激活新数据入口。

2024-08-19

苹果Apple Intelligence被曝安全缺陷，Gemini Live抢跑52亿终端，硬件级混合矩阵乘法研究出炉，端侧大模型在性能、安全、能耗三维度同步承压。

2024-08-14

谷歌Gemini Live、xAI Grok-2、腾讯VITA、Mini-Monkey等中外新模型密集发布，均强调实时语音、图像生成与跨模态交互，标志多模态能力成为2024年大模型主战场，直接冲击OpenAI GPT-4o领先地位，推动终端应用与生态竞争升级。

AI快开门