2025-11-13
AI语音实时交互升级
谷歌Gemini Live新增语速/口音调节,ElevenLabs推出150毫秒延迟的Scribe v2实时语音转文本并上线名人声音市场,OpenAI GPT-5.1内置6种人格语音模式,语音大模型在延迟、情感、多语言上集体突破,推动实时翻译、直播、虚拟人场景快速普及。
2025-06-03
端侧AI与离线生态
Google AI Edge Gallery、Gemini Live登陆iOS、三星弃Gemini牵手Perplexity,巨头围绕手机离线算力、隐私计算与搜索入口展开争夺,端侧AI体验成旗舰机新战场。
2024-09-15
终端 AI 与硬件创新
谷歌向安卓用户免费开放 Gemini Live 新助手,苹果 Apple Watch 将原生支持打鼾/睡眠呼吸暂停检测。巨头把大模型能力下沉到手机、可穿戴,加速边缘 AI 普及并激活新数据入口。
2024-08-19
端侧AI与硬件协同
苹果Apple Intelligence被曝安全缺陷,Gemini Live抢跑52亿终端,硬件级混合矩阵乘法研究出炉,端侧大模型在性能、安全、能耗三维度同步承压。
2024-08-14
多模态大模型激战
谷歌Gemini Live、xAI Grok-2、腾讯VITA、Mini-Monkey等中外新模型密集发布,均强调实时语音、图像生成与跨模态交互,标志多模态能力成为2024年大模型主战场,直接冲击OpenAI GPT-4o领先地位,推动终端应用与生态竞争升级。