AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
延迟优化
相关话题
2025-05-05
推理效率新范式
伯克利Letta提出“睡眠时计算”,让LLM在空闲期预先生成推理链,显著降低在线延迟;若与边缘小模型结合,有望打造“随时可用”的低功耗智能体。
睡眠计算
推理加速
边缘AI
LLM系统
延迟优化
2024-10-26
多模态大模型突破
国产Mono-InternVL、GLM-4-Voice、F5-TTS等原生多模态与端到端语音模型集中发布,显著降低延迟、提升自然度,标志视觉-语言-语音一体化进入可用阶段,为智能硬件、车载、客服等场景打开落地空间。
多模态
端到端语音
原生视觉
延迟优化
SOTA