AI快开门

发现最好的AI工具

2025-05-05

推理效率新范式

伯克利Letta提出“睡眠时计算”,让LLM在空闲期预先生成推理链,显著降低在线延迟;若与边缘小模型结合,有望打造“随时可用”的低功耗智能体。
2024-10-26

多模态大模型突破

国产Mono-InternVL、GLM-4-Voice、F5-TTS等原生多模态与端到端语音模型集中发布,显著降低延迟、提升自然度,标志视觉-语言-语音一体化进入可用阶段,为智能硬件、车载、客服等场景打开落地空间。