AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
内存压缩
相关话题
2024-06-14
高效推理与内存优化突破
PyramidKV、Depth Anything V2等研究把大模型KV缓存压缩至2.5%仍保持90%性能,深度估计与推理能耗同步下降,为端侧部署和实时应用打开新空间。
KV缓存
Depth Anything
推理优化
内存压缩
端侧部署