AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
SwiftInfer
相关话题
2024-01-09
大模型推理与上下文优化
MIT StreamingLLM、SelfExtended、SwiftInfer等开源方案将大模型上下文扩展至400万token,推理速度提升46%,无需微调即可即插即用,显著降低长文本与多轮对话成本,为端侧和实时应用铺平道路。
长上下文
推理加速
StreamingLLM
SelfExtended
SwiftInfer