SwiftInfer - AI话题

2024-01-09

MIT StreamingLLM、SelfExtended、SwiftInfer等开源方案将大模型上下文扩展至400万token，推理速度提升46%，无需微调即可即插即用，显著降低长文本与多轮对话成本，为端侧和实时应用铺平道路。

AI快开门