← 返回模型历史
DeepSeek 17 个模型
模型系列(1)
| 发布日期 | 公司 | 模型名称 | 系列 | 类型 | 特性 |
|---|---|---|---|---|---|
| 2025-12-01 | DeepSeek | DeepSeek-V3.2 | DeepSeek | 主流 | 稀疏注意力架构API成本腰斩 |
| 2025-11-28 | DeepSeek | DeepSeek-Math-V2 | DeepSeek | 奥数金牌级开源模型 | |
| 2025-10-21 | DeepSeek | DeepSeek-OCR | DeepSeek | 视觉记忆压缩,破解记忆瓶颈 | |
| 2025-09-29 | DeepSeek | DeepSeek-V3.2-Exp | DeepSeek | 主流 | 稀疏注意力,API成本减半 |
| 2025-09-22 | DeepSeek | DeepSeek-V3.1-Terminus | DeepSeek | 主流 | 深度推理能力增强 |
| 2025-08-21 | DeepSeek | DeepSeek-V3.1 | DeepSeek | 主流 | 长文档分析、代码理解能力大幅增强;上下文窗口翻倍至128K tokens |
| 2025-05-29 | DeepSeek | DeepSeek-R1-0528 | DeepSeek | 主流 | 推理能力增强,幻觉降低 |
| 2025-03-25 | DeepSeek | DeepSeek-V3-0324 | DeepSeek | 主流 | 推理/中文写作/中文搜素能力增强 |
| 2025-01-28 | DeepSeek | Janus-Pro | - | 多模态大模型 | |
| 2025-01-20 | DeepSeek | DeepSeek-R1 | DeepSeek | 主流 | 性能对齐OpenAI-o1正式版,成本降90% |
| 2024-12-26 | DeepSeek | DeepSeek-V3 | DeepSeek | 主流 | 超大开源模型性能超越Llama/Qwen;性能媲美GPT-4,训练成本创新低;代码能力比肩 Claude |
| 2024-12-10 | DeepSeek | DeepSeek-V2.5-1210 | DeepSeek | 主流 | 数学、编程与写作能力大幅提升 |
| 2024-09-05 | DeepSeek | DeepSeek-V2.5 | DeepSeek | 主流 | DeepSeek V2 Chat 和 DeepSeek Coder V2两个模型合并升级为新版本DeepSeek V2.5 |
| 2024-06-14 | DeepSeek | DeepSeek-Coder-V2-0614 | DeepSeek | 主流 | 代码能力显著提升,在代码生成、代码理解、代码修复和代码补全上达到了GPT-4-Turbo-0409的水平 |
| 2024-05-17 | DeepSeek | DeepSeek-V2-0517 | DeepSeek | 主流 | 指令跟随方面的性能得到了显著提升 |
| 2024-02-08 | DeepSeek | DeepSeek-Math | DeepSeek | 7B 模型在 MATH 基准测试中取得了 51.7% | |
| 2023-11-02 | DeepSeek | DeepSeek-Coder | DeepSeek | 专注于代码生成与理解 |