AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
奖励模型
相关话题
2025-04-06
DeepSeek推理Scaling突破
DeepSeek联手清华发布推理时Scaling新论文,提出奖励模型扩展策略,显著提升推理任务性能,为即将发布的R2模型铺路;OpenAI随即调整路线图,数月内推出GPT-5,预示推理Scaling已成为大模型性能跃迁的核心战场。
DeepSeek
推理Scaling
GPT-5
奖励模型