慢思考 - AI话题 - AI快开门

2025-06-14

机器人慢思考突破

上海交大&智元发布双系统VLA模型Hume，引入“系统2慢思考”机制，在叠衣服、倒咖啡等长时序精细操作任务上刷新SOTA；Figure同时公开60分钟无剪辑工厂分拣视频，显示机器人实用化进程显著加速。

VLA模型慢思考机器人操作 Figure

2025-06-08

多模态慢思考与评估基准

复旦等发布首个多模态逻辑推理基准，Gemini 2.5 Pro仅得60分；VL-Rethinker框架让视觉模型学会“三思后行”，超GPT-o1近7个百分点，揭示多模态推理仍是短板，慢思考成提升核心路径。

多模态推理慢思考评估基准 Gemini 视觉模型

2024-11-10

法律AI进入慢思考时代

港科大&北大发布全球首个法律o1大模型HK-O1aw，引入System2慢思考范式，在合同与消费维权等复杂推理场景显著优于传统模型，为法律科技树立新标杆。

法律大模型慢思考 HK-O1aw 法律推理

2024-11-09

超长上下文与法律推理大模型

清华等提出“无限长上下文”技术让Llama/Qwen百万token全绿；港科大&北大发布全球首个法律o1大模型，开启慢思考专业领域模型新范式，显著拓展大模型应用边界。

长上下文法律大模型慢思考 System2 Llama

2024-09-21

推理大模型范式之争

OpenAI o1 引爆“慢思考”推理新范式，国内外迅速跟进：360 提前布局 CoE 多模型协作，清华等团队验证 CoT 可无限扩展 Transformer 推理能力，同时混合架构（Mamba+Transformer）与多模型协作方案试图替代传统提示工程，标志着大模型竞争焦点从训练规模转向推理机制创新。

o1 CoT 推理范式多模型协作慢思考

# 慢思考

机器人慢思考突破

多模态慢思考与评估基准

法律AI进入慢思考时代

超长上下文与法律推理大模型

推理大模型范式之争