2025-06-14
机器人慢思考突破
上海交大&智元发布双系统VLA模型Hume,引入“系统2慢思考”机制,在叠衣服、倒咖啡等长时序精细操作任务上刷新SOTA;Figure同时公开60分钟无剪辑工厂分拣视频,显示机器人实用化进程显著加速。
2025-06-08
多模态慢思考与评估基准
复旦等发布首个多模态逻辑推理基准,Gemini 2.5 Pro仅得60分;VL-Rethinker框架让视觉模型学会“三思后行”,超GPT-o1近7个百分点,揭示多模态推理仍是短板,慢思考成提升核心路径。
2024-11-10
法律AI进入慢思考时代
港科大&北大发布全球首个法律o1大模型HK-O1aw,引入System2慢思考范式,在合同与消费维权等复杂推理场景显著优于传统模型,为法律科技树立新标杆。
2024-11-09
超长上下文与法律推理大模型
清华等提出“无限长上下文”技术让Llama/Qwen百万token全绿;港科大&北大发布全球首个法律o1大模型,开启慢思考专业领域模型新范式,显著拓展大模型应用边界。