AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
复杂推理
相关话题
2024-02-07
智能体规划能力瓶颈
复旦与OSU等团队评估GPT-4/Gemini做旅行规划,成功率仅0.6%,暴露大模型在复杂多步推理与工具调用上的短板。研究提醒行业:Agent落地需突破规划算法、记忆机制与外部反馈,否则难以胜任真实业务自动化。
GPT-4
Agent
任务规划
复杂推理
评估