复杂推理 - AI话题

2024-02-07

复旦与OSU等团队评估GPT-4/Gemini做旅行规划，成功率仅0.6%，暴露大模型在复杂多步推理与工具调用上的短板。研究提醒行业：Agent落地需突破规划算法、记忆机制与外部反馈，否则难以胜任真实业务自动化。

AI快开门