AI快开门

发现最好的AI工具

2024-07-13

大模型推理与规划突破

OpenAI内部代号为「草莓」的新模型首次公开,强调强推理、长程任务规划与超大规模训练,并同步提出AGI分级框架,被视为迈向通用人工智能的关键节点,可能重塑行业研发路线与评估标准。
2024-02-07

智能体规划能力瓶颈

复旦与OSU等团队评估GPT-4/Gemini做旅行规划,成功率仅0.6%,暴露大模型在复杂多步推理与工具调用上的短板。研究提醒行业:Agent落地需突破规划算法、记忆机制与外部反馈,否则难以胜任真实业务自动化。