ARC-AGI - AI话题 - AI快开门

2025-04-04

OpenAI o3单次推理成本暴涨至3万美元，ARC-AGI榜单除名事件暴露暴力堆算力路线的边际收益递减；Anthropic、DeepSeek等同期论文指出思维链不可靠、推理时Scaling仍需突破。行业开始反思“砸钱换性能”的可持续性，低成本高效推理成为下一赛点。

2024-12-28

o3在ARC-AGI刷新纪录却遇大网格瓶颈，OpenAI科学家提出“AGI时间”衡量法，CPU offload方案MagicPIG提升解码吞吐量4.99倍，显示后训练、评估与硬件协同优化成为提升模型上限的下一站，推动行业从炼模型转向炼任务。

2024-12-25

OpenAI 跳过 o2 直接发布 o3，ARC-AGI 基准破纪录，IQ 测试高达 157，比肩爱因斯坦；同时 GPT-5 被曝因数据崩溃难产，竞争对手谷歌 Gemini、Anthropic Claude 加速追赶，头部大模型进入“性能+推理”新战场。

2024-12-22

OpenAI 发布新一代推理模型 o3，在 ARC-AGI、CodeForces 等基准上刷新纪录，数学逼近人类奥赛水平，编程跻身全球前 200，被视作迈向 AGI 的关键一步，同时引发安全与成本争议。

# ARC-AGI