2025-04-04
推理模型成本飙升与性能瓶颈
OpenAI o3单次推理成本暴涨至3万美元,ARC-AGI榜单除名事件暴露暴力堆算力路线的边际收益递减;Anthropic、DeepSeek等同期论文指出思维链不可靠、推理时Scaling仍需突破。行业开始反思“砸钱换性能”的可持续性,低成本高效推理成为下一赛点。
2024-12-28
模型推理与评估新范式
o3在ARC-AGI刷新纪录却遇大网格瓶颈,OpenAI科学家提出“AGI时间”衡量法,CPU offload方案MagicPIG提升解码吞吐量4.99倍,显示后训练、评估与硬件协同优化成为提升模型上限的下一站,推动行业从炼模型转向炼任务。
2024-12-25
OpenAI o3 与下一代模型竞赛
OpenAI 跳过 o2 直接发布 o3,ARC-AGI 基准破纪录,IQ 测试高达 157,比肩爱因斯坦;同时 GPT-5 被曝因数据崩溃难产,竞争对手谷歌 Gemini、Anthropic Claude 加速追赶,头部大模型进入“性能+推理”新战场。
2024-12-22
OpenAI o3 震撼发布
OpenAI 发布新一代推理模型 o3,在 ARC-AGI、CodeForces 等基准上刷新纪录,数学逼近人类奥赛水平,编程跻身全球前 200,被视作迈向 AGI 的关键一步,同时引发安全与成本争议。