2025-12-14
小模型高效革命
英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩,阶跃星辰8B框架解锁百万token测试时计算,苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理,小参数模型在边缘与实时场景逼近大模型性能,显著降低算力与能耗门槛。
2025-05-20
推理模型范式升级与测试时计算
OpenAI、翁荔、北大联合强调“测试时计算”是下一代Scaling Law,AlphaEvolve矩阵乘法48次乘法突破获实证,单样本RLVR在数学任务上达73.6%准确率,推理能力成为大模型军备竞赛新焦点。
2025-03-30
自动驾驶测试时计算革新
港大联合英伟达首次将“测试时计算”引入自动驾驶,让车辆边行驶边迭代策略,显著改善变道、加塞等复杂场景的决策流畅度,向人类老司机的“安全+效率”平衡迈出关键一步。
2025-03-29
AI计算范式革新
港大&英伟达提出“测试时计算”自动驾驶框架,让车辆在线持续学习,变道场景成功率提升 18%;酷睿 Ultra 200HX 游戏本 AI 能效比提升 40%,边缘算力再升级。从云训练到端侧实时演化,新范式降低数据回传成本,加速 AI 向实时物理世界渗透。
2025-01-28
测试时计算成新Scaling Law
CMU与业界共识指出高质量数据将在2028年耗尽,第三代Scaling Law转向“测试时计算”。通过元强化学习在推理阶段动态分配算力,可突破预训练数据天花板,为通往AGI提供新范式。该转向可能重塑芯片需求结构,推理卡市场有望超越训练卡。
2025-01-19
扩散模型极限量化突破
MPQ-DM团队把扩散模型权重压缩至2-4位,在W2A4精度下FID再降58%,生成质量仍媲美全精度,为端侧超高清文生图、视频生成铺平道路;同期NYU/MIT/谷歌提出“测试时计算”新Scaling Law,扩散模型推理阶段可动态加码,性能直冲天花板,标志着生成式AI进入“后训练+后推理”双轮时代。
2024-09-18
o1推理模型技术解析
OpenAI o1 以强化学习+Self-play 实现测试时计算扩展,谷歌 8 月论文已揭示原理,显示“小模型+更多推理算力”可击败 14 倍大模型,预示预训练 Scaling 时代终结,行业转向“推理即训练”。