2025-05-25
推理模型新范式
强化学习让模型仅凭图像即可进行复杂推理与场景规划,打破“语言中心”范式,为机器人、自动驾驶等视觉主导任务提供新路径,有望重塑多模态智能体架构。
2025-02-12
模型架构与推理成本突破
字节跳动UltraMem架构将大模型推理成本降83%,UC伯克利4500美元复现DeepSeek-R1并超越o1-preview,普林斯顿-北大提出层次化RL新范式,清华开源4090单卡满血推理方案,低成本、高效率成为2025模型创新关键词。
2024-12-14
小模型逆袭与大模型效率战
微软 Phi-4(14B)数学击败 GPT-4o,Cohere 推出可跑低端设备的 Command R7B,显示“小模型+数据/训练算法创新”正在挑战“唯参数论”。效率竞赛降低算力门槛,利好端侧部署与中小企业,可能重塑云端订阅商业模式。