2025-01-28
测试时计算成新Scaling Law
CMU与业界共识指出高质量数据将在2028年耗尽,第三代Scaling Law转向“测试时计算”。通过元强化学习在推理阶段动态分配算力,可突破预训练数据天花板,为通往AGI提供新范式。该转向可能重塑芯片需求结构,推理卡市场有望超越训练卡。
2024-08-02
数据瓶颈与商业冷思考
研究警告2028年高质量训练数据或将耗尽,Gartner预测2025年30%生成式AI项目因成本过高被抛弃,行业开始从烧钱扩张转向理性评估ROI。
2024-07-20
数据荒与版权争议升级
高质量文本耗尽,苹果、OpenAI、Anthropic等被曝“偷师”YouTube视频训练模型,创作者与平台维权升温。数据墙迫近迫使厂商探索合成数据、视频与多模态源,知识产权规则与AI研发间的矛盾进入白热化阶段,将影响大模型迭代速度与合规成本。
2024-06-16
数据墙逼近,LLM训练告急
Epoch AI预警2028年人类高质量文本耗尽,智源、星环科技等同步指出语料稀缺已成大模型最大瓶颈,驱动合成数据、私有数据交易与表格语言模型等替代方案快速升温。