数据墙 - AI话题 - AI快开门

2025-01-28

CMU与业界共识指出高质量数据将在2028年耗尽，第三代Scaling Law转向“测试时计算”。通过元强化学习在推理阶段动态分配算力，可突破预训练数据天花板，为通往AGI提供新范式。该转向可能重塑芯片需求结构，推理卡市场有望超越训练卡。

2024-08-02

研究警告2028年高质量训练数据或将耗尽，Gartner预测2025年30%生成式AI项目因成本过高被抛弃，行业开始从烧钱扩张转向理性评估ROI。

2024-07-20

高质量文本耗尽，苹果、OpenAI、Anthropic等被曝“偷师”YouTube视频训练模型，创作者与平台维权升温。数据墙迫近迫使厂商探索合成数据、视频与多模态源，知识产权规则与AI研发间的矛盾进入白热化阶段，将影响大模型迭代速度与合规成本。

2024-06-16

Epoch AI预警2028年人类高质量文本耗尽，智源、星环科技等同步指出语料稀缺已成大模型最大瓶颈，驱动合成数据、私有数据交易与表格语言模型等替代方案快速升温。

# 数据墙