2024-07-11
大模型训练与评测突破
DeepMind提出JEST数据筛选法,训练时间缩短13倍、算力降90%;牛津语义熵登Nature,可零改动检测LLM幻觉;SemiKong开源芯片设计大模型,五年或重塑5000亿美元半导体业,显示基础模型在效率、可信度与垂直领域全面提速。
2024-07-10
训练效率与算力节省
DeepMind JEST、谷歌百万专家及智源 Triton 算子库等方法,将训练时间缩短 13 倍、算力降低 90%,缓解万亿参数时代 GPU 饥渴,为中小团队参与大模型竞争打开窗口。