2024-05-13 AI话题 - AI快开门

大模型知识冲突与可靠性

斯坦福、MIT等机构研究大语言模型在“指鹿为马”场景下如何调和外部错误信息与内部先验知识，提出博弈论共识博弈、CO-STAR提示框架等新方法，显著提升LLaMA-7B等中小模型可靠性，为工程落地提供可解释、可控的纠偏思路。

字节开源2-bit量化保持FP16精度，斯坦福新框架百行代码让H100提速30%，微软打破Decoder-Only架构把Llama3-70B塞进20 GB GPU，集体推动大模型端侧与低成本部署，加速商业化落地。

从SIGGRAPH的ThemeStation到RPGGO.AI游戏平台，再到DiT统一图像-视频-音频-3D框架，学界与创业圈同步推进“单样本主题一致”3D生成、可交互多模态体验，降低游戏、元宇宙内容制作成本，预示AI原生娱乐时代加速到来。

台积电3nm工艺落地苹果A17 Pro，ISSCC 2024亮相“闪电”数模混合存内计算宏，面向Transformer/CNN压缩加法树与ASQC技术，解决ADC瓶颈，提升边缘大模型推理能效，为AI硬件提供新范式。

谷歌发布Med-Gemini三件套，多模态能力刷新医学影像、文本、基因任务SOTA；国内「AI+智能车」浦东论坛聚焦新质生产力，显示AI正深入垂直行业，形成高壁垒专业大模型赛道。

百万tokens降至1元、6.99元租H800、零一万物2C产品年收破亿且ROI≈1，标志着大模型进入“白菜价”竞争阶段，推理成本骤降推动应用爆发，初创公司商业化路径逐渐清晰。