斯坦福、MIT等机构研究大语言模型在“指鹿为马”场景下如何调和外部错误信息与内部先验知识,提出博弈论共识博弈、CO-STAR提示框架等新方法,显著提升LLaMA-7B等中小模型可靠性,为工程落地提供可解释、可控的纠偏思路。
字节开源2-bit量化保持FP16精度,斯坦福新框架百行代码让H100提速30%,微软打破Decoder-Only架构把Llama3-70B塞进20 GB GPU,集体推动大模型端侧与低成本部署,加速商业化落地。
从SIGGRAPH的ThemeStation到RPGGO.AI游戏平台,再到DiT统一图像-视频-音频-3D框架,学界与创业圈同步推进“单样本主题一致”3D生成、可交互多模态体验,降低游戏、元宇宙内容制作成本,预示AI原生娱乐时代加速到来。
台积电3nm工艺落地苹果A17 Pro,ISSCC 2024亮相“闪电”数模混合存内计算宏,面向Transformer/CNN压缩加法树与ASQC技术,解决ADC瓶颈,提升边缘大模型推理能效,为AI硬件提供新范式。
谷歌发布Med-Gemini三件套,多模态能力刷新医学影像、文本、基因任务SOTA;国内「AI+智能车」浦东论坛聚焦新质生产力,显示AI正深入垂直行业,形成高壁垒专业大模型赛道。