谷歌百万专家 Mixture、斯坦福 TTT 等新架构集中亮相,通过稀疏激活或测试时训练替代传统注意力,显著降低算力并提升长文本与多模态能力,可能重塑大模型扩展路径。
可灵 AI 70 万人排队、Odyssey 好莱坞级可控生成、PaintsUndo 自动还原绘画过程等工具密集发布,标志着 AI 视频与视觉叙事进入可用与商业化临界点。
DeepMind JEST、谷歌百万专家及智源 Triton 算子库等方法,将训练时间缩短 13 倍、算力降低 90%,缓解万亿参数时代 GPU 饥渴,为中小团队参与大模型竞争打开窗口。
RankRAG 微调 Llama3 超 GPT-4、清华等发布知识冲突深度解析、鄂维南提出第三种记忆,显示检索增强与新型记忆已成为大模型落地企业的核心战场。
SemiKong 首颗开源芯片大模型、Ollama 0.2 并发推理、Claude Artifacts 共享生态等降低开发门槛,推动“个人即团队”的 AI 应用爆发。
Skild AI 3 亿美元融资、人形机器人被院士视为爆发点、Galaxy Ring 与 Oura 引入 AI 顾问,表明通用机器人与可穿戴硬件正成为 AI 物理化的关键载体。