RLHF、超级对齐、合作逆强化学习等技术成为解决大模型目标偏离与对抗攻击的核心路线;学界与产业界同步推进“AI欺骗AI”风险治理,8周读书会系统梳理安全框架。
艾伦研究所OLMo首次公开权重、代码、数据集与完整训练流程,可复现性刷新开源最高标准;同期Nomic Embed全开源击败OpenAI,带动社区进入“可验证开源”时代。
腾讯AppAgent、Mobile-Agent等让大模型像人一样操作手机App;Vision Pro首拆展示空间计算+AI融合潜力,带动AR出货量逆势增长84%,多模态交互进入落地期。
华为LocMoE、Mamba字节级训练、匿名LoRA流式更新等方案同步突破MoE与长文本效率瓶颈;谷歌Bard更名Gemini并推Ultra 1.0,性能升级但转向付费,行业竞速再升级。
谷歌、UMass、UIUC联合利用LLM自动生成完整数学证明,获软件工程顶会杰出论文;上下文越全,证明成功率越高,为大模型在形式化验证与数学研究打开新场景。