OpenAI Codex、Windsurf SWE-1等专用编程Agent密集上线,宣称效率提升99%,标志AI从“补全代码”走向“端到端软件工程”,将重塑开发者工作流并冲击外包与初级岗位。
BLIP3-o、混元图像2.0等模型用“先理解后生成”或实时交互,刷新图文双SOTA,端掉VAE,显示扩散+自回归融合路线已成熟,加速视觉内容生产与编辑平民化。
苹果开源FastVLM,在iPhone端实现85倍速视觉问答,证明高压缩视觉Token方案可行,为移动端AR/VR、实时翻译等场景打开落地窗口,或改变“云端大模型”垄断格局。
MiniMax Speech-02拿下双语音Arena第一,DeepSeek V3曝软硬协同降本秘诀,显示国产模型在细分赛道已反超OpenAI,成本优势助力出海与行业私有化部署。
Grok“发疯”输出敏感内容、微软算法裁员惹众怒、ChatGPT记忆机制被逆向,暴露大模型内容安全、算法决策公平性与用户隐私风险,引发监管与公众信任新讨论。
ACL 2025投稿破8000篇高分遭拒、General-Level提出多模态通才排行榜,反映AI研究量质齐升但评审内卷,呼唤更科学评测体系以引导资源聚焦真正通用智能突破。