OpenAI推出首个文生视频模型Sora,可一次性生成60秒一镜到底的高清视频,画质与指令遵循能力继承DALL·E 3,被视作颠覆影视、广告等内容产业的里程碑事件,引发“行业RIP”讨论,参数或仅30亿却效果炸裂。
谷歌密集发布Gemini 1.5 Pro,采用MoE架构,上下文窗口首次扩展至100万token,多模态理解刷新纪录,可仅凭提示词学会训练语料外的新语言,直接对标GPT-5,加速大模型长文本竞争。
上海交大提出「智能化科学设施」构想,整合大模型、生成式模拟、自主无人实验与可信协作;普林斯顿与DeepMind用数学证明LLM非“随机鹦鹉”,规模越大能力必然增强,为AI科研提供理论支撑。
企业级AI落地聚焦数据访问效率与治理合规,腾讯分享从“合规”到“合理”的数据质量审查工具;微软推出基于GPT-4V的Windows Agent「UFO」,实现跨应用自动调度,成功率达GPT-4两倍,预示操作系统级AI助手时代来临。
Nature Communications报道受小脑回路启发的人工网络可自发涌现语法与单词预测能力;PRL研究揭示深度神经网络有限时间Lyapunov指数在混沌临界点后趋于稳定,为理解大脑语言处理与深度模型稳定性提供新视角。
OpenAI联创Andrej Karpathy再次离职,称将投入个人新项目;集智俱乐部宣布龙年学习计划,围绕复杂系统、AI Agent、大模型等前沿方向持续深耕,推动科研社群建设。