2024-02-17 AI话题 - AI快开门

OpenAI Sora视频生成震撼发布

OpenAI推出首个文生视频模型Sora，可一次性生成60秒一镜到底的高清视频，画质与指令遵循能力继承DALL·E 3，被视作颠覆影视、广告等内容产业的里程碑事件，引发“行业RIP”讨论，参数或仅30亿却效果炸裂。

谷歌密集发布Gemini 1.5 Pro，采用MoE架构，上下文窗口首次扩展至100万token，多模态理解刷新纪录，可仅凭提示词学会训练语料外的新语言，直接对标GPT-5，加速大模型长文本竞争。

上海交大提出「智能化科学设施」构想，整合大模型、生成式模拟、自主无人实验与可信协作；普林斯顿与DeepMind用数学证明LLM非“随机鹦鹉”，规模越大能力必然增强，为AI科研提供理论支撑。

企业级AI落地聚焦数据访问效率与治理合规，腾讯分享从“合规”到“合理”的数据质量审查工具；微软推出基于GPT-4V的Windows Agent「UFO」，实现跨应用自动调度，成功率达GPT-4两倍，预示操作系统级AI助手时代来临。

Nature Communications报道受小脑回路启发的人工网络可自发涌现语法与单词预测能力；PRL研究揭示深度神经网络有限时间Lyapunov指数在混沌临界点后趋于稳定，为理解大脑语言处理与深度模型稳定性提供新视角。

OpenAI联创Andrej Karpathy再次离职，称将投入个人新项目；集智俱乐部宣布龙年学习计划，围绕复杂系统、AI Agent、大模型等前沿方向持续深耕，推动科研社群建设。