OpenAI o1 引爆“慢思考”推理新范式,国内外迅速跟进:360 提前布局 CoE 多模型协作,清华等团队验证 CoT 可无限扩展 Transformer 推理能力,同时混合架构(Mamba+Transformer)与多模型协作方案试图替代传统提示工程,标志着大模型竞争焦点从训练规模转向推理机制创新。
视频、3D、图像生成进入“秒级高清”时代:可灵 1.5 不加价升级 1080P 并上线运动笔刷,智谱开源 CogVideoX-5B-I2V 图生视频模型,清华团队提出 3D Scaling Law 并发布 VAST 工具,Grok 图像引擎母公司 Black Forest Labs 火速融资 1 亿美元,多模态创作门槛与成本骤降。
阿里通义千问 Qwen2.5 全系列开源,覆盖对话、数学、代码;海德堡大学 ACL2024 发布图语言模型 GLM,融合知识图谱与语言模型;Reader-LM 等小型专用模型涌现,开源社区从“拼参数”转向“拼场景”,降低开发者落地门槛。
交通、医药、BI 等领域跑出首批“大模型原生”应用:港大 OpenCity 实现零样本交通预测,训练提速 50 倍;英矽智能 TNIK 抑制剂 IIa 期临床达终点,验证 AI 制药路径;浩鲸鲸智 BI 大模型从算法炫技转向价值落地,行业模型进入商业验证期。
谷歌云中国创投峰会集结真格、红杉等顶级 VC,共识:海外付费环境更成熟,AI 创业者应“生而全球化”;同时提示词工程框架 ell 升级支持版本控制与多模态,降低出海团队开发成本,资本与工具链双轮驱动中国 AI 项目走向世界。