2024-06-05 AI话题 - AI快开门

国产大模型开源潮

面壁智能MiniCPM、智谱GLM-4-9B、澜舟孟子3-8B等国产模型相继宣布免费商用或开源，参数规模覆盖3B-9B，性能对标LLaMA 3，降低中小开发者门槛，加速中文AI生态繁荣。

普林斯顿与CMU团队发布Mamba-2，用统一数学框架将Transformer与SSM合二为一，状态空间扩大8倍、训练提速50%，为后Transformer时代提供新基座，可能重塑大模型底层架构。

晶泰科技启动港股18C第一股IPO，募资超9亿港元；ASCO 2024披露多款AI设计抗癌分子进入临床，标志AI制药从概念验证走向商业落地与资本市场双重认可。

港大FlashST、LLM-as-Enhancer等研究把大模型变成通用时空预测增强器，覆盖交通、气象、城市计算，解决分布偏移难题，为智慧交通与极端天气预警提供实时高保真方案。

LeCun联合团队提出分层世界模型，用数据驱动实现人形机器人全身控制；同时UC伯克利强化学习框架让多模态模型学会扑克决策，超越GPT-4V，迈向通用机器人智能。

第六届北京智源大会公布议程，设置大模型、生成模型、AI系统、人才发展等论坛，汇聚国内外顶尖学者，被视为中国AI政策与技术风向标的年度盛会。