面壁智能MiniCPM、智谱GLM-4-9B、澜舟孟子3-8B等国产模型相继宣布免费商用或开源,参数规模覆盖3B-9B,性能对标LLaMA 3,降低中小开发者门槛,加速中文AI生态繁荣。
普林斯顿与CMU团队发布Mamba-2,用统一数学框架将Transformer与SSM合二为一,状态空间扩大8倍、训练提速50%,为后Transformer时代提供新基座,可能重塑大模型底层架构。
晶泰科技启动港股18C第一股IPO,募资超9亿港元;ASCO 2024披露多款AI设计抗癌分子进入临床,标志AI制药从概念验证走向商业落地与资本市场双重认可。
港大FlashST、LLM-as-Enhancer等研究把大模型变成通用时空预测增强器,覆盖交通、气象、城市计算,解决分布偏移难题,为智慧交通与极端天气预警提供实时高保真方案。
LeCun联合团队提出分层世界模型,用数据驱动实现人形机器人全身控制;同时UC伯克利强化学习框架让多模态模型学会扑克决策,超越GPT-4V,迈向通用机器人智能。