【概览】
UC伯克利以不足450美元训练出32B开源推理模型Sky-T1,首次让“o1级”复杂推理能力走下算力神坛;同时北航与ETH把扩散模型压缩至1 bit,存储与速度数量级跃升。两则突破叠加,宣告“大模型=高成本”叙事被打破,生成式与推理范式同步进入平民化时代。
01 | 低成本开源推理模型
UC伯克利团队用公开数据+消费级GPU,仅花450美元完成32B参数模型Sky-T1的训练,在数学、代码与逻辑评测上逼近OpenAI o1-preview,且权重、数据、训练脚本全部开源。这一结果首次证明高阶推理能力可不依赖万卡集群,直接点燃社区二次微调与场景化创新热潮,预示“推理即服务”门槛即将大幅降低。
02 | 扩散模型极致压缩
北航与ETH Zurich联合提出BiDM,首次将扩散模型权重与激活同时二值化到1 bit,ImageNet 64×64生成任务实现28倍存储节省、52倍推理加速,FID几乎无损。该方法使高保真文生图、文生视频模型在手机、AR眼镜等端侧运行成为可能,有望重塑AIGC云端集中式部署格局。
03 | GAN复兴挑战扩散
NeurIPS 2024上出现“极简现代化GAN”新基准,无需复杂正则化与多阶段训练即可在ImageNet生成质量上对标Stable Diffusion,推理速度提升一个数量级。研究引发Reddit与Twitter热议,部分开发者开始回流GAN路线,生成式AI“扩散 vs. GAN”的技术路线之争再度升温。
04 | AI制药高额对外授权
英矽智能将第二条由AI平台Chemistry42设计的抗肿瘤管线对外授权给意大利美纳里尼,交易总额5.5亿美元,含2000万美元首付。这是该公司一年内第二次高额出海,验证其生成式AI药物发现引擎的商业化价值,也为国内AI制药企业拓展欧美市场注入强心针。
05 | 深度强化学习赋能递送
MIT与爱荷华大学利用深度强化学习一次性设计可离子化脂质纳米颗粒(LNP),在肺部mRNA递送效率上提升3倍,并突破传统“实验-筛选”瓶颈。该AI平台可快速适配不同核酸载荷,为基因治疗、吸入式疫苗提供通用纳米载体研发新范式。
06 | OpenAI重启机器人硬件
据知情人士透露,OpenAI已重新组建四年前解散的机器人团队,此次从纯软件转向“大模型+硬件”一体路线,计划自研人形机器人本体。分析认为,OpenAI意在打通多模态大模型与物理终端的数据闭环,加速通用智能体落地,或将搅动本就拥挤的人形机器人赛道。
07 | AI伦理与东方决策哲学
可灵AI在经典“电车难题”场景中选择“紧急制动并退出”而非牺牲任一方,被赞为“东方智慧”。该决策逻辑引发东西方学者对AI伦理框架的再讨论:文化背景如何嵌入价值对齐、可解释性与法规设计,成为通用AI时代的新议题。
08 | AI教育硬件亮相CES
CES 2023开幕首日即成中国AI教育硬件秀场,科大讯飞、有道、作业帮等集中发布大模型学习机、AI词典笔与智能手写板,主打“家庭教师”场景。教育大模型硬件化趋势明显,厂商同步布局欧美与东南亚市场,2025或成AI教育出海加速年。
【展望】
当“低成本推理”与“极限压缩”同时到来,大模型正从高门槛的“资本游戏”转向大众可及的“开源工具”;GAN回潮、LNP设计、机器人重启等多线并进,则显示AI创新进入多点爆发期。展望未来一年,技术平民化将推动应用层快速裂变,而伦理、监管与跨文化价值对齐也将成为并行焦点。