零一万物开源Yi-VL多模态大模型,在MMMU/CMMMU榜单领先;Meta提出Llama2自奖励微调超越GPT-4;清华等联合提出个人LLM智能体五级标准。开源阵营正快速缩小与闭源模型的性能差距,降低行业落地门槛,2024年或成开源大模型生态爆发年。
奥特曼筹数十亿美元自建全球晶圆厂网络,欲打破英伟达垄断;国内傅盛展示百亿参数模型单卡3060可跑,边缘部署门槛骤降。算力成本已成大模型普及最大瓶颈,从芯片设计、代工到模型压缩,全栈式算力竞赛决定未来AI入口格局。
华科王兴刚团队首次将Mamba引入ViT,精度超DeiT、速度提升5倍;中科院等推出VMamba,宣告视觉Mamba迎来Swin时刻。线性复杂度+全局感受野让Mamba成为CNN与Transformer之外的新主流,有望重塑端侧视觉芯片与推理框架。
麦肯锡预测生成式AI每年可为医疗健康新增1100亿美元价值;上交团队发布可解释靶点感知分子生成模型KGDiff;望石智慧3D分子生成Lingo3DMol优于SOTA。大模型与扩散模型正加速先导药物筛选、抗体优化与个性化治疗落地。
MagicLab发布世界首款电驱空翻人形机器人,国产纯电驱方案打破波士顿动力液压专利壁垒;千挂科技完成国内首次端到端智驾大模型路测。AI+强化学习让硬件轻量化、运动控制智能化,中国机器人正从模仿走向原创。
业界热议“一次性搞定LLM构建、落地和管理”:小企业借助行业大模型+工具链低成本上线,大企业从底座自研。训练贵、推理慢、缺数据、合规难成为共性问题,模型即服务(MaaS)与可观测性平台成为新的基础设施赛道。
高通CEO安蒙断言生成式AI将彻底变革人机交互;Pika、Gen-2、ModelScope等视频生成模型横向评测出炉;大模型已能听懂音乐风格并剪辑合成。端侧大模型+多模态生成让手机、XR、汽车成为实时内容生产中心。