2025-10-02
国产模型代码能力跃升
智谱GLM-4.6在74项真实编程任务中超越Claude Sonnet 4,树立国产代码模型新标杆;Python继续霸榜IEEE 2025语言排行,AI与数据科学需求推动其十连冠,国内开发者生态进一步向自研大模型倾斜。
2025-07-25
AI编程与科学计算新范式
阿里Qwen3-Coder登顶代码榜,南洋理工多token预测微调编程准确率提升11.67%,北航OmniArch求解11类PDE,微软BioEmu加速蛋白质模拟10万倍,显示AI在科研与工程计算中正形成“模型即实验”的新范式。
2025-06-17
开源代码大模型爆发
月之暗面Kimi-Dev-72B、MiniMax-M1等国产大模型相继开源,在代码修复、超长上下文推理等基准刷新SOTA,低成本(53万美元)与1M token窗口成为亮点,标志国内开源力量跻身全球第一梯队,加速开发者生态与行业落地。
2025-04-15
AI+科学研究新范式
AI首次完成50年未解的非平凡数学证明,诺奖得主称AI一年可完成“10亿年博士研究”,谷歌Gemini 2.5编程霸榜,显示大模型在数学、代码、蛋白质组学等科研领域成为“加速引擎”,科学发现进入AI协同时代。
2024-05-30
大模型开源与性能突破
Mistral、阿里、腾讯等密集发布开源或高性能大模型:Mistral 22B代码模型秒级推理击败Llama3-70B,阿里云LucaOne开源对标AlphaFold3,腾讯「元宝」App落地,MoE架构以1/19算力逼近Llama3,显著降低训练与推理成本,推动大模型进入普惠与实用阶段。
2024-01-17
推理加速与代码专用模型
蚂蚁集团开源PD分离算法为大模型推理提速2-6倍,Stability AI发布30亿参数Stable Code 3B支持无GPU本地运行,显示“小参数、高效率、代码场景优先”成为模型落地新方向,降低开发者硬件门槛。