2026-01-06
大模型开源与推理新范式
DeepSeek-R1、Falcon H1R 7B、华为openPangu-VL-7B等轻量级开源模型轮番登顶榜单,以7B-30B参数实现千亿级性能,打破“唯规模论”;字节DLCM、清华LingoEDU提出概念级推理与结构化预处理,准确率最高提升51%,推动低成本、高可靠的行业微调落地,开源生态进入“小而强”时代。
2026-01-05
开源大模型井喷
中国电信开源千亿参数MoE模型TeleChat3,实现国产万卡全栈训练;月之暗面新模型Kiwi-do现身竞技场;清华DragMesh、字节SeedFold等论文级成果集中放出。中国开源模型在参数规模、多模态与3D交互上集体突破,加速技术普惠与生态竞争。
2025-12-29
中国开源模型全球登顶
阿里通义千问下载量首超美国模型,成为第三方API平台第二大开源模型;《连线》等西方媒体认为“生态广度”正取代单一性能指标,标志着中国开源力量在全球AI话语权显著提升,2026或成“千问之年”。
2025-12-17
大模型开源与性能跃升
英伟达、小米、腾讯、谷歌等集中发布开源或升级大模型:英伟达Nemotron 3、小米3090亿参数MiMo-V2-Flash、腾讯混元世界模型1.5、谷歌Gemini2.5Flash均强调推理速度、成本与多模态能力。开源+低价API降低开发者门槛,预示“卖铲子”硬件巨头亲自下场“挖矿”,行业竞争从参数竞赛转向效率与生态。
2025-12-03
开源大模型井喷升级
DeepSeek V3.2、Mistral 3、商汤NEO等密集发布,性能对标GPT-4o/Gemini-3.0-Pro,稀疏注意力、原生多模态等架构创新显著降低训练与推理成本,推动开源阵营进入第一梯队,加速闭源模型压力与行业技术普惠。
2025-11-23
国产科学大模型夺金
上海人工智能实验室开源P1家族在IPhO 2025理论考试夺金,成为首个获金牌的开源模型,结合PhysicsMinions智能体框架后性能再提升,标志国产AI在科学竞赛领域实现零的突破,为教育、科研与工业仿真提供新基座。
2025-11-09
大模型技术突破与开源竞争
国产Kimi开源推理模型K2 Thinking以1T MoE架构、32B激活在多项基准超越GPT-5,HuggingFace发布200页大模型实战指南,百度文心5.0 Preview国内实测领先,显示开源与闭源阵营同步加速,模型性能与落地门槛双降,重塑全球大模型竞争格局。
2025-11-08
开源大模型军备赛升级
月之暗面开源1万亿参数Kimi K2 Thinking,英伟达9B OmniVinci全模态模型上线即破万下载,两人团队两周复刻DeepSeek-OCR,标志开源阵营在参数规模、多模态、效率与成本上全面逼近甚至超越闭源模型,显著缩小生态差距,降低行业门槛。
2025-09-17
开源生态洗牌与模型迭代
阿里开源通义DeepResearch轻量代理性能超OpenAI旗舰,小红书彻底开源音频大模型,宇树开源机器人世界模型UnifoLM,LLM开源2.0榜单60款模型出局,开源正从“参数释放”转向“数据+工具链+标准”全方位竞争。
2025-09-12
开源大模型技术突破
阿里Qwen3-Next、字节HuMo、阿里妈妈SDH等多款开源大模型密集发布,MoE与扩散架构成为新主流,训练成本骤降90%,性能逼近GPT-5,标志国产开源进入全球第一梯队,将加速行业落地与生态繁荣。
2025-08-04
开源大模型密集上新
问小白XBai o4、腾讯混元0.5-7B、谷歌langextract、昆仑万维MindLink等相继开源,覆盖推理、轻量部署与结构化抽取,标志国内开源阵营向OpenAI闭源模型发起正面性能与生态挑战,降低行业落地门槛。
2025-08-01
国产大模型技术突破
DeepSeek 联合北大提出原生稀疏注意力 NSA 获 ACL 2025 最佳论文,推理提速 11 倍;字节发布扩散语言模型 Seed-Diffusion,推理速度达 2.1k tokens/s;阶跃星辰开源 Step-3、通义开源 Qwen3-Coder-Flash,国产模型在架构、效率与代码能力上集体跃升。
2025-07-27
WAIC 2025重磅发布潮
世界人工智能大会集中释放中国AI“模型+场景”大礼包:商汤“悟能”具身平台、腾讯开源混元3D、京东升级JoyAI、阶跃Step 3、阿里三连发等十余款基础模型同台竞技,并同步开放数据与工具链,标志国产大模型进入“周级迭代”新阶段,加速应用落地与生态洗牌。
2025-07-22
中国开源模型领跑全球
Kimi K2、DeepSeek、Qwen3等国产大模型在LMArena等榜单包揽前三,以384专家MoE、FP8量化、235B参数等创新刷新SOTA,获国际权威点赞,标志中国开源力量从跟随到引领,加速全球开发者生态向中文社区迁移。
2024-12-27
DeepSeek-V3开源震撼发布
幻方量化旗下DeepSeek-V3以558万美元训练成本、671B MoE架构开源,性能比肩GPT-4并超越Llama3.1,代码能力直追Claude 3.5 Sonnet,训练数据达14.8T token,刷新国产大模型性价比与能力上限,引发全球开发者强烈关注。
2024-12-07
Meta Llama3.3 70B后训练反超旗舰
Meta发布Llama3.3 70B,仅用后训练优化即超越自家405B与GPT-4、Gemini1.5Pro,开源+高性价比策略再次搅动大模型竞争格局,降低企业与开发者部署顶级模型的硬件门槛,加速行业向“小而强”路线迁移。
2024-11-05
开源大模型持续迭代
腾讯 Hunyuan-Large、上海 AI Lab Llama-o1、清华 RDT 双臂机器人扩散模型等相继开源,长文本、数理推理、具身智能多线并进,降低研发门槛,加速行业应用落地。
2024-10-20
开源大模型与数据基建
LLM360开源15万亿Token级训练全流程,Meta被批“污染开源”,国内F5-TTS零样本语音克隆开源,显示社区正用极致透明对抗封闭巨头,降低行业复现与再训练门槛,重塑开源生态话语权。
2024-10-18
开源模型刷新SOTA
英伟达开源70B Nemotron、阿里通义Qwen2.5、清华RDT双臂机器人扩散模型等接连击败GPT-4o、Claude 3.5等闭源旗舰,显示开源社区在语言、推理、具身智能领域正快速缩小甚至反超商业模型,降低行业准入门槛。
2024-09-28
大模型技术突破与自我进化
DeepMind SCoRe让大模型无需外部数据即可自我纠正,性能提升15.9%;国产群体智能架构挑战Transformer;TeleAI开源115B全国产大模型;1.58比特极端量化落地。算法创新正降低训练门槛并提升推理可靠性。