开源大模型 - AI话题

2026-01-06

大模型开源与推理新范式

DeepSeek-R1、Falcon H1R 7B、华为openPangu-VL-7B等轻量级开源模型轮番登顶榜单，以7B-30B参数实现千亿级性能，打破“唯规模论”；字节DLCM、清华LingoEDU提出概念级推理与结构化预处理，准确率最高提升51%，推动低成本、高可靠的行业微调落地，开源生态进入“小而强”时代。

开源大模型推理优化 DeepSeek 模型压缩概念级推理

2026-01-05

开源大模型井喷

中国电信开源千亿参数MoE模型TeleChat3，实现国产万卡全栈训练；月之暗面新模型Kiwi-do现身竞技场；清华DragMesh、字节SeedFold等论文级成果集中放出。中国开源模型在参数规模、多模态与3D交互上集体突破，加速技术普惠与生态竞争。

开源大模型 TeleChat3 Kiwi-do DragMesh SeedFold

2025-12-29

中国开源模型全球登顶

阿里通义千问下载量首超美国模型，成为第三方API平台第二大开源模型；《连线》等西方媒体认为“生态广度”正取代单一性能指标，标志着中国开源力量在全球AI话语权显著提升，2026或成“千问之年”。

千问开源大模型生态竞争全球下载量

2025-12-17

大模型开源与性能跃升

英伟达、小米、腾讯、谷歌等集中发布开源或升级大模型：英伟达Nemotron 3、小米3090亿参数MiMo-V2-Flash、腾讯混元世界模型1.5、谷歌Gemini2.5Flash均强调推理速度、成本与多模态能力。开源+低价API降低开发者门槛，预示“卖铲子”硬件巨头亲自下场“挖矿”，行业竞争从参数竞赛转向效率与生态。

开源大模型性能优化 API降价英伟达小米

2025-12-03

开源大模型井喷升级

DeepSeek V3.2、Mistral 3、商汤NEO等密集发布，性能对标GPT-4o/Gemini-3.0-Pro，稀疏注意力、原生多模态等架构创新显著降低训练与推理成本，推动开源阵营进入第一梯队，加速闭源模型压力与行业技术普惠。

开源大模型 DeepSeek Mistral NEO 稀疏注意力

2025-11-23

国产科学大模型夺金

上海人工智能实验室开源P1家族在IPhO 2025理论考试夺金，成为首个获金牌的开源模型，结合PhysicsMinions智能体框架后性能再提升，标志国产AI在科学竞赛领域实现零的突破，为教育、科研与工业仿真提供新基座。

开源大模型物理奥赛科学竞赛国产AI 智能体框架

2025-11-09

大模型技术突破与开源竞争

国产Kimi开源推理模型K2 Thinking以1T MoE架构、32B激活在多项基准超越GPT-5，HuggingFace发布200页大模型实战指南，百度文心5.0 Preview国内实测领先，显示开源与闭源阵营同步加速，模型性能与落地门槛双降，重塑全球大模型竞争格局。

Kimi K2 开源大模型文心5.0 HuggingFace 模型性能

2025-11-08

开源大模型军备赛升级

月之暗面开源1万亿参数Kimi K2 Thinking，英伟达9B OmniVinci全模态模型上线即破万下载，两人团队两周复刻DeepSeek-OCR，标志开源阵营在参数规模、多模态、效率与成本上全面逼近甚至超越闭源模型，显著缩小生态差距，降低行业门槛。

开源大模型 Kimi K2 OmniVinci DeepOCR 参数规模

2025-09-17

开源生态洗牌与模型迭代

阿里开源通义DeepResearch轻量代理性能超OpenAI旗舰，小红书彻底开源音频大模型，宇树开源机器人世界模型UnifoLM，LLM开源2.0榜单60款模型出局，开源正从“参数释放”转向“数据+工具链+标准”全方位竞争。

开源大模型通义DeepResearch 音频模型 UnifoLM LLM洗牌

2025-09-12

开源大模型技术突破

阿里Qwen3-Next、字节HuMo、阿里妈妈SDH等多款开源大模型密集发布，MoE与扩散架构成为新主流，训练成本骤降90%，性能逼近GPT-5，标志国产开源进入全球第一梯队，将加速行业落地与生态繁荣。

开源大模型 MoE 扩散模型 Qwen3 训练降本

2025-08-04

开源大模型密集上新

问小白XBai o4、腾讯混元0.5-7B、谷歌langextract、昆仑万维MindLink等相继开源，覆盖推理、轻量部署与结构化抽取，标志国内开源阵营向OpenAI闭源模型发起正面性能与生态挑战，降低行业落地门槛。

开源大模型推理轻量生态

2025-08-01

国产大模型技术突破

DeepSeek 联合北大提出原生稀疏注意力 NSA 获 ACL 2025 最佳论文，推理提速 11 倍；字节发布扩散语言模型 Seed-Diffusion，推理速度达 2.1k tokens/s；阶跃星辰开源 Step-3、通义开源 Qwen3-Coder-Flash，国产模型在架构、效率与代码能力上集体跃升。

稀疏注意力 DeepSeek 字节扩散模型开源大模型 ACL最佳论文

2025-07-27

WAIC 2025重磅发布潮

世界人工智能大会集中释放中国AI“模型+场景”大礼包：商汤“悟能”具身平台、腾讯开源混元3D、京东升级JoyAI、阶跃Step 3、阿里三连发等十余款基础模型同台竞技，并同步开放数据与工具链，标志国产大模型进入“周级迭代”新阶段，加速应用落地与生态洗牌。

WAIC 开源大模型具身智能 3D生成生态迭代

2025-07-22

中国开源模型领跑全球

Kimi K2、DeepSeek、Qwen3等国产大模型在LMArena等榜单包揽前三，以384专家MoE、FP8量化、235B参数等创新刷新SOTA，获国际权威点赞，标志中国开源力量从跟随到引领，加速全球开发者生态向中文社区迁移。

开源大模型 Kimi Qwen DeepSeek SOTA

2024-12-27

DeepSeek-V3开源震撼发布

幻方量化旗下DeepSeek-V3以558万美元训练成本、671B MoE架构开源，性能比肩GPT-4并超越Llama3.1，代码能力直追Claude 3.5 Sonnet，训练数据达14.8T token，刷新国产大模型性价比与能力上限，引发全球开发者强烈关注。

DeepSeek-V3 开源大模型训练成本 MoE 代码能力

2024-12-07

Meta Llama3.3 70B后训练反超旗舰

Meta发布Llama3.3 70B，仅用后训练优化即超越自家405B与GPT-4、Gemini1.5Pro，开源+高性价比策略再次搅动大模型竞争格局，降低企业与开发者部署顶级模型的硬件门槛，加速行业向“小而强”路线迁移。

Llama3.3 开源大模型后训练优化性能超越 Meta

2024-11-05

开源大模型持续迭代

腾讯 Hunyuan-Large、上海 AI Lab Llama-o1、清华 RDT 双臂机器人扩散模型等相继开源，长文本、数理推理、具身智能多线并进，降低研发门槛，加速行业应用落地。

开源大模型长文本推理具身智能 Llama-o1

2024-10-20

开源大模型与数据基建

LLM360开源15万亿Token级训练全流程，Meta被批“污染开源”，国内F5-TTS零样本语音克隆开源，显示社区正用极致透明对抗封闭巨头，降低行业复现与再训练门槛，重塑开源生态话语权。

开源大模型数据透明语音克隆 LLM360 Meta

2024-10-18

开源模型刷新SOTA

英伟达开源70B Nemotron、阿里通义Qwen2.5、清华RDT双臂机器人扩散模型等接连击败GPT-4o、Claude 3.5等闭源旗舰，显示开源社区在语言、推理、具身智能领域正快速缩小甚至反超商业模型，降低行业准入门槛。

开源大模型 SOTA 英伟达通义

2024-09-28

大模型技术突破与自我进化

DeepMind SCoRe让大模型无需外部数据即可自我纠正，性能提升15.9%；国产群体智能架构挑战Transformer；TeleAI开源115B全国产大模型；1.58比特极端量化落地。算法创新正降低训练门槛并提升推理可靠性。

自我纠正群体智能量化开源大模型 Transformer

AI快开门

发现最好的AI工具

# 开源大模型