【概览】马斯克宣布xAI开源Grok-2.5并预告半年后放出Grok-3,直接挑战OpenAI闭源路线,并点名中国公司为主要对手,全球大模型竞争进入“中美双轨开源”新阶段。同日,上海AI实验室推出首个数据评测竞技场,国产大模型加速渗透C端硬件与场景,开源力量从算法、数据到芯片全面升温。
01 | 马斯克xAI开源Grok 2.5
xAI正式在GitHub公开Grok-2.5权重与训练细节,并承诺Grok-3将于六个月后继续开源。马斯克称此举意在打破“闭源霸权”,同时罕见点名中国大模型团队为xAI“最大对手”,暗示中美围绕开源主导权的竞逐已从模型性能延伸至生态规则。行业分析认为,Grok系列走向完全开源将迫使Meta、Google重新评估自身策略,全球生成式AI进入“双轨并行”时代:一边是美国企业内部闭源高速迭代,另一边是以中美开源社区为轴心的开放联盟快速扩散。
02 | AI训练数据透明化
上海AI实验室发布OpenDataArena,首次把大模型预训练数据做成可复现、可对抗的“公开擂台”。平台提供统一清洗、配比和评测基准,并实时更新排行榜,开发者可直接上传数据包进行A/B测试,显著降低“炼丹”试错成本。项目负责人表示,希望借此推动行业焦点从“暴力堆参数”转向“精细数据工程”,为开源社区建立类似ImageNet的公共数据基础设施。
03 | 国产大模型生态落地
QQ浏览器宣布全量接入DeepSeek-V3.1,在搜索、PDF阅读、拍照识题等高频场景上线大模型能力。面对浏览器级十亿DAU的并发与实时性要求,DeepSeek团队通过量化压缩、边缘缓存和多模态融合,将首字延迟控制在300ms以内,验证了国产模型在消费级超级App中的工程化成熟度。分析认为,此次落地为国产大模型提供了“场景-用户-商业”闭环样本,或将引发更多头部App跟进替换海外API。
04 | 开源AI芯片新突破
三名毫无芯片背景的社区开发者,仅花费三个月就用开源EDA与RISC-V完成一块可训练可推理的TPU级加速器,并公开RTL、验证环境与BOM成本。该芯片在1GHz频率下实现256 GFLOPS INT8算力,功耗不到5W,可跑通TinyLlama微调任务。项目 maintainer 表示,开源硬件+云端流片服务已将AI加速器门槛拉到“万元级”,未来半年内计划推出PCIe板卡众筹,进一步催化低成本边缘AI创新。
05 | 极限数学与AI基础理论
数学家利用SAT求解器与40万核超算,刷新第六个海狸数BB(6)下限,其数值大到无法用宇宙原子总数描述;同期,中科大少年班成员给出诺贝尔物理奖相关可积系统猜想的完整证明。两项成果分别从可计算性上限与物理可解性边界,提示当前大模型依赖的图灵机模型仍受不可计算函数约束。专家评论称,当AI能力逼近数学理论天花板,基础学科突破将成为下一代算法范式的“硬门槛”。
【展望】Grok-2.5的开源标志着“模型即基础设施”时代提前到来,中美双方将在开放权重、数据基准与硬件工具链三条战线展开竞合;国产大模型借助超级App落地与数据竞技场透明化,正快速缩小与海外性能差距。未来六个月,随着Grok-3、Llama-3.5及国内新一代稠密模型陆续发布,开源生态有望首次在参数规模、多模态与工具调用三大维度同时逼近闭源顶尖水平,行业关注点也将从“谁能做大模型”转向“谁能运营好开源社区”。