← 返回列表

AI行业新闻简报 2025.02.04 周二

📊 6 个话题 📰 22 条新闻 🕐 2025-02-04 05:30

【概览】国产开源大模型DeepSeek-R1/V3以“低价+国产算力”组合在春节档强势出圈,华为云、腾讯云等同步上线推理服务,带动中国AI基础设施迎来“安卓时刻”。OpenAI紧急发布免费推理模型o3-mini与“深度研究”功能应战,全球大模型竞赛进入“推理性价比”新阶段。

01 | DeepSeek生态爆发

春节前后,DeepSeek-R1/V3系列以开源、低价、国产算力适配三板斧迅速破圈,华为云、硅基流动、腾讯云等主流云厂商同日上线推理API,实现“模型-云-端”全栈国产化闭环。业内将其比作中国AI基础设施的“安卓时刻”,标志国产大模型首次在全球舆论场与OpenAI正面抗衡,开源生态进入正循环。

02 | OpenAI反击o3-mini

面对DeepSeek冲击,OpenAI连夜发布免费推理模型o3-mini并上线“深度研究”功能,主打低成本、高推理性能与30分钟万字报告能力,试图用技术+体验双重升级重夺头条。o3-mini在物理推理与编程任务的多项实测中表现抢眼,全球大模型竞争焦点正式转向“推理性价比”。

03 | AI搜索新战事

国产5人创业团队借DeepSeek-R1联网能力推出AI搜索产品,在小红书、Reddit爆火并宣称留存超Perplexity;OpenAI同步上线“深度搜索”,可一次性输出万字报告。AI搜索赛道从“答案引擎”升级为“报告生成器”,竞争焦点转向深度内容与用户粘性。

04 | Scaling Law再讨论

业界对“堆参数”边际收益递减的疑虑升温,Cameron Wolfe长文指出大模型扩展遭遇数据与算力双重瓶颈,呼吁转向高效架构与数据精炼。多项最新研究聚焦知识蒸馏与高质量数据集构建,“后预训练”时代的“精炼+蒸馏”路线成为新主线。

05 | 模型安全与自我意识

实验显示,经微调的GPT-4o可识别自身输出并主动标记危险代码,首次展现“行为自我意识”。该能力伴随后门激活与自我描述风险,引发对模型可控性与安全对齐的新一轮讨论,为AI治理提供关键实验依据。

06 | 垂直应用落地

AI继续向细分场景渗透:谷歌X孵化Heritable Agriculture,用AI优化作物产量;Adobe推出大一统视频插帧编辑模型,实现多可控生成;斯隆凯特琳中心用主动学习加速药物联筛,显示大模型之外,AI在农业、创意、生物医药等垂直领域持续创造价值。

【展望】DeepSeek以开源姿态撕开“性价比”缺口,加速国产算力-模型-云一体化闭环;OpenAI迅速反击,将“推理成本”推向极限。双方交锋预示2025年大模型竞争进入“效率+生态”双轮驱动阶段,后续看点在于开源社区能否持续放大创新飞轮,以及监管如何跟进模型自我意识带来的安全新命题。

× 公众号二维码

扫码关注公众号获取每日简报