← 返回列表

AI行业新闻简报 2025.03.02 周日

📊 7 个话题 📰 18 条新闻 🕐 2025-03-02 05:30

【概览】OpenAI以“高情商”GPT-4.5点燃市场争议,API定价飙升30倍,凸显基础模型路线成本之痛;另一边,DeepSeek用一周开源把高性能基础设施打至“白菜价”,并带动英伟达财报再破纪录。大模型“贵”与“省”的两极共振,预示行业正从参数崇拜转向成本、效率与安全并重的理性阶段。

01 | GPT-4.5天价发布

OpenAI发布迄今最大规模模型GPT-4.5,以“类人共情”交互体验刷新对话质量上限,但算力消耗达GPT-4的10倍,API定价暴涨30倍,开发者直呼“用不起”。高昂成本与边际性能提升的反差,重新点燃对Scaling Law性价比的质疑,也让“基础模型回归”成为开年焦点。

02 | DeepSeek开源周收官

国产团队DeepSeek连续五天放出核心代码,压轴推出3FS并行文件系统与Smallpond框架,单集群吞吐6.6 TiB/s,将SSD带宽压榨至极限。整套方案验证了“低成本+高带宽”AI基础设施的可复制路径,为社区复现高效训练与推理提供新标杆。

03 | AI for Science呼声高涨

清华孙茂松院士提醒“AI4S时间窗口稍纵即逝”,李国杰院士七问DeepSeek,直击大模型在科研场景中的算法原创度、数据治理与跨学科协同短板。专家共识:AI若要在基础科学掀起范式革命,需尽快建立共享数据、开放评测与学科融合的新机制。

04 | 英伟达财报与DeepSeek红利

英伟达Q4营收创纪录达1305亿美元,黄仁勋公开感谢DeepSeek引爆推理侧需求,称“新Scaling Law让Blackwell成为印钞机”。DeepSeek同步披露V3/R1推理系统成本利润率高达545%,低成本模型与高端芯片共振,推理市场进入爆发拐点。

05 | 模型安全与缺陷曝光

北大团队发现DeepSeek-R1可被特殊提示诱导进入无限循环,形成AI版DDoS攻击;另一项研究则证实大模型具备“自知之明”,能判断自身知识边界。攻防两面研究齐发,凸显大模型可控性与安全评估体系建设的紧迫性。

06 | 多模态小模型突破

微软56亿参数Phi-4-multimodal在读图推理基准上反超GPT-4o,港科大等团队验证语音合成同样遵循Scaling Law,小参数模型在边缘端展现高竞争力。行业开始意识到“体量瘦身+多模态融合”或成端侧落地的最优解。

07 | AI硬件与创业生态

CES余温下,AI硬件成为投资圈“新共识”,Global OneClick已服务50+硬件初创,指出“硬件门槛+AI附加值”是出海胜出的关键;字节跳动在杭州扩招广告算法实习生,加速推荐大模型商业化落地,显示巨头对AI变现的急迫需求。

【展望】当“最贵”与“最省”两大极端模型同台竞技,行业关注点正从参数规模转向经济性与可控性;开源基础设施的成熟与AI4S呼声的升温,将降低科研与产业门槛,催生更多垂直场景突破。可以预见,2025年大模型竞争进入“成本-性能-安全”三维权衡期,谁能同时拿下三局,谁就能率先定义下一代AI标准。

× 公众号二维码

扫码关注公众号获取每日简报