← 返回列表

AI行业新闻简报 2025.02.24 周一

📊 6 个话题 📰 15 条新闻 🕐 2025-02-24 05:30

【概览】

强化学习+3B小模型即可10美元“顿悟”复现DeepSeek-R1级推理,训练门槛一夜归零;同时AI编程智能体90分钟零人类交付完整应用,多模态基准与政务医疗落地同步升级,行业正从“堆算力”转向“拼创意”。

01 | 推理模型低成本复现潮

多家团队同步开源纯RL方案,仅用10–30美元、1/30训练步数就让3B小模型涌现类DeepSeek-R1的链式推理与“顿悟时刻”。研究平民化将加速全球算法迭代,大模型竞争焦点从“参数”转向“数据策略与奖励设计”。

02 | AI智能体自动编程爆发

Operator与Replit Agent结对编程,90分钟无人类干预完成可商用应用;截图直接生成代码、Coze零代码调用DeepSeek工具链,预示“一句话产软件”的全民开发时代提前到来,软件供应链将被重写。

03 | 视觉-多模态推理基准升级

港中文MMLab发布MME-CoT,首次系统评测大模型视觉链式思维;阿里国际开源Ovis2架构,在视频与多图理解上同步提升,为行业提供统一标尺,推动多模态应用从Demo走向量产。

04 | Grok 3争议与语音模式上线

xAI推送Grok 3语音早期版,却被OpenAI质疑在AIME评测中“一题答64次”刷分。性能真实性争议凸显头部厂商竞争白热化,行业呼吁更透明、可复现的测评协议。

05 | 政务与医疗AI落地加速

深圳全市接入DeepSeek政务系统,70名AI“新员工”秒级完成公文摘要、数据填报;医疗APP“好伴AI”把三甲专家经验做成24×7数字医生,显示垂直大模型正从试用走向规模化部署,ROI开始转正。

06 | 顶尖人才与优化器流动

谷歌Fellow吴永辉加盟字节跳动,负责Seed基础研究;月之暗面开源Muon优化器,算力需求较AdamW降48%,且已在DeepSeek架构验证。底层人才与工具双迁移,中美AI竞争进入“算法效率”新赛道。

【展望】

当训练成本跌破“一杯咖啡”价位,算法创新将呈病毒式扩散;Agent编程、多模态基准与垂直场景落地形成“工具—标准—市场”闭环,下一轮竞争焦点不再是“做大”,而是“做快、做省、做准”。

× 公众号二维码

扫码关注公众号获取每日简报