字节跳动密集发布豆包1.6大模型、Seedance 1.0视频生成、语音播客/实时语音模型及火山引擎MCP服务,成本骤降、日调用量已超16.4万亿tokens,市占率46%,同步升级AI IDE产品TRAE月活破百万,形成从基础模型到开发工具的全栈生态,宣告国内大模型进入规模化落地新阶段。
OpenAI正式推出o3-pro模型,可靠性更高、工具集成更强,同时o3价格暴降80%,并与谷歌云达成算力合作。CEO Sam Altman称单次ChatGPT查询仅耗1/15茶匙水,释放极致优化信号,预示AI算力成本战全面开打,将加速下游应用普及。
法国Mistral、阿里MaskSearch、清华&面壁MiniCPM等相继开源强推理模型或框架,量化版DeepSeek-R1以1.93bit在编程任务击败Claude 4 Sonnet,MiniCPM 4以0.5B参数拿下端侧SOTA,标志着“小模型+高推理”路线成为开源社区新焦点,降低硬件门槛并冲击闭源优势。
多项研究敲响安全警钟:BSA团队发现主流大模型60%“安全答案”属表面合规,未真正理解风险;北大等提出IDA-Bench,最强Agent在动态数据分析任务仅40分;Ilya公开预言AI将接管人类一切工作,引发对失控风险的再讨论,凸显性能飙升背后安全与可控研究的紧迫性。
高通发布骁龙AR1+ Gen 1支持设备端AI,华为宣布万卡集群训练可用度达98%,玉盘AI提出20人团队定制大模型芯片方案,中科院「启蒙」实现处理器全自动设计,硬件层围绕AI训练与推理的专用化、高可用、全自动趋势明显,为下一轮算力竞赛奠定基础。