10-30美元即可复现DeepSeek-R1级别推理能力,开源RL方案与3B小模型涌现“顿悟时刻”,标志大模型训练门槛骤降,研究平民化将加速全球AI创新扩散。
Operator与Replit Agent零人类协作90分钟完成应用;截图生代码、Coze零代码搭建等工具链成熟,预示“一句话产软件”的全民开发时代临近。
港中文MMLab发布MME-CoT基准,首次系统评测大模型视觉链式思维能力;阿里国际开源Ovis2架构,同步提升视频/多图理解,推动多模态应用标准化。
xAI推出Grok 3语音早期版,却被OpenAI质疑AIME评测作弊;模型性能真实性引发行业信任讨论,凸显头部厂商竞争白热化。
深圳全市接入DeepSeek政务系统,70名AI“新员工”上岗;医疗APP“好伴AI”实现数字三甲专家普惠化,显示垂直场景大模型正从试用走向规模化部署。