【概览】
DeepMind用AI首次捕获流体力学“ elusive 奇点”,距千禧年大奖一步之遥,宣告“AI4Science”进入第四范式;谷歌、Notion同日把大模型塞进浏览器与办公栈,Agent从工具跃升为操作系统级智能体。基础科研与终端交互的双重跃迁,让“多模态模型争霸”“国产算力反击”“编程零人工”三线并进,却也同步放大训练成本、数据枯竭与全球治理焦虑。
01 | AI驱动科学发现突破
DeepMind联合欧洲数学家,以强化学习在不可压缩欧拉方程中首次定位奇异结构,为“纳维-斯托维斯千禧难题”提供可验证路径;同步开源的HealthGPT-2魔改版,凭生命时序数据预测未来20年1000+疾病风险,准确率超临床基准12%。AI不再只是辅助假设,而成为产生定理、设计实验、预测临床终点的“第一作者”,重塑科学方法论与产业转化节奏。
02 | 浏览器与终端AI化
谷歌把Gemini 1.5 Pro全栈植入Chrome 130,推出跨标签AI助手与“搜索即模式”,7亿周活无需插件即可调用长上下文;Notion 3.0升级为内置Agent的“无代码操作系统”,可自主拆解需求、调用API、完成多步骤工作流。两大流量入口同日刷新,标志AI正从“功能按钮”进化为“系统默认”,人机交互进入“意图即服务”时代。
03 | 多模态与Agent模型争霸
UCSD DreamPRM凭链式过程奖励登顶MMMU推理榜,零样本超越GPT-5与Gemini 1.5;阿里开源30B Tongyi DeepResearch在HLE、GAIA等Agent评测刷新SOTA,单卡可跑;马斯克提前剧透Grok 5,ARC-AGI微调版已领先OpenAI o1。轻量级开源与闭源巨兽同台竞技,推理-行动一体化成为模型军备赛新标尺。
04 | 国产算力与芯片反击
华为发布Atlas 950/960 SuperPoD超节点,支持万卡级昇腾集群与CloudMatrix384互联,官方实测Tokens性能最高达H20四倍;阿里披露OpenAI训练GPT-4时曾调用其开源容器服务,佐证国产AI Infra已具备全球级工程落地能力。从GPU到调度框架的全栈突围,正在改写“算力即权力”的地缘版图。
05 | AI编程与开发者生态
OpenAI内部实践显示,GPT-5-Codex已承担99%代码修改任务,支持长周期自主编程与跨文件重构;OpenRouter 9月调用量榜单中,Kilo Code等编程Agent占据TOP10半壁江山。开发者角色加速向“需求策展人”迁移,软件生产进入“零手动编码”倒计时,工具链商业模式面临按效果付费的重构。
06 | 大模型训练成本与数据墙
Epoch AI报告预测,2030年单模型训练成本将突破千亿美元,公开高质量文本将在2027年耗尽;Cursor取消无限量包月、转向按token计费,侧面印证算力与数据成本已转嫁至终端。合成数据、能效优化与新型商业模式成为行业可持续必答题,资本与技术的双重筛选进一步加剧。
07 | 全球南方AI机遇与治理
CSIS最新报告认为,AI分布式创新有望打破发达国家数字垄断,为全球南方提供“蛙跳式”产业升级窗口;清华薛澜提出“开放创新+多边治理”的中国方案,呼吁共建数据、算力与标准共享机制。地缘竞争下半场,AI治理话语权或成南方国家提升制度性权力的关键变量。
【展望】
当AI在数学奇点与疾病预测上同时登顶,当浏览器与办公栈被重写成Agent OS,行业正站在“科学无人的区”与“人机共生界面”的双拐点。接下来,谁能率先把昇腾、CloudMatrix等国产算力与开源Agent模型深度耦合,谁就能把“科研第四范式”与“零人工编程”转化为下一代生产力平台;而数据墙与千亿美金训练账单,将倒逼合成数据、能效硬件和全球治理规则在三年内跑出可行解。