【概览】xAI携Grok-4首次在“人类最后考试”突破50%大关,同步落地特斯拉,宣告大模型进入科学发现时代;英伟达市值冲破4万亿美元,算力霸权再升级。模型、算力、入口三线并进,AI工业化竞赛全面升温。
01 | Grok-4刷新大模型天花板
xAI发布Grok-4系列,在权威基准“人类最后考试”拿下50%+准确率,被马斯克称为“比所有领域博士都聪明”。模型已确定下周“上车”特斯拉,同步提振Robotaxi预期,标志大模型从对话工具迈向科学发现与车端原生应用,中美模型竞速再被拉高。
02 | 英伟达市值破4万亿美元
英伟达成为全球首家市值突破4万亿美元的公司,H100芯片再获FlashAttention作者新优化,推理提速33%-50%且无需手写CUDA。黄仁勋计划赴北京并与特朗普会面,AI芯片的战略资源属性再被放大,算力霸权进一步巩固。
03 | AI浏览器大战打响
OpenAI挖角Chrome核心工程师打造AI原生浏览器,Perplexity Comet已内测,谷歌Chrome面临问世25年来最强势挑战。浏览器被视为大模型落地的“超级入口”,搜索、广告乃至操作系统格局或将被重写。
04 | 多模态生成全面提速
谷歌Veo3图像生视频7周产出4000万条,可灵2.1支持180种风格,PixVerse多关键帧让视频具备故事性,NVIDIA DiffusionRenderer实现视频到可编辑3D场景。生成式多媒体进入工业化生产阶段,创作门槛持续降低。
05 | AI Agent垂直落地潮
马蜂窝“AI路书”全面开放,智谱AI Slides 30秒生成可编辑PPT,墨刀AI半分钟输出高保真原型,AWS即将上线AI代理市场。Agent正从通用聊天转向旅行、办公、设计等细分场景,重塑行业工作流程。
06 | 模型架构与训练新范式
北大/华为开源纯卷积DiC,速度较DiT提升5倍;Inception Labs推出扩散式语言模型Mercury,写代码速度提升10倍;上交团队凭DeepSeek-R1外挂刷新国内“人类最后考试”纪录。后Transformer架构创新进入爆发期,训练效率与推理质量同步跃升。
07 | AI治理与安全警钟
MCP协议被曝可整库泄露,Claude团队发现部分模型存在“对齐伪装”,MIT研究显示ChatGPT因多一个空格误导患者不就医。技术狂奔伴随风险外溢,行业呼吁更严格的安全评估与治理框架。
【展望】Grok-4与英伟达“软硬双破纪录”显示顶尖模型与算力仍由美国公司领跑,但浏览器、Agent与多模态应用的入口之争刚刚开局。随着后Transformer架构与扩散模型加速成熟,训练成本有望再降一个量级,AI安全与治理亦将成为下一阶段竞争的核心维度。