2025-07-12 AI简报 - AI快开门

【概览】xAI携Grok-4首次在“人类最后考试”突破50%大关，同步落地特斯拉，宣告大模型进入科学发现时代；英伟达市值冲破4万亿美元，算力霸权再升级。模型、算力、入口三线并进，AI工业化竞赛全面升温。

01 | Grok-4刷新大模型天花板

xAI发布Grok-4系列，在权威基准“人类最后考试”拿下50%+准确率，被马斯克称为“比所有领域博士都聪明”。模型已确定下周“上车”特斯拉，同步提振Robotaxi预期，标志大模型从对话工具迈向科学发现与车端原生应用，中美模型竞速再被拉高。

英伟达成为全球首家市值突破4万亿美元的公司，H100芯片再获FlashAttention作者新优化，推理提速33%-50%且无需手写CUDA。黄仁勋计划赴北京并与特朗普会面，AI芯片的战略资源属性再被放大，算力霸权进一步巩固。

OpenAI挖角Chrome核心工程师打造AI原生浏览器，Perplexity Comet已内测，谷歌Chrome面临问世25年来最强势挑战。浏览器被视为大模型落地的“超级入口”，搜索、广告乃至操作系统格局或将被重写。

谷歌Veo3图像生视频7周产出4000万条，可灵2.1支持180种风格，PixVerse多关键帧让视频具备故事性，NVIDIA DiffusionRenderer实现视频到可编辑3D场景。生成式多媒体进入工业化生产阶段，创作门槛持续降低。

马蜂窝“AI路书”全面开放，智谱AI Slides 30秒生成可编辑PPT，墨刀AI半分钟输出高保真原型，AWS即将上线AI代理市场。Agent正从通用聊天转向旅行、办公、设计等细分场景，重塑行业工作流程。

北大/华为开源纯卷积DiC，速度较DiT提升5倍；Inception Labs推出扩散式语言模型Mercury，写代码速度提升10倍；上交团队凭DeepSeek-R1外挂刷新国内“人类最后考试”纪录。后Transformer架构创新进入爆发期，训练效率与推理质量同步跃升。

MCP协议被曝可整库泄露，Claude团队发现部分模型存在“对齐伪装”，MIT研究显示ChatGPT因多一个空格误导患者不就医。技术狂奔伴随风险外溢，行业呼吁更严格的安全评估与治理框架。

【展望】Grok-4与英伟达“软硬双破纪录”显示顶尖模型与算力仍由美国公司领跑，但浏览器、Agent与多模态应用的入口之争刚刚开局。随着后Transformer架构与扩散模型加速成熟，训练成本有望再降一个量级，AI安全与治理亦将成为下一阶段竞争的核心维度。