2025-06-10 AI话题 - AI快开门

多模态大模型技术突破

近期多模态大模型在视觉理解、视频生成、3D建模等方向密集突破：港大-英伟达高分辨率视觉注意力提速84倍，小红书开源1420亿参数“dots.llm1”，谷歌Veo 3一键生成360° 3D视频，Direct3D-S2以8卡GPU实现影视级3D开源。技术簇呈现“高质量+高效率+开源”趋势，将显著降低内容创作与具身智能门槛，推动XR、机器人和设计工业落地。

推理与数学能力跃升

数学推理时间推理思维链类脑机制 AGI

大模型数学推理7个月内从2%提至22%，超越人类平均；o3-mini-high被曝靠直觉破解顶尖难题，14位数学家集体评估。同时，Time-R1用三阶段强化学习让3B小模型时间推理反超671B大模型，浙大InftyThink实现“思维分段”无限深度推理。研究揭示模型可自发形成类脑概念地图，为迈向AGI提供认知机制线索。

端侧与高效小模型崛起

端侧模型小模型实时生成蛋白质设计算力优化

“小模型+高效推理”成为新赛道：清华&面壁0.5B模型端侧SOTA，4090可跑；Adobe单卡4090实现实时视频生成；港科大-快手进化搜索让小模型作画媲美大模型；Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署，将加速AI在移动、IoT、生物设计等场景渗透。

苹果WWDC25 AI矩阵

苹果 Xcode 端侧模型 Siri 开发者

苹果WWDC25发布Xcode 26内置ChatGPT、开放本地Foundation Models、Spotlight升级为AI操作平台，但万众期待的AI Siri缺席。端侧模型全面开放意味着iOS生态将迎第三方AI应用爆发，而Siri跳票显示苹果在对话Agent领域仍落后于OpenAI/Google，市场反应股价6分钟蒸发750亿。