DeepSeek-OCR、Sa2VA、Veo 3.1等模型在视觉-语言融合、视频编辑、文档解析上实现阶跃,视觉输入成LLM新范式,国产模型Kimi K2号称准确率超GPT-5 50%,标志多模态进入可用级拐点。
Vidu Q2、Google Veo 3.1相继上线“参考生视频”“精确编辑”功能,支持5分钟长故事与元素级魔改,生成速度提升3倍,推动AI视频从Demo走向内容工业流水线。
MIT CRESt、哈佛ToolUniverse、Anthropic Claude for Life Sciences等把大模型变成“AI科学家”,90天完成3500次电化学实验,操作600+工具,催化、天文、蛋白降解数据库全面AI化,科研效率指数级提升。
中国公司率先量产绳驱人形机器人获Nature点赞,宇树H2、Unitree H2新品迭代,开源框架降低Sim2Real门槛,具身智能从Demo走向科研+商业双落地。
Fish Audio S1将克隆门槛降至10秒音频、价格仅为ElevenLabs 1/6,开启“声音平权”;同时Poe上线模型排行榜,语音与文本模型同台竞技,加速C端声音经济爆发。
OpenAI自曝“抢卡抢到发疯”,AWS美东故障致ChatGPT、Snapchat瘫痪,算力瓶颈已直接影响产品迭代与用户体验,基础设施成为AI竞赛隐形战场。
字节Cici海外霸榜、阿里夸克“C计划”剑指豆包,AI同传、AI医疗、AI炒股等应用全球开花,但跨境支付、数据合规、IP侵权(Salesforce被诉)风险同步上升,出海进入“合规深水区”。