Anthropic发布Claude 3.5 Sonnet“电脑使用”能力,AI可直接操作鼠标键盘;国内开源数字人实时对话同步上线,Agent从对话走向执行,标志AI进入“动手”时代,对办公、客服、RPA等场景带来颠覆可能。
Mistral推出3B/8B Ministral系列,高通联合Mistral将生成式模型塞进手机;OPPO发布系统级AI ColorOS 15,小模型在边缘端性能超越Llama 3,预示“云-边-端”混合部署成为新主流,降低延迟与成本。
OpenAI sCM将图像生成提速50倍,0.1秒出图;OmniGen统一图像生成与编辑,ElevenLabs Voice Design文字秒变个性化语音,多模态内容生产进入“实时”阶段,降低创作门槛,冲击设计、影视、配音行业。
Google DeepMind与DeepMind先后开源SynthID文本水印,帮助识别AI生成内容;人大研究指出噪声使RAG性能反降,MIT等提出神经元干预修复大模型逻辑缺陷,AI安全从技术、标准到法规进入快速落地期。
Zoom AI助手2.0自动整理会议要点,波兰电台启用AI主播替代记者,上海交大发布大模型Agent心理诊所可初诊抑郁,AI正快速渗透到办公、媒体、医疗等垂直场景,提升效率并重塑传统岗位。