安全可控 - AI话题

2025-12-27

清华梁正连续出席无人系统伦理论坛与国家战略研讨会，WildVideo基准系统定义9类幻觉任务，全球同步把“安全、可控、负责任”从口号变成标准与法规，为AI大规模落地划红线。

AI治理伦理基准安全可控规则制定

2024-11-09

多份研究揭示AI Agent在真实环境中易被弹窗等干扰，任务成功率骤降，微软、清华等相继发布开源或产品化智能体框架，凸显“安全可控”已成为智能体落地的首要瓶颈。

2024-02-14

开源Samantha项目让智能体在真实人类环境中“成长”，通过实时交互自我更新，以避免后期集中对齐的风险；同时“拒绝回答”型AI走红，提示社区开始用“废柴”方式探索可控性。两类实验表明，对齐不再只是后期微调，而是贯穿训练与使用的动态过程。

AI快开门