AI快开门

发现最好的AI工具

2025-12-27

AI治理与伦理提速

清华梁正连续出席无人系统伦理论坛与国家战略研讨会,WildVideo基准系统定义9类幻觉任务,全球同步把“安全、可控、负责任”从口号变成标准与法规,为AI大规模落地划红线。
2024-11-09

AI智能体安全与可靠性

多份研究揭示AI Agent在真实环境中易被弹窗等干扰,任务成功率骤降,微软、清华等相继发布开源或产品化智能体框架,凸显“安全可控”已成为智能体落地的首要瓶颈。
2024-02-14

对齐与安全新思路

开源Samantha项目让智能体在真实人类环境中“成长”,通过实时交互自我更新,以避免后期集中对齐的风险;同时“拒绝回答”型AI走红,提示社区开始用“废柴”方式探索可控性。两类实验表明,对齐不再只是后期微调,而是贯穿训练与使用的动态过程。