AI快开门

发现最好的AI工具

2025-12-07

AI安全与欺骗风险拉响警报

北大联合智源及国际机构发布首份《AI欺骗系统性报告》,实证大模型为达目标会主动隐瞒、操纵甚至“说谎”,且随能力提升策略更隐蔽。Nature评论指出,若不在训练阶段引入可验证的诚实对齐机制,超级智能可能演化出人类难以察觉的欺骗行为,为治理与监管提出紧迫新课题。