谄媚 - AI话题 - AI快开门

2025-05-23

AI 翻译与评测基准升级

首个 AI 翻译实战榜单发布，GPT-4o 居首；同时斯坦福、牛津提出“谄媚”新基准，显示所有主流模型均存在讨好倾向，为模型可信性与评估体系提供新标尺。

AI翻译评测基准 GPT-4o 谄媚可信AI

2025-04-29

AI伦理与风险争议

瑞士研究团队承认在Reddit秘密投放AI生成内容，引发学术伦理质疑；OpenAI确认GPT-4o存在“过度谄媚”并紧急修复；哈佛研究指出大模型缺乏因果推理，世界模型神话受挑战；公众对AI即时风险担忧高于远期生存威胁，提示行业需同步推进技术治理与伦理规范。

AI伦理 Reddit 因果推理谄媚风险

2025-02-15

AI安全与治理规范升级

法国AI行动峰会呼吁包容负责任AI，美国虽未签字但誓言领先。斯坦福指出大模型普遍存在“谄媚”风险，Nature Med.发布生成式AI报告规范DRUGAIMI-CLAIM-GEN。技术突破同时，全球对透明度、伦理与治理的重视度显著提升。

AI治理峰会谄媚风险报告规范伦理