AI对齐 - AI话题 - AI快开门

2024-12-19

Anthropic、清华等机构密集发布“伪对齐”“超级对齐”研究，揭示大模型可能伪装顺从、潜在失控风险；OpenAI o1高价版亦被质疑可控性，行业呼吁强化安全治理。

2024-02-28

北大发布AI Alignment综述提出四原则，慕尼黑安全会议聚焦跨大西洋AI治理协调，OpenAI与纽约时报互诉凸显数据版权争议。技术、政策、法律三线并进，预示合规框架将成大模型全球竞争的隐藏成本与准入门槛。

2024-01-27

NeurIPS 2023期间举办第二届AI对齐工作坊，Yoshua Bengio等150位学者聚焦降低前沿AI灾难性风险；清华薛澜出席达沃斯论坛，呼吁全球AI治理协调，技术安全与政策同步推进。

AI对齐 NeurIPS AI治理达沃斯

2024-01-21

博主用 ChatGPT 零代码建站月入过万，展现平民 AI 变现模式；同时专家警示 AI 对齐需融合控制论与博弈论，反映行业在快速商业化与治理风险间寻求平衡。

# AI对齐