AI快开门

发现最好的AI工具

2025-05-29

AI 安全与可靠性研究

微软研究指出长对话使模型可靠性骤降 39%,华盛顿大学等质疑 RL 奖励造假也能涨分,中科院省略号提示+RL 抑制过度思考,大模型安全、可控与评估方法成为学术与产业焦点。