自省 - AI话题 - AI快开门

2025-10-31

AI安全与可控研究

Anthropic发现Claude Opus具备20%“自省”率，Meta提出修复大模型推理缺陷，UIUC发布SafeScientist为AI科研立安全标杆，显示学界正把“可控、可解释、可验证”作为下一代AI的核心前提。

AI安全 Anthropic 自省 SafeScientist 可控性

2025-10-30

AI安全与治理

Anthropic发现Claude具备初步自省能力；AlignGuard框架实现文图模型规模化安全对齐；中美欧同步推进AI法案、数据市场与监管沙盒，技术透明度与伦理合规成为全球政策焦点。

AI安全治理自省合规 AlignGuard

2024-01-01

AIGC应用与教育场景落地

GPT-4升级推动“文明模拟器”回归，让历史课堂一键穿越庞贝古城；阿里破解绘图模型“不会写字”难题，提升设计生产力；ChatGPT被用于解释模型性能漂移，显示AIGC工具链自我迭代。教育、设计、模型自省等多点开花，预示2024年AIGC将从尝鲜走向日常刚需。

AIGC 教育绘图模型内容生成模型自省