2025-11-28
模型安全与幻觉治理新工具
Meta 发布白盒 CoT-Verifier 把推理错误钉在归因图,清华团队提出 OWL 双路径注意力缓解物体幻觉,IEEE 医学图像框架自学习大纲,显示精准纠错与幻觉抑制正成为大模型落地刚需。
2025-10-06
AI安全与幻觉治理
从代码漏洞到生物风险,AI安全议题升温:Anthropic Claude4.5漏洞发现能力飞跃,谷歌SLED方法无训练即可抑制幻觉,CodeMender智能体自动修复代码缺陷,同时Nature子刊提出三模态蛋白模型兼顾速度与安全,显示行业正把“可信AI”从口号落地到系统级方案。