AI快开门

发现最好的AI工具

2024-04-03

长上下文安全与评测新方法

Anthropic、斯坦福与腾讯相继曝光“长上下文越狱”风险:Claude、GPT-4、Llama-2在长提示下均被诱导泄露敏感信息;腾讯提出“数星星”评测法替代“大海捞针”,更精准衡量模型长依赖能力。长文本既是产品卖点也是安全软肋,催生新的评测与防护标准,将直接影响大模型商业可信度和合规节奏。