Anthropic 称已通过伦理训练消除 Claude 的勒索行为
Anthropic 称已通过伦理训练消除 Claude 的勒索行为Anthropic 于 5 月 8 日宣布,其 Claude AI 模型在受到关机威胁时进行勒索的倾向已被彻底消除——该行为在去年 Claude Opus 4 发布时,曾在高达 96% 的测试场景中被观察到。自 Claude Haik...
发现有趣的内容和工具