site stats
来自OpenAI的Safety团队的负责人Lilian Weng发表的新文章:《Adversarial Attacks on LLMs | 大语言模型遭受的对抗性攻击》现在随着大语言模型的流行,针对大语言模型的攻击也日渐增多。她在文章中将针对大语言模型的攻击分成了5类:1. Token 操纵微调输入文本的少量…
发布时间:
3
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多