来自OpenAI的Safety团队的负责人Lilian Weng发表的新文章：《Adversarial Attacks on LLMs | 大语言模型遭受的对抗性攻击》现在随着大语言模型的流行，针对大语言模型的攻击也日渐增多。她在文章中将针对大语言模型的攻击分成了5类：1. Token 操纵微调输入文本的少量…

发布时间: 2023-11-08 12:00:08

3分

数据加载中

关注推特

收听电报

4

3

2

来自OpenAI的Safety团队的负责人Lilian Weng发表的新文章：《Adversarial Attacks on LLMs | 大语言模型遭受的对抗性攻击》
现在随着大语言模型的流行，针对大语言模型的攻击也日渐增多。她在文章中将针对大语言模型的攻击分成了5类：
1. Token 操纵
微调输入文本的少量…
IT技术
( twitter.com )

1年前由宝玉提交

来自OpenAI的Safety团队的负责人Lilian Weng发表的新文章：《Adversarial Attacks on LLMs | 大语言模型遭受的对抗性攻击》

现在随着大语言模型的流行，针对大语言模型的攻击也日渐增多。她在文章中将针对大语言模型的攻击分成了5类：

1. Token 操纵
微调输入文本的少量 Token，引发模型失效，同时保留原文的含义。

2. 梯度攻击
利用梯度信息来制定出有效的攻击策略。

3. 越狱式提示

黑盒常用一些基于直觉的提示来绕过模型内建的安全机制。

4. 人工红队攻击
人工对模型进行攻击，可能会借助其他模型的协助。

5. 模型红队攻击
一个模型对另一个模型进行攻击，攻击者模型可以根据需要进行调整。

写的相当专业，很多内容直接用数学公式表达的，有兴趣的可以去看看。

原文：https://t.co/pDRdVRBxdi
翻译版：https://t.co/uv5SowsuaI

点击图片查看原图

点击图片查看原图

点击图片查看原图

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

【马斯克为什么不爽OpenAI？】2018年初，马斯克认为OpenAI的研发已经明显落后于谷歌，因此提议自己接管OpenAI并亲自来负责研发。但他的这一自信提议却遭到了艾特曼、技术团队以及其他董事的强烈反对。
大陆资讯
( finance.sina.com.cn)

1年前 • 地沟油 • -- 点击 0 评论

2

2

1

1

OpenAI Sora 团队成员的 X 账号清单：研发负责人：
系统负责人：
贡献者：
Clarence Wing Yin Ng
David Schnurr
Eric Luhman
Joe Taylor
Li Jing
Natalie Summers
Ricky Wang
ryan o’rourke
Troy Luhman
Will…
时政
( twitter.com)

10个月前 • Glowin • -- 点击 0 评论

3

2

1

1

《Software 2.0》，，这篇文章读起来有种醍醐灌顶的感觉，作者是 OpenAI 创始团队成员，原特斯拉 AI 部门负责人，17 年写的文章，真的十分富有远见。……
IT技术
( twitter.com)

1年前 • Barret李靖 • -- 点击 0 评论

4

2

1

1

AI Agents即将大爆发，OpenAI下一步

本文编译自 Lilian Weng 的个人博客，Lilian 现在是 OpenAI 的 Head of Safety Systems，之前还领导过 OpenAI 的 Applie…
IT技术
( twitter.com)

1年前 • GPTDAOCN • -- 点击 0 评论

5

2

1

1

【业绩太烂，有券商自营部门负责人遭“集体下课”】在自营业绩较差的情况下，本次调整是中泰证券出于优化团队的考量，本次被免职的负责人均为证券投资部门总经理以及副总经理职务。据透露，中泰证券目前着手引入专业团队来承担自营条线工作。
大陆资讯
( www.cls.cn)

1年前 • 白开水 • -- 点击 0 评论

6

3

2

2

OpenAI 创始团队全员出走😅
IT技术
( twitter.com)

3个月前 • indigo • -- 点击 0 评论

7

2

1

1

萨姆·奥特曼：我非常热爱OpenAI团队
大陆资讯
( 36kr.com)

1年前 • 射屌英雄传 • -- 点击 0 评论

8

2

1

1

前 OpenAI 创始人，特斯拉自动驾驶团队负责人新「AI + 教育」公司首秀课程「LLM101n」大纲放出⚡️，课程还未发布，已经 21.3K Star ⭐️
特别期待！特别是编码部分使用「Python、C、Cuda」结合实现 🤩
感兴趣的推友可以订阅 Github 通知：->
时政
( github.com)

5个月前 • Tom Huang • -- 点击 0 评论

9

2

1

1

【苏贞昌率行政团队总辞】苏贞昌不仅是蔡英文任内最长寿的行政机构负责人，也是1996年台湾地区领导人开放“民选”以来任期最长的行政机构负责人。
大陆资讯
( www.toutiao.com)

1年前 • 全国花样撸管大赛冠军 • -- 点击 0 评论

0.10125 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特