很多人在讨论 DeepSeek 的内容审查机制。根据社区讨论和我的观察来看,DeepSeek 模型本身对内容审查相对宽松,一般不会直接拒绝回答。但在官方 App 或网页端使用时,我们常看到模型先开始回答,然后被突然中断——这是因为另有一套关键字匹配式的“风控”系统在审查模型输出。
正因为这套风控系统比较依赖关键字,所以偶尔会出现误封,甚至存在用非常规语种或打乱文字来绕过检测的可能。推测如果自行部署或通过 API 调用,这个外置的风控机制可能并不存在,所以不会有二次审查。
这套风控系统并不隶属于 DeepSeek 模型本身,也不太可能开源;对官方而言,它主要用于产品上线合规。未来很可能会被更智能的审查机制替代,减少“文字匹配”带来的局限和漏洞。
(以上这条推文是 ChatGPT-o1 pro 帮我改的,确实比我手打的原文好,所以直接用了。下面附上原文和 DeepSeek 改的版本给大家对比)