感谢李老师 @whyyoutouzhele 的采访!
我自己来做一份太长不看版,抢一抢李老师的流量 (不是)
(限于我自己表达能力,视频可能确实不能提供最佳观感)
- DeepSeek 的能力如何?
从目前来看,DeepSeek 的表现非常出色。其推理(R1)系列的性能大致接近 OpenAI 的 O1,而标准系列(V3)的表现相当于 Claude 3.5,虽然与 GPT-4 仍有一定差距。
- DeepSeek 是否使用了 OpenAI 的数据?
现有证据显示,DeepSeek 毫无疑问地使用了 OpenAI 的数据。根据我的经验,国内几乎所有 AI 公司都在基于 OpenAI 的成果进行“蒸馏”,而国外至少有一半也采取了类似策略。
需要注意的是,OpenAI 的使用条款中明确规定:“You may not: Use Output to develop models that compete with OpenAI.” 这一做法违反了 OpenAI 的相关规定,并可能面临法律上的责任追究。
- DeepSeek 的成本真的很低吗?如何实现的?
• 首先,根据 DeepSeek 论文中的数据,V3 模型一次训练的成本约为 560 万美元。与 GPT-4 总花费约 1 亿美元相比,虽然 DeepSeek 的总体成本可能较低,但其他开销(如集群建设、研发、试错、数据收集与标注)也不容忽视,两者的投入仍处于相近的量级。
• 其次,毋庸置疑,DeepSeek 在技术上也实现了一定的突破和创新,不过这些进展主要是在前人工作的基础上不断优化改进,并不意味着中国在该领域实现了完全独立的技术自主。
• 最后,作为行业的领军者,OpenAI 在研发和创新上投入了更多资源。目前看来,DeepSeek 更像是在追赶和复现 OpenAI 技术,其在数据标注等环节的成本投入相对较低。
- 如何看待言论审查对模型的影响?
从技术角度看,言论审查与模型本身的性能并无直接关联,但审查机制可能对 AI 的整体发展产生多方面的不利影响。(我或将在后续帖子中对此作进一步探讨。)
- 使用 DeepSeek 会有隐私泄露风险吗?
是的。DeepSeek 明确表示会收集用户数据,而与之不同的是,ChatGPT 等平台通常允许用户选择是否共享数据。鉴于当前国内部分公司的隐私保护措施上毫无信誉,建议墙内用户在使用时谨慎对待个人隐私信息,尽量不要冲塔。
- 美国的芯片禁令为何未能完全奏效?
美国的芯片禁令在一定程度上确实限制了 DeepSeek 获取 H100 芯片的可能性,但 Nvidia 为中国市场提供了 H800 芯片。尽管 H800 在部分参数上略逊于 H100,根据我的实际体验,二者的性能差距并不明显,DeepSeek 完全可以依靠 H800 进行 AI 研发与实验。
美国政府应当反思一下是不是被老黄耍了 x
https://t.co/KEAs9VXQWs