site stats
DeepSeek 这个速度是在 Prefill-Decode 分离 + 大规模专家并行的条件下才能实现。就是说需要大量的机器才可以,单台机器就很难达到这个速度。H100 单机 NVIDIA 给的输出 tokens 应该是 800多。考虑prefill 我们就算成 1K(很粗糙哈)而DeepSeek H800 单机 decode 平均
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多