site stats
晚上有机会坐下来细看DS公布的数据,再次被深深震惊了。DeepSeek在线服务的运行数据英文版本见公布的Github链接。所有DeepSeek-V3/R1推理服务均在H800 GPU上运行,且推理精度与训练一致:🔹 矩阵乘法和调度传输采用 FP8 格式(与训练对齐)。🔹
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多