site stats
速报,寄了嗷,NVIDIA Project Digits 内存带宽只有 275GB/s. 意味着跑 70B-int4 速度只能到 6.8 token/s. 如果跑 DeepSeek-R1-Distill-Qwen-32B-Q5_K_M, 大概是 12.5 token/s. 就是个更便宜的 MacMini M4 Pro。如果信了老黄的说法,用这个跑200B的大模型,一分钟也就能吐出来2句话。
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多