site stats
刚才Space讨论到美国什么时候“能迎头赶上”的问题,我做两个个人判断吧 1)DeepSeek V3这个模型应该没有公司有兴趣去复现,因为他是在算力限制下的结果,fp8量化一定会损失精度;而DeepSeek V3 本身其实和其他同规模的大语言模型差不多。
sign_in_with_google sign_in_with_google

4973 位用户此时在线

24小时点击排行 Top 10:
  1. 本站自动实时分享网络热点
  2. 24小时实时更新
  3. 所有言论不代表本站态度
  4. 欢迎对信息踊跃评论评分
  5. 评分越高,信息越新,排列越靠前