刚才Space讨论到美国什么时候“能迎头赶上”的问题，我做两个个人判断吧1）DeepSeek V3这个模型应该没有公司有兴趣去复现，因为他是在算力限制下的结果，fp8量化一定会损失精度；而DeepSeek V3 本身其实和其他同规模的大语言模型差不多。

发布时间: 2025-01-27 21:30:27

1分

数据加载中

刚才Space讨论到美国什么时候“能迎头赶上”的问题，我做两个个人判断吧
1）DeepSeek V3这个模型应该没有公司有兴趣去复现，因为他是在算力限制下的结果，fp8量化一定会损失精度；而DeepSeek V3 本身其实和其他同规模的大语言模型差不多。
时政
( twitter.com )

刚才Space讨论到美国什么时候“能迎头赶上”的问题，我做两个个人判断吧

1）DeepSeek V3这个模型应该没有公司有兴趣去复现，因为他是在算力限制下的结果，fp8量化一定会损失精度；而DeepSeek V3 本身其实和其他同规模的大语言模型差不多。

如果没有算力限制，也不缺钱，大厂没必要重走一遍自己走过的路：比如Llama

2）但是R1这个基于RL的训练思路会有人复现。只需要找任何一个Base Model，加上一些无监督的数学/代码数据，就可以借助GRPO实现推理能力的提升。

我相信在1-2周内，Meta、Google、Amazon甚至Nvidia等公司内部就会有结果。

如果2周之内，美国公司都拿不出一个像样的和R1同级别的结果，那说明美国完了

我即日起直接回国

谢谢大家。

Markdown支持

评论加载中...

您可能感兴趣的：更多

欢迎参加美国民主历史讲座，每周四晚上9点在Twitter Space和Google Meeting 同時進行。美国2024大选之际，关注讨论美国民主的墙内外都可以参与的民主政治讨论，希望网友能因此深入了解美国民主的来龙去脉，也启示对于中国民主的期待。
时政
( twitter.com)

7个月前 • 周锋锁 Fengsuo Zhou • -- 点击 0 评论

时政

五天前，金融时报就警告：日元carry trade会让美国科技股崩盘
今天
他们的警告得到验证
等什么时候日元carry trade破产清算了
什么时候，
美股才会正式迎来反弹
可能就在周末了
时政
( twitter.com)

时政

关注美国大选是目前墙内外网友都可以参与的民主政治讨论，欢迎推友收听参与美国民主政治的开放讨论，在Twitter Space.
#美国民主历史开放式讲座
时政
( twitter.com)

时政

街头采访：中国什么时候超越美国
时政
( twitter.com)

时政

街头采访：中国什么时候超越美国。
时政
( twitter.com)

时政

时政

特朗普到底什么时候才能上任？等不及了⏰
时政
( twitter.com)

时政

为什么中美两国舆论, 同时把矛头对准了“文科生”?
大陆资讯
( mp.weixin.qq.com)

大陆资讯

美国加利福尼亚州的最低工资是每小时16美元。无论你干什么工作，工资都不能低于这个标准。刚才有人说中国也有小时最低工资——这我是第一次听说。中国小时最低工资是多少？
时政
( twitter.com)

时政

它的头顶什么时候也能是个“亡”啊🤔
时政
( twitter.com)

时政

时政

五天前，金融时报就警告：日元carry trade会让美国科技股崩盘 今天 他们的警告得到验证 等什么时候日元carry trade破产清算了 什么时候， 美股才会正式迎来反弹 可能就在周末了 时政 ( twitter.com)

时政

关注美国大选是目前墙内外网友都可以参与的民主政治讨论，欢迎推友收听参与美国民主政治的开放讨论，在Twitter Space. #美国民主历史开放式讲座 时政 ( twitter.com)

时政

街头采访：中国什么时候超越美国 时政 ( twitter.com)

时政

街头采访：中国什么时候超越美国。 时政 ( twitter.com)

时政

时政

特朗普到底什么时候才能上任？ 等不及了⏰ 时政 ( twitter.com)

时政

为什么中美两国舆论, 同时把矛头对准了“文科生”? 大陆资讯 ( mp.weixin.qq.com)