别人犯错是因为没读paper，这位是能把paper读错这是说蒸馏的目标小模型是qwen和llama，意思是把R1蒸馏到他们上面去，而不是从他们身上蒸馏下来DeepSeek V3 用到的改进过的MoE，DeepSeek独创的MLA，n=1的MTP，这些llama都没有啊。当然他们都是transformer架构了。

发布时间: 2025-01-27 14:10:15

1分

数据加载中

关注推特

收听电报

2

1

0

别人犯错是因为没读paper，这位是能把paper读错
这是说蒸馏的目标小模型是qwen和llama，意思是把R1蒸馏到他们上面去，而不是从他们身上蒸馏下来
DeepSeek V3 用到的改进过的MoE，DeepSeek独创的MLA，n=1的MTP，这些llama都没有啊。当然他们都是transformer架构了。
时政
( twitter.com )

1个月前由勃勃OC 提交

别人犯错是因为没读paper，这位是能把paper读错

这是说蒸馏的目标小模型是qwen和llama，意思是把R1蒸馏到他们上面去，而不是从他们身上蒸馏下来

DeepSeek V3 用到的改进过的MoE，DeepSeek独创的MLA，n=1的MTP，这些llama都没有啊。当然他们都是transformer架构了。

王志安旗下博士宇宙的水平，令人震惊

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

把别人名字都搞错真是很没礼貌
时政
( twitter.com)

7个月前 • 说真话的徐某人 • -- 点击 0 评论

2

2

1

1

陶哲轩说，对他而言，OpenAI的o1已经有UCLA里中等研究生的水平了。
我自己用ChatGPT也有同感。以前一些Paper，我会让研究生去读。
他们读完给我汇报，会省很多时间。其实，很多教授都是这么干的。
但是现在，把Paper扔给ChatGPT，让他给我讲。
时政
( twitter.com)

4个月前 • Pangyu 胖鱼 🐠 • -- 点击 0 评论

3

2

1

1

很多人的反清复明，原来还是为了钱和女人。为了钱和女人，其实本身没有什么错，但是手段如此低劣，把别人都当成蠢人，这就是不仅是愚蠢，而且是邪恶了。
时政
( twitter.com)

3个月前 • 中日政经评论 • -- 点击 0 评论

4

2

1

1

是这么理解的，维稳的逻辑不是正义对错与否，逻辑是大家都别闹腾。
坏人因为已经把坏事儿干完了，或者人已经被控制了，又或者坏事本身影响没多大，那么在政府眼里坏人就成了听话的好宝宝，但是好人可能要维权，可能要把事情闹大，所以这时候好人在政府眼里就成了不安定因素，需要加以控制。
时政
( twitter.com)

1年前 • Lee1ng • -- 点击 0 评论

5

6

5

5

有没有可能是因为 AI 生成的图所以拼错了？
IT技术
( twitter.com)

6个月前 • 宝玉 • -- 点击 0 评论

6

2

1

1

说实话，我没想到这位会在推特被一边倒骂，因为这不就是你们“不认为手段有什么错”的哈马斯行为嘛……
时政
( twitter.com)

1年前 • 星川蘭💙💛Layla ver.🌻📄 • -- 点击 0 评论

7

2

1

1

【斌椿：标点符号引入中国第一人】
斌椿读了一辈子圣贤书，知道古书阅读难度，很大程度上是因为断句，即句读上的问题，大家都是靠自己揣摩古人的用意，极易发生误解。他觉得英国人这个发明很好，能帮助阅读文章，能统一阅读标准。回国后把这一重大发现禀报朝廷，因此成了把标点符号引入中国的第一人。
时政
( twitter.com)

10个月前 • 章立凡 ©️Zhang Lifan💎 • -- 点击 0 评论

8

2

1

1

读书有罪？他们因为读书而失去官职，这在欧美是不可能的。
时政
( twitter.com)

5个月前 • Petrichor • -- 点击 0 评论

9

2

1

1

IP涨是因为一帮人把PI搞错了搞成IP买错才涨得？要笑死我吗？
btc
( twitter.com)

1个月前 • 很大很大的橙子 • -- 点击 0 评论

0.07537 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特