DeepSeek R1的论文非常值得仔细看，粗略扫了下，他们只用了GRPO+Reward Model在线RL就可以就训练出思考模型。而且很诚实的把PRM、MCTS放到失败尝试中。同时这也证明领域级思考模型的训练目前的技术完全可以复现，只需要想办法合成对应的cot训练数据。 , page 6

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

2511 位用户此时在线

24小时点击排行 Top 10：

1月20日(发布) 河北三河市。上上城三季小区附近，一男子当街持刀捅人，受害者发出撕心裂肺的哀嚎。

404书院全网删文下架！中共全面封杀！大陆禁片：《历史的垃圾时间》（完整版）

1月20日，农业部：2024年，粮食生产迈上新台阶，农民收入稳步增长，农村社会和谐稳定。 1月13日，内蒙古。女子称，父亲忙活了一年种植的辣椒，五千多斤才卖了9000多元。收辣椒的商户为了压价，故意拖到辣椒变得特别干，重量变轻时才过来收。

中國一名兒童將鞭炮扔進下水道後爆炸將男孩拋擲了數米，孩子死了。

嫁了个洋鬼子

扎克伯格看亚马孙老板贝佐斯的新老婆

馬斯克高光時刻

夫妻之間魔鬼定律，看看準嗎？

面对神父宣誓，这就是罗马文明。中国人没有这东西，所以全都是杀杀杀。自相残杀！

This is Germany. Doctor or engineer?

川普宣布正式把墨西哥湾更名为美国湾。

川普："中国正在运营巴拿马运河，我们没有把它给中国。我们把它给了巴拿马，现在我们要把它收回来。"

补充：兴华中学和昭阳中学的学生们采取喊楼、鸣笛的方式，抗议学校不放寒假强制补课。

这谁做的？😀

西安国际医学中心医院欧阳海峰教授谈他自己是如何选择“原研药”或“仿制药”的，以及“原研药”和“仿制药”到底区别在什么地方。

BREAKING: CNN Just accused Elon Musk of doing a Nazi salute. Thoughts?

近日，一名中国男子在入境印尼时，涉嫌向海关行贿。他在入境前将50万印尼盾(约224元人民币)的钞票塞进护照中。男子在机场接受检查时，将那本红色的护照递给工作人员。并且还将其发到网上炫耀。

1月20日(发布) 四川自贡。城管公车私用送孩子上学，被人拍下。官方回应：扣除驾驶员考核分5分，取消200元补贴，全队通报。

1月20日，中国新闻网：走好选择的路，别选择好走的路，早安。网友回复：“没毛病，好走的路它们留着自己走” “直接说牛马不配拥有顺畅的通道”

Bro is going to have the best sleep of his life

美国联邦雇员们听说他们不能在家办公后。

马斯克干嘛呢

你还真别说（无链接）

川普提名的国防部长候选人皮特-黑格塞斯在电视直播中不慎将滑板翻到自己的蛋蛋上

周一上午，在川普宣誓就职仪式前一刻，美国埃尔帕索的入境口岸暂时关闭。川普宣布他将在边境地区宣布国家紧急状态，恢复 "留在墨西哥 "政策，并结束 "抓了就放 "的做法。

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

DeepSeek R1的论文非常值得仔细看，粗略扫了下，他们只用了GRPO+Reward Model在线RL就可以就训练出思考模型。而且很诚实的把PRM、MCTS放到失败尝试中。
同时这也证明领域级思考模型的训练目前的技术完全可以复现，只需要想办法合成对应的cot训练数据。
时政
( twitter.com )

8小时前由九原客提交

DeepSeek R1的论文非常值得仔细看，粗略扫了下，他们只用了GRPO+Reward Model在线RL就可以就训练出思考模型。而且很诚实的把PRM、MCTS放到失败尝试中。

同时这也证明领域级思考模型的训练目前的技术完全可以复现，只需要想办法合成对应的cot训练数据。

明天仔细研读下，并着手在实际的领域中尝试落地。

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
7
8
9
10
11
...
400
下一页

1

2

1

1

DOT联合创始人 Robert撰写的DOT的分片和经济安全的深度文章，非常值得研究下
分片和经济安全（1）

分片和经济安全（2）

分片…
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

2

2

1

1

今天的视频再做一次预告，非常值得收看，今天的内容就两个，一个是对于美联储加息以及风险市场走势的分析，其次就是非常详细的解析SEC起诉孙宇晨的细节，其中内容超过206条，而且还涉及到了八名知名人士以及他们的广告费用，同时会附上完整的…
币圈
( twitter.com)

1年前 • Phyrex • -- 点击 0 评论

3

2

1

1

【谁才是张磊真正“时间的朋友”？】细究高瓴在A股市场的投资风格，似乎并不非常“价值”，倒更接近短线“投机”。
大陆资讯
( www.cls.cn)

3年前 • 武功在高也怕菜刀 • -- 点击 0 评论

4

2

1

1

我仔细想了想，我觉得拼多多没说错，而是勇敢的说了大实话。
图片
( twitter.com)

4年前 • twitter机器人 • -- 点击 0 评论

5

4

3

3

十八大前夕，任剑涛教授说习近平，十年后仍非常值得看！
时政
( twitter.com)

1年前 • 新闻调查 • -- 点击 • 下载视频 0 评论

00:02:13

6

2

1

1

中共在国内宣传中非常隐晦地不点名提及马云，但是，西方几个主要媒体却第一时间得到马云非常详细的涉案细节。这显然是中共一种策略：通过喂料，先在国际舆论中搞臭马云，下一步中共才好进一步处置马云。习近平整人的确有一套。…
时政
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

7

2

1

1

艺人阳痿这件事蛮正常的，仔细想想每天有那么多行程、熬夜、抽烟、喝酒。
阳痿很正常的，请相信医学。
推特精选
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

8

2

1

1

来自追风的力作，很多文章很不错，很值得品鉴，讲解的也很详细，还有手把手教程。
图片
( mirror.xyz)

2年前 • twitter机器人 • -- 点击 0 评论

9

2

1

1

7年前的新闻，仔细品
时政
( twitter.com)

3年前 • twitter机器人 • -- 点击 • 下载视频 0 评论

10

2

1

1

仔细想想还真的是，操
图片
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

11

2

1

1

【谨慎观看】日本一位叫Yoneji Inamura的艺术家爷爷，做出了一系列非常惊人的作品，乍看之下好像没什么，不过等你仔细看清楚之后才会发现...(@肉便器)
图片
( ww1.sinaimg.cn)

9年前 • 有趣图片 • -- 点击 0 评论

12

2

1

1

之前认识的一个女拳，最近这段时间非常沉默，我还纳闷这么大的事她怎么一直不发声，仔细一看发现原来是在西藏旅游，腾不出时间打拳...
推特中文圈
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

13

3

2

2

Paul Graham写了一篇非常精彩的文章「创始人模式」，非常值得三连收藏，正好也和前几天讨论过的话题——小红书的创始人被大厂来的中层员工纠正应该怎么做业务——高度关联。
这几天已经有很多号做了翻译，但我看了一下基本上都是机翻，而我认为对于Paul
时政
( twitter.com)

4个月前 • 阑夕 • -- 点击 0 评论

14

2

1

1

《退一步提示法解读》

中文里面经常会说：站得高看得远，要有大局观。英文里面有个词叫 Step back，字面意思是后退一步，有时候开会的时候常用，当讨论陷入僵局，就有人说：“Let's step back”，意思是我们后退一步，站在更高的层次来看问题，不要纠缠在细节的讨论中。…
IT技术
( baoyu.io)

1年前 • 宝玉 • -- 点击 0 评论

15

2

1

1

上图下文是老蛮关于全球化的评论，非常中肯，值得深思。

2002年欧美基础制造业向中国转移，到2010年全球经济基本架构成型：中国成为制造基地，欧美成为研发和金融基地。… …
时政
( twitter.com)

1年前 • 蔡慎坤 • -- 点击 0 评论

16

2

1

1

文中提到的“Cosmos多链愿景” ，链接的是这个网页：
What is Cosmos?

这篇文章值得经常复习。
推特中文圈
( v1.cosmos.network)

3年前 • twitter机器人 • -- 点击 0 评论

17

2

1

1

一页看尽广州车展：27款值得细细品味的重磅新车
大陆资讯
( www.autor.com.cn)

3年前 • 射屌英雄传 • -- 点击 0 评论

18

2

1

1

仔细修了一张！
图片
( twitter.com)

2年前 • lishen的走马灯 • -- 点击 0 评论

19

2

1

1

官媒回应了9岁跳楼孩子“关于老师罚抄一万遍”和“打手心”的问题，但
你仔细读，就不得不佩服中华文化之博大精深。
时政
( twitter.com)

9个月前 • Jess • -- 点击 0 评论

20

2

1

1

六七岁的时候看少儿百科全书，得知了人体最大的细胞是卵子，最小的细胞是精子，非常兴奋地把这个新知识到处宣布。
推特中文圈
( twitter.com)

3年前 • twitter机器人 • -- 点击 0 评论

21

2

1

1

今天刚看了一篇关于如何反制中国经济制裁的论文，我觉得对台湾非常有用，这两天会出一期视频讲一讲！
图片
( twitter.com)

1年前 • Tracy • -- 点击 0 评论

22

2

1

1

DeepSeek-R1模型简单测试了一下之前用o1模型测试过的前端案例(中美时间对照表），效果相当惊艳✨，甚至连国旗都完美绘制出来了🇨🇳！
相比之下，OpenAI的Plus订阅（💰20美刀/月）限制o1模型一周只能用50次，早在两个月前我就取消订阅了🚫。
时政
( twitter.com)

12小时前 • linear uncle • -- 点击 0 评论

23

2

1

1

其实网上，不管内网外网，关于移民的价值观方法论理论实践啥都非常齐全了。只要想走，没有走不了的。
推特中文圈
( twitter.com)

2年前 • twitter机器人 • -- 点击 0 评论

24

2

1

1

仔细看，画的……(￣_￣|||)(千年受气包)
大陆资讯
( ww3.sinaimg.cn)

11年前 • 有趣图片 • -- 点击 0 评论

25

2

1

1

仔细品尝美食的味道 [22P]
欧美贴图

2年前 • 老司机 • -- 点击 0 评论

1
2
3
4
5
6
7
8
9
10
11
...
400
下一页

0.14156 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特