来自 DeepMind Research Scientist 的点评： DeepSeek-R1论文发布当天我就研读了全文，个人认为GRPO并非其成功关键。以下才是真正重要的要素（按重要性排序）： 1. 迭代式强化学习与监督微调的协同 2. 混合奖励机制——针对确定性任务融合规则型RM与神经网络的RM 3.

分享一个链接

发表一篇文章

任何有趣的，图片，热点新闻，视频，文字...

4499 位用户此时在线

24小时点击排行 Top 10：

1月24日，四川岳池县。岳池县农业局正在开“2024年度工作总结及2025年工作打算”会议时，突然被讨薪的农民工打断。农民工表示：“每次来你们都在开会，2020的钱都没要到“

央视春晚军人在舞台上表演节目，引发网民嘲讽：“外柔内刚” “爱新觉罗永麻” “养兵千日，再养千日”

春晚有个节目叫《秧BOT》，张艺谋弄了一帮机器人跳秧歌，非常符合国师一惯的老13中审美，给机器人都穿上了大花棉坎肩，不过都是光着屁股的。表演结束后，这些机器人被同台演员推着下台，这机器人可真中国，还是先学会直立行走吧！

近十年的春晚结尾，事情从2016年开始起了变化......

15K-20K 招聘远程高级前端开发

1月28日，一老太太骑三轮车在一处路口被另一位骑三轮的大爷撞到了河里，而大爷居然当什么事都没发生一样，头也不回的离开了。有网友反映事发地在徐州市岚山镇高集村。

戰無不勝

死去的鲸鱼最后一次放出气体，将其腐烂的所有内脏排入大海。

1月26日，一女子称遭到领导强奸，报警后，警方没有及时展开调查，而是放走对方。又拖了四个月后警方让女子去常州当地派出所签署一份对方没有犯罪的认同书，女子拒绝并去当地检察院复议。派出所得知后诱骗女子回来谈话。女子回来后被警方限制人身自由长达八小时，期间遭到警方暴力执法导致手部受伤。

1月29日(发布) 宁夏中卫市。一名警察称：请艾特出你身边最应该进这个房间(询问室)的人。网友回复：“省委书记、省长、自治区书记.....乡委书记”“厦门市市长” “砀山县县委书记”

纽约。

美女爆料：自己在路上行走时差点被拐卖！人贩子开着面包车，一大妈上来搭话，后面两男子准备实施绑架...

这视频不比春晚小品有意思？

1月30日(发布) 黑龙江。一老奶奶摔倒无法起身，不断恳求路人扶她起来，但路人表示害怕不敢扶：“你让我过个好年吧大娘”

朝鲜现在之所以穷，是因为遭受国际制裁吗？

1月28日，云南。一男子发视频称，他卖了一块手表，结果被告知收到的钱是涉诈资金，导致银行卡、微信支付宝被冻结无法使用，多次给警察打电话发信息反映，但都没有回复。男子称他为了自证清白想让买家来警局做笔录，但警方表示，只要能证明自己只是单纯卖表的话，无需让买家过来做笔录。

台湾数位发展部部长唐凤出招破解，让DeepSeek回答六四天安门事件的话题。唐凤28日晚间在Threads上表示「在本机离线使用的

我勒个去

绝命糖师。四川最大的毒枭罗金成，每月贩毒160公斤。警察以为是立一等功的大案，结果抓到以后才发现…… 他在毒品圈子里兜售冰糖、明矾（都是毒品的暗语），但吸毒者付钱后，收到的是真的冰糖、明矾。一克毒品都没有。他吃准了这群人被诈骗不敢报警。

美女爆料：自己在路上行走时差点被拐卖！人贩子开着面包车，一大妈上来搭话，后面两男子准备实施绑架...

一架美国客机星期三(1月29日)晚间在接近华盛顿里根国家机场时，与一架美国陆军的黑鹰直升机发生空中相撞，飞机坠毁在波托马克河，大量救难人员投入搜救行动。《哥伦比亚广播公司》(CBS)报道，截至美东时间晚上11点30分，至少已找到18具尸体。美国航空(American Airlines)发布声明，美鹰航空(American

遥遥落后

这视频墙内全网下架了吧？最后的面纱都撕下来了，彻底不要脸了。

#沉没意志 #游戏纪录片 #独立游戏已上线

前参谋长联席会议主席马克·米利将军： “我们不会向国王、王后、暴君或独裁者宣誓，我们也不会向想要成为独裁者的人宣誓。” （2023 年 9 月）

本站自动实时分享网络热点
24小时实时更新
所有言论不代表本站态度
欢迎对信息踊跃评论评分
评分越高，信息越新，排列越靠前

2

1

0

来自 DeepMind Research Scientist 的点评：
DeepSeek-R1论文发布当天我就研读了全文，个人认为GRPO并非其成功关键。以下才是真正重要的要素（按重要性排序）：
1. 迭代式强化学习与监督微调的协同
2. 混合奖励机制——针对确定性任务融合规则型RM与神经网络的RM
3.
IT技术
( twitter.com )

前天由宝玉提交

来自 DeepMind Research Scientist 的点评：

DeepSeek-R1论文发布当天我就研读了全文，个人认为GRPO并非其成功关键。以下才是真正重要的要素（按重要性排序）：

迭代式强化学习与监督微调的协同
混合奖励机制——针对确定性任务融合规则型RM与神经网络的RM
高质量合成数据，仅在必要时进行人工后处理
采用64次推理采样的评估体系

这些突破为计算资源有限的博士生们开辟了极具潜力的研究方向。后续我可能会在社交媒体分享基于DeepSeek-R1启发的若干研究课题。

除技术维度外，更值得称道的是：
1/ 开放精神：缺乏开放性的研究难以引发追随
2/ 卓越的学术叙事：从概念验证到展现完整潜力的复杂过程，论文构建了极具说服力的研究叙事。方法论阐述清晰易循，堪称典范。

结语：英雄之间惺惺相惜，而失败者之间则怨怼相生。让我们保持良性竞争，心怀感恩！

1周内 1个月内 1年内全部时间

1
2
3
4
5
6
...
400
下一页

1

6

5

5

Google正在失去DeepMind？
大陆资讯
( mp.weixin.qq.com)

6年前 • 微信公众号 • -- 点击 0 评论

2

2

1

1

人工智能“进化”：DeepMind已不需要人类来帮助学习了
大陆资讯
( wallstreetcn.com)

8年前 • 孤独寂寞冷 • -- 点击 0 评论

3

2

1

1

【谷歌大脑与DeepMind官宣合体】新的Google DeepMind部门将由DeepMind的联合创始人Demis Hassabis领导，谷歌大脑的负责人Jeff Dean将转任谷歌首席科学家一职。
大陆资讯
( zhidx.com)

1年前 • 羡慕忌妒恨 • -- 点击 0 评论

4

2

1

1

NIAID scrubbed the definition of gain-of-function research overnight. The change was made when grant reports made it unambiguous that Fauci funded research to make coronaviruses more dangerous in Wuhan, including research that increased the viral load by 10,000 times.…
时政
( twitter.com)

1年前 • Emily Kopp • -- 点击 0 评论

5

2

1

1

Harvard’s AI Research Experience free course book by covers the essentials and tips on doing research:
- VSCode, Git, Conda
- PyTorch, W&B
- AWS, colab
- LLMs and VLMs
- reading AI papers
- research progress and organization
this is a must read!
时政
( twitter.com)

1个月前 • ℏεsam • -- 点击 0 评论

6

6

5

5

【一年烧掉40亿元后，DeepMind联合创始人被停职】苏莱曼此前曾领导DeepMind的健康工作，但DeepMind在英国健康领域的工作受到了严厉批评。去年年底，谷歌宣布Streams及其团队将被加入Google Health团队中，本质上是解散DeepMind Health group。
大陆资讯
( mp.weixin.qq.com)

5年前 • 微信公众号 • -- 点击 0 评论

7

3

2

2

来了来了它来了，刷算法题的人工智能它来了，deepmind 一举歼灭初级算法程序员
大陆资讯
( deepmind.com)

3年前 • 粉身碎奶掌 • -- 点击 0 评论

8

2

1

1

How to write a research proposal
时政
( twitter.com)

10个月前 • Prof Lennart Nacke, PhD • -- 点击 0 评论

9

6

5

5

【DeepMind星际争霸2 AI首秀即将上演，旭东老仙奶一口？】近两年来，DeepMind 的研究进度时有透露，但距离「人机对战」似乎还有很长一段距离。刚刚，DeepMind 宣布即将公布一个有关星际争霸 2 的「最新进展」，而且会以线上直播的形式展现在世人面前。
大陆资讯
( www.jiqizhixin.com)

6年前 • 全球尸报 • -- 点击 0 评论

10

2

1

1

【谷歌大脑和Deepmind联手，搁置前嫌合攻OpenAI】Google Brain AI和DeepMind之前几乎很少相互协作或共享计算机代码。但是现在，由于双方都想开发自己的机器学习模型来与OpenAI竞争，并却需要更大的计算能力来支撑，所以联手是他们的最佳选择。
大陆资讯
( zhidx.com)

1年前 • 罗密欧煮你爷 • -- 点击 0 评论

11

2

1

1

发现38万种新材料、17天自主合成41种新化合物，DeepMind一日两篇论文登上Nature
大陆资讯
( www.jiqizhixin.com)

1年前 • 全球尸报 • -- 点击 0 评论

12

2

1

1

Meowton Cat, important research on the tipping point. 😂
有趣
( twitter.com)

1个月前 • Figen • -- 点击 • 下载视频 0 评论

00:00:39

13

2

1

1

DeepMind最近做了个新软件它能读懂唇语
大陆资讯
( tech.qq.com)

8年前 • 小唧唧 • -- 点击 0 评论

14

2

1

1

Wolfpack Research看空爱奇艺，称爱奇艺夸大了用户数量。与此同时，浑水也表示配合Wolfpack Research做空爱奇艺。爱奇艺短线跳水，目前下跌10%。Wolfpack Research上一次做空的是趣头条。
大陆资讯
( vip.jianshiapp.com)

4年前 • 舔你妹 • -- 点击 0 评论

15

2

1

1

经济学人：揭秘谷歌两年前缘何钟情DeepMind
大陆资讯
( tech.qq.com)

8年前 • 七仙女坐台 • -- 点击 0 评论

16

2

1

1

颠覆围棋后，DeepMind还想进军医疗、游戏领域
大陆资讯
( tech.qq.com)

8年前 • 黄牛票 • -- 点击 0 评论

17

2

1

1

谷歌子公司DeepMind收集医疗记录被判违法
大陆资讯
( tech.qq.com)

7年前 • 新白娘子玩传奇 • -- 点击 0 评论

18

2

1

1

【谷歌4亿美元收购人工智能公司DeepMind】谷歌CEO拉里•佩奇(Larry Page)亲自主持了这笔收购
大陆资讯
( tech.sina.com.cn)

11年前 • 群阴荟萃 • -- 点击 0 评论

19

2

1

1

洛克希德-马丁公司的年度报告中没有提到“中国”一词，但FactSet Research估计，该公司收入中有约2%来自中国市场。
大陆资讯
( on.wsj.com)

4年前 • 华尔街日报中文网 • -- 点击 0 评论

20

2

1

1

「它将改变一切」，DeepMind AI解决生物学50年来重大挑战，破解蛋白质分子折叠问题
大陆资讯
( www.jiqizhixin.com)

4年前 • 顶你个肺 • -- 点击 0 评论

21

2

1

1

DeepMind牵手暴雪：要让人工智能征服星际争霸
大陆资讯
( www.jiqizhixin.com)

8年前 • 全国花样撸管大赛冠军 • -- 点击 0 评论

22

6

5

5

《经济学人》万字长文：DeepMind和谷歌的AI拉锯战
大陆资讯
( www.jiqizhixin.com)

5年前 • 你的溢达 • -- 点击 0 评论

23

2

1

1

DeepMind将通过机器学习，提高乳腺癌的检测几率
大陆资讯
( www.qdaily.com)

7年前 • 好奇心研究所 • -- 点击 0 评论

24

2

1

1

为机器赋予记忆：DeepMind提出弹性权重巩固算法
大陆资讯
( www.jiqizhixin.com)

7年前 • 观摩团 • -- 点击 0 评论

1
2
3
4
5
6
...
400
下一页

0.12964 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特