和合作基于deepseek-r1-distill-qwen-7b微调了一个支持CoT的翻译模型，应该再调整参数训练几次之后就能给他大家用上。目标是在7B以下的参数规模，使用更短的思考时间，就能获得671B的效果。

发布时间: 2025-03-04 16:00:37

1分

数据加载中

关注推特

收听电报

2

1

0

和合作基于deepseek-r1-distill-qwen-7b微调了一个支持CoT的翻译模型，应该再调整参数训练几次之后就能给他大家用上。目标是在7B以下的参数规模，使用更短的思考时间，就能获得671B的效果。
时政
( twitter.com )

9天前由 Frad 提交

点击图片查看原图

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

1

2

1

1

这就是为什么 DeepSeek R1-Zero 其实在传统任务（如语言、助人性、无害性等）上表现不佳。
最终，他们需要使用一个基于 V3（甚至是 ChatGPT）生成的监督数据集结合多阶段强化学习（RL）来抵消这种效果。
因此，将 DeepSeek R1 称为完全无监督并不公平。
That's why DeepSeek R1-zero doesn't
时政
( twitter.com)

1个月前 • 勃勃OC • -- 点击 0 评论

2

2

1

1

有用户反映，询问DeepSeek属于哪个openai模型。开启深度思考R1模式后，DeepSeek回答自己是基于GPT-3.5的增强版模型即GPT3.5turbo
时政
( twitter.com)

1个月前 • 李老师不是你老师 • -- 点击 0 评论

3

2

1

1

AWS也支持DeepSeek R1了
IT技术
( twitter.com)

1个月前 • 宝玉 • -- 点击 0 评论

4

3

2

2

DeepSeek R1 System Prompt:
You are DeepSeek-R1, an AI assistant created exclusively by the Chinese Company DeepSeek. You'll provide helpful, harmless, and detailed responses to all user inquiries. For comprehensive details about models and products, please refer to the official
IT技术
( twitter.com)

1个月前 • 宝玉 • -- 点击 0 评论

5

2

1

1

所以，o3-mini的综合评分已超过DeepSeek-R1？
持续时间不到一周？
时政
( twitter.com)

1个月前 • 勃勃OC • -- 点击 0 评论

6

2

1

1

今天硅基流动的 API 总算是上线了，这是目前为数不多的稳定、高速、满血版的 DeepSeek R1 API。
但是 R1 很特别，如果不配置好的话，R1 的效果会大打折扣，甚至会直接跳过思考过程。
所以写篇教程跟大家分享心得，避免大家踩坑。
《DeepSeek R1 API 获取和使用指南》
IT技术
( mp.weixin.qq.com)

1个月前 • orange.ai • -- 点击 0 评论

7

2

1

1

NVIDIA 将拥有 6710 亿参数的 DeepSeek-R1 模型引入了位于上的 NVIDIA NIM 微服务：
- 使用单台 NVIDIA HGX H200 服务器即可实现每秒最多 3,872 个 Token 的推理吞吐量。
- 依托 NVIDIA Hopper 架构，DeepSeek-R1 利用 FP8 Transformer Engine 和 900 GB/s 的 NVLink
IT技术
( build.nvidia.com)

1个月前 • 宝玉 • -- 点击 • 下载视频 0 评论

00:01:03

8

2

1

1

Cursor 已经可以将 Deepseek v3 和 R1 加入了官方模型列表。
可以在设置-模型部分选择，R1 是完全体模型。
IT技术
( twitter.com)

1个月前 • 歸藏(guizang.ai) • -- 点击 0 评论

9

2

1

1

【李飞飞团队“50美元”复刻DeepSeek的R1真相：基于阿里云Qwen模型监督微调而成】财联社说李飞飞团队训练出s1人工智能推理模型，在数学和编码能力测试中与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。
我看了原始paper，核心信息如下：
【1】s1的基座模型为阿里通义千问Qwen
时政
( twitter.com)

1个月前 • Jeff Li • -- 点击 0 评论

0.09145 Second , Gzip Enable.本网所有言论均来自网络，不代表本网站立场。联系方式: admin@bad.news

©2012.11.21 bad.news All rights reserved. 社区自动运营第 -- 年零 -- 天
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.

关注推特