Kimi和DeepSeek的新模型这几天内同时发布，又是一波让人看不懂的突飞猛进，硅谷的反应也很有意思，已经不再是惊讶「他们是怎么办到的」，而是变成了「他们是怎么能这么快的」，就快走完了质疑、理解、成为的三段论。

发布时间: 2025-01-23 12:40:27

1分

数据加载中

Kimi和DeepSeek的新模型这几天内同时发布，又是一波让人看不懂的突飞猛进，硅谷的反应也很有意思，已经不再是惊讶「他们是怎么办到的」，而是变成了「他们是怎么能这么快的」，就快走完了质疑、理解、成为的三段论。
时政
( twitter.com )

Kimi和DeepSeek的新模型这几天内同时发布，又是一波让人看不懂的突飞猛进，硅谷的反应也很有意思，已经不再是惊讶「他们是怎么办到的」，而是变成了「他们是怎么能这么快的」，就快走完了质疑、理解、成为的三段论。

先说背景。大模型在运作上可用粗略分为训练和推理两大部分，在去年9月之前，训练的质量一直被视为重中之重，也就是通过所谓的算力堆叠，搭建万卡集群甚至十万卡集群来让大模型充分学习人类语料，去解决智能的进化。

为什么去年9月是个关键的转折点呢？因为OpenAI发布了GPT-o1，以思维链（Chain-of-Thought）的方式大幅提高了模型能力。

在那之前，行业里其实都在等GPT-5，以为一年以来传得沸沸扬扬的Q*就是GPT-5，对o1这条路线的准备严重不足，但这也不是说o1不能打，它的强大是在另一个层面，如果说训练能让AI变得更聪明，那么推理就会让AI变得更有用。

从o1到o3，OpenAI的方向都很明确，就是变着法儿奔向AGI，一招不行就换另一招，永远都有对策，大家平时对于OpenAI的调侃和批评很多，但那都是建立在高预期的前提下，真不要以为OpenAI没后劲了，事实上每次都还是它在推动最前沿的技术创新，踩出一条小径后别人才敢放心大胆的跟上去。

AI大厂们一直不太承认训练撞墙的问题，这涉及到扩展法则（Scaling Law）——只要有更多的数据和算力，大模型就能持续进步——有没有失效的问题，因为可被训练的全网数据早就被抓取殆尽了，没有新的知识增量，大模型的智能也就面临着无源之水的困局。

于是从训练到推理的重点转移，成了差不多半年以来最新的行业共识，推理采用的技术是强化学习（RL），让模型学会评估自己的预测并持续改进，这不是新东西，AlphaGo和GPT-4都是强化学习的受益者，但o1的思维链又把强化学习的效果往前推进了一大步，实现了用推理时间换推理质量的正比飞跃。

给AI越充分的思考时间，AI就能越缜密的输出答案，是不是有点像新的扩展法则？只不过这个扩展在于推理而非训练阶段。

理解了上述背景，才能理解Kimi和DeepSeek在做的事情有什么价值。

DeepSeek一直是「扮猪吃老虎」的角色，不但是价格战的发起者，600万美元训练出GPT-4o级模型的测试结果，更是让它一战成名，而Kimi正好相反，它的产品能力很强，有用户，甚至还为行业贡献了足够的融资八卦，但在科研方面，除了都知道杨植麟是个牛逼的人之外，其实还是不太被看到。

这次就不一样了，DeepSeek不再是一枝独秀，Kimi也把肌肉秀到了人家脸上，Kimi k1.5满血版在6项主流基准测试里和o1同台竞赛，拿到了3胜1平2负的结果，已经完全称得上是平起平坐了。（1/2）

点击图片查看原图

Markdown支持

评论加载中...

您可能感兴趣的：更多

DeepSeek Chat 和 DeepSeek Coder 两个模型已经合并升级为新模型为 DeepSeek V2.5。这事奔学Claude 3.5去的。代码能量很强，价格骨折，随便造。
时政
( twitter.com)

4个月前 • Tony Zhu • -- 点击 0 评论

转：关于 DeepSeek 的研究和思考 (Archerman Capital)
关于这几天很火的 DeepSeek, 我们 (Archerman Capital) 做了一些研究和思考, 和大家分享, enjoy! 灰色部分是技术细节, 不感兴趣的可略过。
几个事实
1) DeepSeek 不是套壳不是蒸馏美国的大模型。虽然中国有些大模型是套壳和蒸馏的, 但
IT技术
( twitter.com)

6天前 • 宝玉 • -- 点击 0 评论

阿里巴巴宣布新AI模型优于DeepSeek和Meta 阿里云表示，根据其进行的基准测试，Qwen2.5 Max与OpenAI、DeepSeek和Meta的领先模型进行了对比，Qwen2.5-Max全部超越了对比模型。
时政
( twitter.com)

4天前 • 李老师不是你老师 • -- 点击 0 评论

我问市场上性能比较好的模型，你的模型版本是什么？其中出错的是，Mixtral 8x7B每次都会随机胡说，Perplexity Sonar说自己是GPT 4.5，而中国最好的两个新模型DeepSeek V3、QwQ 32B，说自己是GPT-4。这大概意味着DeepSeek和Qwen的新量化版本在使用GPT-4调数据吧？
时政
( twitter.com)

1个月前 • Michael Anti • -- 点击 0 评论

时政

DeepSeek Chat 和 DeepSeek Coder 两个模型已经合并升级为新模型为 DeepSeek V2.5。这事奔学Claude 3.5去的。代码能量很强，价格骨折，随便造。
时政
( twitter.com)

时政

IT技术

阿里巴巴宣布新AI模型优于DeepSeek和Meta 阿里云表示，根据其进行的基准测试，Qwen2.5 Max与OpenAI、DeepSeek和Meta的领先模型进行了对比，Qwen2.5-Max全部超越了对比模型。
时政
( twitter.com)

时政

时政

分享两个最近在使用的 Chrome AI 总结扩展：
Elmo （可以免登录使用，不知道用的什么模型，总结表现出色）
kimi-阅读助手 (国产Kimi，更新后新增提示词模板，更好用了)
IT技术
( twitter.com)

IT技术

DeepSeek好强哇，互联网搜索功能准确，而且快速，一点都不差 poe 和 kimi 啊。
IT技术
( twitter.com)

IT技术

有用户反映，询问DeepSeek属于哪个openai模型。开启深度思考R1模式后，DeepSeek回答自己是基于GPT-3.5的增强版模型即GPT3.5turbo
时政
( twitter.com)

时政

Cursor 已经可以将 Deepseek v3 和 R1 加入了官方模型列表。
可以在设置-模型部分选择，R1 是完全体模型。
IT技术
( twitter.com)

IT技术

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型？你怎么看？
时政
( twitter.com)

时政

时政

DeepSeek Chat 和 DeepSeek Coder 两个模型已经合并升级为新模型为 DeepSeek V2.5。这事奔学Claude 3.5去的。代码能量很强，价格骨折，随便造。 时政 ( twitter.com)

时政

IT技术

阿里巴巴宣布新AI模型优于DeepSeek和Meta 阿里云表示，根据其进行的基准测试，Qwen2.5 Max与OpenAI、DeepSeek和Meta的领先模型进行了对比，Qwen2.5-Max全部超越了对比模型。 时政 ( twitter.com)

时政

时政

分享两个最近在使用的 Chrome AI 总结扩展： Elmo （可以免登录使用，不知道用的什么模型，总结表现出色） kimi-阅读助手 (国产Kimi，更新后新增提示词模板，更好用了) IT技术 ( twitter.com)

IT技术

DeepSeek好强哇， 互联网搜索功能准确， 而且快速， 一点都不差 poe 和 kimi 啊。 IT技术 ( twitter.com)

IT技术

有用户反映，询问DeepSeek属于哪个openai模型。开启深度思考R1模式后，DeepSeek回答自己是基于GPT-3.5的增强版模型即GPT3.5turbo 时政 ( twitter.com)

时政

Cursor 已经可以将 Deepseek v3 和 R1 加入了官方模型列表。 可以在设置-模型部分选择，R1 是完全体模型。 IT技术 ( twitter.com)

IT技术

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型？你怎么看？ 时政 ( twitter.com)

时政

创建一个新帐户

登录

DeepSeek Chat 和 DeepSeek Coder 两个模型已经合并升级为新模型为 DeepSeek V2.5。这事奔学Claude 3.5去的。代码能量很强，价格骨折，随便造。
时政
( twitter.com)

阿里巴巴宣布新AI模型优于DeepSeek和Meta 阿里云表示，根据其进行的基准测试，Qwen2.5 Max与OpenAI、DeepSeek和Meta的领先模型进行了对比，Qwen2.5-Max全部超越了对比模型。
时政
( twitter.com)

分享两个最近在使用的 Chrome AI 总结扩展：
Elmo （可以免登录使用，不知道用的什么模型，总结表现出色）
kimi-阅读助手 (国产Kimi，更新后新增提示词模板，更好用了)
IT技术
( twitter.com)

DeepSeek好强哇，互联网搜索功能准确，而且快速，一点都不差 poe 和 kimi 啊。
IT技术
( twitter.com)

有用户反映，询问DeepSeek属于哪个openai模型。开启深度思考R1模式后，DeepSeek回答自己是基于GPT-3.5的增强版模型即GPT3.5turbo
时政
( twitter.com)

Cursor 已经可以将 Deepseek v3 和 R1 加入了官方模型列表。
可以在设置-模型部分选择，R1 是完全体模型。
IT技术
( twitter.com)

DeepSeek有没有使用OpenAI的专有模型来训练自己的模型？你怎么看？
时政
( twitter.com)