在这除夕夜里,来聊点全世界唯一首发的重量级干货吧,看问题需要看本质,今天带大家读懂奥卡姆剃刀下DeepSeek一炮而红真正的原因,那就是“工程的胜利”与“这依然是个达尔文的世界”,这是人类自我迭代道路上的又一次精彩的自发性纠错。并且,在最近20年的科技发展史上,已经不止一次重现了这样的精彩过程,虽说世界是残酷的达尔文,但这种迭代过程下所展现出的协作能力,也向我们证明了达尔文与人文的共存法则,下面详细说说:
一、DeepSeek揭示了一个残酷的事实,天才永无上限,人与人差距巨大
具体技术细节的东西,就不多赘述了,即使外行人,这几天通过看新闻和各类大神的帖子,应该也能模糊理解出一个大概,即这次DeepSeek在工程和思维模式上实现了一些突破,也在低成本要求下探索出一些巧思。
那么这种大浪淘沙下进步的核心因素,就是幻方不缺钱的背景,以及最重要的一件事:他的人才储备机制。特别是后者,这相当重要,这相当重要,这相当重要,一定要重复三次。国内头部量化公司,大抵上都爱招聘IOI、MOI、NOIP、ACM的获奖人才,甚至ACM这种偏业务建模向的人才会面临被瞧不上的风险,这不是玩笑,而是严肃的智力等级差异。
很多人会觉得,难道META、谷歌、微软、阿里、腾讯这些大厂的高端人才就不行吗?老实说,还真就不行,这里有多个角度上的差异。
首先大厂有一些他固有的规矩和世俗,哪怕谷歌微软这样众所周知的技术纯粹向的大厂也做不到完全自由开放的研发环境,这和学界众多的学阀故事有着异曲同工之妙。
而幻方恰恰是在这方面实现了一定程度的降维打击,量化机构的决策机制特别个人化或者小团队化,而在建模能力和最终策略的绩效考核上,也和能力强挂钩,特别有趣的一点是,全世界最没心没肺爱拿老板的服务器烧钱测试自己的模型和策略的,就属量化工程师了。所以这就造就了一个天然的、特别适合的,用来做数学向、算法向创业的人才土壤环境。
再者,大家低估了对于固定范式挑战的难度,说一个更听得懂的通俗的例子,在大家都用Python做AI产品、金融分析的时候,突然跳出来一个人大叫一声说,Python是垃圾的动态语言,想要更上一层楼,一定要提高行业入门门槛,基于更加适合工程化的大型静态语言才能实现更牛逼的应用。不好意思,对于发出这么一声大叫,真的很难很难很难,不仅需要面临对范式的挑战,更要求发声者有着深厚的软件工程理解、强大的心理素质以及无比厉害的思想实验深度,而如果他不是行业大佬,还只是个新人,那么他能做的只有默默研发,等真正基于他的想法做出好东西的时候,才能得到认可和理解,否则一定无人问津。
这个例子换到DeepSeek上也是如此,纵观整个大模型研发的过程,别说软件工程了,涉及核心原理神经网络相关的数学工程、涉及高维数据处理的数学工程、涉及训练过程的算法工程、涉及性能处理的算法工程等等。在这些方面,一般的大厂的高级架构师和核心主程甚至光是看明白原理都已经够吃一壶了,在老板的目标压力下,能做的也只有在依葫芦画瓢下夹缝创新了。
所以说到这,不知道你是否稍微能理解为何AI的成功首先出现在美国,而之前中国各大厂除了追赶也只能追赶,这背后的因素,除了土壤,还是土壤。
实际上,一切的一切也才刚刚开始,我们甚至可以说,在大模型领域,连工程都谈不上,目前还只是方法、函数与过程的阶段,哪怕你说这也算工程了,那么也只是数学工程、算法工程上的小架构和小进步,至少这次DeepSeek,还没看到任何软件工程、业务工程、管理工程上的明显突破性进展。作为一名资深软件架构师,请相信我的判断,我能够大胆的说一句,到目前为止,就我个人长期的体验来看,目前大模型世界的所有软件产品背后的业务建模和产品产出(包括各端),除了WebUI好看外,都还是草台班子,是巨大的草台班子,是全行业全员草台班子。不用看代码,只看产品体验就完全感受不到背后对业务建模的深度理解和渴望,即使版本频发也只是功能的迭代而非架构的解耦和重构,换言之,有相当数量的非软件专家在从事AI产品的开发工作,比如就我自己比较多看过的SD的核心和UI,一个字,惨不忍睹,赶紧来个人重构下吧。。
但不管如何,这既是迭代过程的无奈和必须,也是未来的巨大机会。今天我们所讨论的是工程的胜利,而工程这东西,本质上就是各行各业的金字塔尖的一群人,在所属领域内的智慧涌现,这种涌现,很多时候不是循序渐进,而是突然转向的,当你看清楚这个事实的时候,就会知道我们现在需要的是什么,不是人才而是天才:
是思维深度比别人强10倍的天才!
是光通过思想实验就能建立起迷之自信的天才!
是对重构、对解耦有着极致追求和快感的天才!
是在重大决策上可以一眼万年的天才!
是绝对的超级天才!
在这里,我也歪个楼说一段题外话,前段时间我说准备在春节期间好好讲讲川普和左与右的事情,今天先说一小段,对于川普本人,每个人都有自己的评价,但不管如何,在这次的大选,他与马斯克对于美国,对于全世界,最大的贡献,就是将这个世界恢复正常,重新回到残酷的达尔文普世价值中来,对的,这个说法,左派不敢提、不敢想,一往深说就如丧考妣,但很遗憾,这才是正常的世界样貌,这才是正确的世界走向。如果说中国共产党在过去50年做对了什么,那么高考制度一定是其中一件,再看看美国的高校和大厂在搞啥,DEI?不要以为这东西清除了就没有后遗症,真正劲大的还在后面,至少延迟5-10年的长期影响。
这个世界,在过去的200年,每一项重大的科技革命和突破,都是厚积薄发的必然加上个别天才的偶然。没有爱因斯坦,狭义相对论大家伙都差临门一脚,但广义相对论可能要延迟至少50年。如果只有富兰克林的数据和思维,没有沃森和克里克超强的想象力和洞察力,10年也未必解读出双螺旋结构。如果没有香农构建出信息熵的世界观,那么通信时代和计算机时代,很可能要等热力学的老大爷们再折腾几十年才能步入正轨。类似的例子实在太多了,我们必须承认,这个世界的进步属于天才。
二、但庆幸的是,在近20年,人类已经建立起一套天才与普通人有效协作的机制
我们无比悲观的是,天才的涌现是偶然的,因为这依赖全人类突突突生育下的基因突变(目前我还不能理解这种随机,也许有一天能够发现涌现天才的必然性原理和机制),但同时非常开心的事情是,在过去的20年,天才与普通人的协作机制已经越来越纯熟。
前面我说过一个东西,那就是GitHub奇迹,详细可以看这篇帖子:https://t.co/Dvb0OpFXjg。原文中我总结道:“Github奇迹,也可以理解为,一帮原本没有展示自我机会的中上游开发人员,通过Github崭露头角,带领着千千万万的中下游开发人员,浪里淘沙、百里挑一,成就了一个又一个新的软件奇迹”。
而原文中没有补充说明的是,这种GitHub所给予的机会,是需要天才适时来纠错的,在这里,就不得不再此搬出安大神(Anders Hejlsberg)-这位全世界最科班、最静态、最深度、最抽象、最解耦、最重构的超级程序员、超级架构师。
当这种绝对天才级人物,发现全世界这么多受益于GitHub奇迹的前端程序员或者低端程序员们,始终受困于javascript那不堪一击的工程能力时,是的,他出手了,捣鼓出了TypeScript,直接将相关软件生态的工程能力,拉升到了一个全新的高度。
这就是天才和普通人之间的协作,你可以说这种协作是偶然的,比如PHP也经历过相当的繁荣,但至今看不到谁来拯救。但也可以说这种协作是必然的,用整体的熵增换取局部的熵减,这是人类至今为止的发展规律,特别是经历了PC互联网时代、全球化时代、移动互联网时代后,直到现在的GitHub、arXiv时代。我们越来越能感受到,“全民大力出奇迹”和“坐等天才涌现”这两件事在各行各业中持续贯彻和发展。
三、恐怖的自迭代和工程爆炸
在过去的2年里,当我第一次领略到ChatGPT能做什么时,我的脑海里就已经涌现出“永生”二字,很多人觉得我在开玩笑,但我深深的知道,这是一种“在必然中等待偶然”的必然。其背后的思考,就是AI时代,自迭代的恐怖和对工程能力的爆炸级促进。
也许下面这个例子的类比不太恰当,但差不多可以帮助思考,这次DeepSeek除了整体的工程进步外,也在调教AI的自迭代能力,也许人文领域不使用RLHF与人类对齐会造成很奇怪的结果,但在纯逻辑领域已经有所顿悟。那么未来的一天,如果能够持续的在思考上自我迭代,这会产生多少无法预料但又十分可观的涌现。
其实对于AI自迭代这块的思考,我的知识储备和知识结构还不足以支撑我去深度思考和理解这个领域的走向,但从一个大的方向看,信息与计算,在物理上的本质已经慢慢被揭示,相互之间的同步感越来越强烈,过去200年,我们搞清楚了物理的世界,就像研究粒子为何自发的运动,在未来的100年,信息的规律也会逐层揭开。你要说未来的AI不能自迭代,我是不信的。
那么再回到工程爆炸,其实这条路径,早就有了十分具象化的清晰画像,通俗的说,哪怕GPT就停留在2025年初的水平,那么他也能帮助全球所有领域所有工程人员提升工程效率,这种提升,是一种肉眼可见的能够量变产生质变的级别。比如软件开发,AI已经切实的减少了至少一半以上的工作量,最重要的是,AI还能实现更加靠谱的自动化测试,甚至能主动提出设计模式、全盘性的对架构提出切实有效的重构建议。没搞过软件工程的人可能无法理解这其中的疯狂所在,这对产业来说,就是光速促进,唯一欠缺的就是各位软件公司的老板,应该好好想想如何能强迫、强制自己的程序员把AI全面应用到工作中来。而软件产业,也已经成了所有产业的底层基石,当基石都在疯狂加速的时候,对上层产业和学科的促进可想而知。
我们能想到所有的学科领域,都会在未来的5-10年里,在一种必然的工程爆炸下,慢慢进入到一些很神奇、很微妙的类似AI自迭代的过程,在观察中你会慢慢发现,人类开始跑步迈向永生了,这不是纯粹生物学的事,这是全部学科的共同进步所带来的真正的天方夜谭。
其实这次DeepSeek事件里,我本人是非常激动的,作为一个喜欢正本清源的纯粹架构师,看我的BIO就能知道,我在软件领域里是小众,当所有的大厂架构师都在吹嘘自己如何知晓云原生,如何构建超大规模基于云的系统时,其实真正的天才架构师一定会建立高效而靠谱的物理机架构,云原生唯一的价值只是去耦合那不得不用他的CDN等场景,而StackOverFlow就是类似DeepSeek的天才。
现在,一个DeepSeek天才勇敢的站出来,给大家指明了方向,那么未来,我看真的不远了!