GPT-4.5 会带来推理模型的升级
想象一下,每个 AI 模型都是一名努力学习的学生。每个学生的能力有高有低,有的懂得多,有的懂得少。这张图片就像是一场考试的成绩单,展示了不同的“学生”(模型)在高难度考试(GPQA基准测试,类似博士水平的知识问答)中的表现。
在图片中,我们能清楚看到:
- 最底层的基础模型(Base Models),类似于那些还没学会“如何思考”、只掌握了大量知识却不善于运用的学生。他们的成绩一般较低,比如:
* GPT-3.5 得分只有28%,就像一个知识储备不足的学生。
* GPT-4o 稍强一些,有49%的成绩。
* 而最新的 GPT-4.5 更厉害,达到69%,比GPT-4o提升了整整20个百分点。这意味着 GPT-4.5 本身掌握的知识已经非常丰富,基础扎实。
- 右侧则是经过推理训练后的推理模型(Reasoning Models),也就是给这些“学生”增加了高效思考、分析和推理的能力,让他们能够更灵活、更聪明地解决复杂问题:
* GPT-4.5 加上推理能力后,成绩瞬间飙升至85%~95%,展现出超凡的潜力。
* 原本基于 GPT-4o 的推理模型(如图中o1-mini、o3-mini)虽然也进步显著,但最终成绩(77%左右)显然不如基于 GPT-4.5 的潜力巨大。
为什么基础能力(Base)这么重要呢?
就好像一个学生,如果基础知识足够扎实,思考问题时才会更加深入准确。如果基础不牢,就算他再怎么聪明,也很难回答那些他根本没学过的知识——比如一个完全没学过古希腊历史的学生,即使逻辑推理再好,也答不出苏格拉底的哲学思想。
由此我们可以推测,未来以 GPT-4.5 为基础建立的新一代推理模型,将达到前所未有的高水平,很可能将所有现有的高难度测试(比如PhD博士级的问题)都完美“攻克”,实现史无前例的突破。这也许就是 GPT-5,或者类似 GPT-4.5-o 系列的模型,将在不久的将来让我们惊艳。
简单说来,GPT-4.5 就是一个极具天赋的“优等生”,只等着训练出顶尖的推理能力,一飞冲天!
图源:见图片底部
点击图片查看原图