o1 这类推理模型和以前的 GPT-4o 这样的大语言模型最大的不同在于它可以用算力换能力,以前的大语言模型是“快思考”,也就是你提一个问题(输入一个Prompt),它马上返回结果,那么这个结果很可能是错的,而且也无法自动纠错,只能重新开会话或者继续发后续消息内容纠正。但 o1 这样的推理模型,它是“慢思考”,在给出最终结果前可以反复推演甚至回溯到之前的步骤重新开始,就像围棋高手在算棋子一样。
o1 pro 跟 o1 的差别,主要在于可以用于思考的时间的长短,现在用 o1 的话,一般就是一二十秒就给出了结果,而 o1 pro 会更长时间也意味着更多算力在反复思考,所以结果会更好。
《纽约时报》有一款名为“Connections”的文字游戏,每天会更新,这个游戏以前 GPT-4o 做不出来,现在 o1 pro 可以做出来,从原推图中你可以看到它为了解决这个问题花了一分多钟时间“慢思考”。
以前的算力主要都是花在训练模型上,以后慢慢的算力要更多的花在推理上了。
点击图片查看原图
点击图片查看原图