网友分享:
你好宝老师,我想投稿大模型的使用体验。我是理工科,国内土博,材料专业。使用强度不是很高,但是集中分析的时候会连续追问和讨论。
关于推理模型,我想说说我的使用体验。我使用的较多的时gpt o1,O1mini,还有谷歌的新出的thinking。
我想说o1目前还是当之无愧的第一,因为具有很庞大的知识库。我使用都是在分析化学的情况下,比如红外图谱和核磁图谱的分析。然后O1是说的最靠谱。我结合文献和O1聊我的推理,基本就能把图谱分析的七七八八差不多。但是o1mini不精通化学结构导致理解不了复杂化学结构,谷歌的thinking也一样对化学不够精通,比如今天核磁分析时就弄混了ppm高低和上下场的关系。而o1可以一直正确的分析推理。
以我的认知我认为,知识库的丰富程度极大程度决定了好用与否。最近新出的推理模型,由于缺乏知识库,测试发现推理的化学结果大部分都不对。目前我只有用o1的时候很少发现错误。所以可能高成本的模型还是更有实际价值,而针对推理方面雕花的可能还是炫技更多一些。