OpenAI 推出具有类似人类推理能力和先进功能的 GPT-o1

该模型的表现明显优于旧版本,在国际数学奥林匹克竞赛中的得分为 83%,而 GPT-4o 的得分仅为 13%,并且表现出类似人类的犹豫模式。

1726677764126.jpg

OpenAI 最新版本的 ChatGPT,GPT o1,一个表示将计数器时钟重置为 1 的命名法,以及其成本较低的迷你版本,代表了该公司 LLM 储备的一个分水岭。这些模型旨在复制超人级别的智能,已经能够比人类更快地回答问题。这一系列模型将与之前的模型不同。在回答查询时,它们利用类似人类的“思维链”处理,结合对专门数据集和优化算法的强化学习。 

该模型的表现远胜于旧模型。例如,在国际数学奥林匹克竞赛中与 GPT-4o 进行测试时,该模型得分为 83%,而 GPT-4o 得分为 13%。该模型的独特之处在于,它不仅能够提供输出的分步推理,还能在过程中表现出类似人类的犹豫模式,例如“我很好奇……”和“好的,让我看看”或“哦,我没时间了,让我快点找到答案”。新设计还减少了幻觉的发生。然而,尽管这些模型有很多优点,但它们也有局限性。例如,它们不能浏览互联网,缺乏世界知识,也不能处理文件和图像。 

据项目首席研究员 Jerry Tworek 介绍,下一步,这些模型将在物理、化学和生物等领域的具有挑战性的基准任务上,取得与博士生相当的表现。他保证,我们的目的不是将人工智能等同于人类思维,而是要说明模型深入认知的能力。对于该公司而言,推理是模式识别的进步,模式识别是以前版本使用的设计模型。OpenAI 的最终目标是开发一种可以代表人类做出决策并采取行动的产品,预计该项目将耗资 1500 亿美元。消除系统中当前的缺陷意味着这些模型可以解决我们今天在工程和医学等领域面临的复杂全球问题。 

更多的突破也将意味着开发者和用户的访问成本降低。据首席研究官 Bob McGrew 介绍,开发者访问 o1-preview 的费用目前为每 100 万个输入令牌(模型解析的文本块)15 美元,每 100 万个输出令牌 60 美元。GPT-o4 的费用为每 100 万个输入令牌 5 美元,每 100 万个输出令牌 15 美元。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论