近日,OpenAI 再次惊艳全球,重磅发布了全新的 AI 模型——o3。这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。
o3 系列包含两款重磅模型:
OpenAI o3:旗舰版本,具备强大的性能表现
OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比
OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI。
所谓AGI,即“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主系统”。
按照OpenAI的说法,o3模型在ARC-AGI图形逻辑推理基准上获得了破纪录的分数,低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%——超过了标志着达到人类水平的门槛85%。作为对比,o1模型的得分仅在25%到32%之间。o3的表现几乎是o1三倍。
根据openAI展示的内容来看,目前可知的O3提升地方大概有几处:
一是在软件任务组成的基准测试当中,O3准确率达到71.7%,比上一代提升了20% 以上;
二是在竞赛代码方面,O3得到的最高ELO 分数是2727分,比O1高893分,还比openAI目前最厉害的竞赛程序员和指导员高227分;
三是在数学竞赛基准测试中,O3的AIMI准确率约为 96.7%,比O1提升了13.4%;
第四个,O3在在博士水平科学问题上测试,获得的准确率为87.7%,这是与人类博士水平基本一致的,比O1提升了近10%;
在rkg Pub上,O3是新的第一名。
OpenAI发布o3,再次突破 AI 极限,为全球 AI 的发展注入了新的活力。这一模型的问世,不仅预示着人工智能正逐渐走向成熟,还为我们展示了未来 AI 世界的无限可能。