OpenAI推出o3模型系列,AGI测试能力暴涨

智能AI
TIME
2024-12-23 12:02
科技在线
分享

  近日,OpenAI 再次惊艳全球,重磅发布了全新的 AI 模型——o3。这次发布的的 o3 系列模型是 o1 的迭代版本,考虑到可能与英国电信运营商 O2 存在版权或商标冲突,OpenAI 决定跳过「o2」命名,直接采用「o3」。

  o3 系列包含两款重磅模型:

  OpenAI o3:旗舰版本,具备强大的性能表现

  OpenAI o3 mini:轻量级模型,但能更快,更便宜,主打性价比

  OpenAI声称,至少在某些条件下,o3模型可以接近实现AGI。

  所谓AGI,即“通用人工智能”(artificial general intelligence)的缩写,泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义:“在最具经济价值的工作上胜过人类的高度自主系统”。

  按照OpenAI的说法,o3模型在ARC-AGI图形逻辑推理基准上获得了破纪录的分数,低计算场景中,o3得分为75.7%,而在高计算测试中,它达到了87.5%——超过了标志着达到人类水平的门槛85%。作为对比,o1模型的得分仅在25%到32%之间。o3的表现几乎是o1三倍。

b7.png

  根据openAI展示的内容来看,目前可知的O3提升地方大概有几处:

  一是在软件任务组成的基准测试当中,O3准确率达到71.7%,比上一代提升了20% 以上;

  二是在竞赛代码方面,O3得到的最高ELO 分数是2727分,比O1高893分,还比openAI目前最厉害的竞赛程序员和指导员高227分;

  三是在数学竞赛基准测试中,O3的AIMI准确率约为 96.7%,比O1提升了13.4%;

  第四个,O3在在博士水平科学问题上测试,获得的准确率为87.7%,这是与人类博士水平基本一致的,比O1提升了近10%;

  在rkg Pub上,O3是新的第一名。

  OpenAI发布o3,再次突破 AI 极限,为全球 AI 的发展注入了新的活力。这一模型的问世,不仅预示着人工智能正逐渐走向成熟,还为我们展示了未来 AI 世界的无限可能。


THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  当前沿科技与冰雪文化相遇,黑龙江的冰雪世界焕发出前所未有的活力。全感VR带着人们穿越到冰河世纪,人工智能创意生成冰雪万花筒空间,81米的“九九消寒图”可让上千人...
业界
  据分析师Mark Gurman透露,苹果正紧锣密鼓地研发第三代AirPods Pro无线耳机,这款新品将首次融入心率及体温监测等健康监测功能,进一步拓宽了AirPods系列的应用场景。 ...
数码

相关推荐

1
3