OpenAI推出o3模型系列，AGI测试能力暴涨

智能AI

TIME

2024-12-23 12:02

科技在线

　　近日，OpenAI 再次惊艳全球，重磅发布了全新的 AI 模型——o3。这次发布的的 o3 系列模型是 o1 的迭代版本，考虑到可能与英国电信运营商 O2 存在版权或商标冲突，OpenAI 决定跳过「o2」命名，直接采用「o3」。

　　o3 系列包含两款重磅模型：

　　OpenAI o3：旗舰版本，具备强大的性能表现

　　OpenAI o3 mini：轻量级模型，但能更快，更便宜，主打性价比

　　OpenAI声称，至少在某些条件下，o3模型可以接近实现AGI。

　　所谓AGI，即“通用人工智能”(artificial general intelligence)的缩写，泛指能完成人类所能完成的任何任务的人工智能。OpenAI对此有着自己的定义：“在最具经济价值的工作上胜过人类的高度自主系统”。

　　按照OpenAI的说法，o3模型在ARC-AGI图形逻辑推理基准上获得了破纪录的分数，低计算场景中，o3得分为75.7%，而在高计算测试中，它达到了87.5%——超过了标志着达到人类水平的门槛85%。作为对比，o1模型的得分仅在25%到32%之间。o3的表现几乎是o1三倍。

　　根据openAI展示的内容来看，目前可知的O3提升地方大概有几处：

　　一是在软件任务组成的基准测试当中，O3准确率达到71.7%，比上一代提升了20% 以上；

　　二是在竞赛代码方面，O3得到的最高ELO 分数是2727分，比O1高893分，还比openAI目前最厉害的竞赛程序员和指导员高227分；

　　三是在数学竞赛基准测试中，O3的AIMI准确率约为 96.7%，比O1提升了13.4%；

　　第四个，O3在在博士水平科学问题上测试，获得的准确率为87.7%，这是与人类博士水平基本一致的，比O1提升了近10%；

　　在rkg Pub上，O3是新的第一名。

　　OpenAI发布o3，再次突破 AI 极限，为全球 AI 的发展注入了新的活力。这一模型的问世，不仅预示着人工智能正逐渐走向成熟，还为我们展示了未来 AI 世界的无限可能。

THE END

免责声明：本文系转载，版权归原作者所有；刊载之目的为传播更多信息，如内容不适请及时通知我们。

　　当前沿科技与冰雪文化相遇，黑龙江的冰雪世界焕发出前所未有的活力。全感VR带着人们穿越到冰河世纪，人工智能创意生成冰雪万花筒空间，81米的“九九消寒图”可让上千人...

业界

　　据分析师Mark Gurman透露，苹果正紧锣密鼓地研发第三代AirPods Pro无线耳机，这款新品将首次融入心率及体温监测等健康监测功能，进一步拓宽了AirPods系列的应用场景。　...

数码