Sale Whatsapp

Posted: **Tue Jan 07, 2025 6:03 am**

OpenAI 在结束为期 12 天的活动时介绍了o3的最新 AI 模型，以及更实惠的兄弟产品o3 mini 。

跳过 o2 的决定并不是随机的。尽管 OpenAI 参考了 Telefónica 的 O2 品牌作为推理的一部分，但我们怀疑这也是一个战略举措，标志着更实质性的飞跃。萨姆·奥尔特曼在宣布消息时开玩笑说，名字不是他的强项，但这个选择似乎是经过深思熟虑的。

O3 非常注重推理，具有处理复杂编码、数学和一般智哥伦比亚电话数据能任务的功能。 OpenAI 将从公共安全测试开始，而不是全面启动，我们认为这反映了审慎和透明的做法。如果早期结果成立，o3 可能标志着人工智能模型发展的重要一步。

OpenAI 基础知识
开始使用 OpenAI API 等等！

什么是 OpenAI O3？
O3 是 OpenAI 的最新前沿模型，旨在提升一系列复杂任务的推理能力。它与较小的 o3 mini 一起发布，专注于解决编码、数学和一般智能挑战。

我们认为 o3 之所以脱颖而出，是因为它强调更严格的测试，这些测试以以前的模型尚未完全解决的方式挑战推理。 OpenAI 强调了它相对于 o1 的改进，将其定位为一个更能够处理复杂问题解决的系统。

编码中的 O1 与 o3

编码中的 O1 与 o3。来源：OpenAI

O3 目前还不能用于一般用途。 OpenAI 从公共安全测试开始，邀请研究人员探索其优势和局限性。我们相信，随着人工智能模型变得更加强大，这种协作方法反映出人们越来越认识到仔细评估的必要性。

O1对战氧气
O3 直接建立在 o1 奠定的基础上，但在关键领域进行了重大改进。 OpenAI 将 o3 定位为一个旨在处理更复杂推理任务的模型，其性能改进反映在其基准测试中。

编码
我们已经看到这两个模型之间存在一些明显的差异（见上图）。在软件编码任务上，O3 在 Bench Verified 上实现了 71.7% 的准确率，比 o1 有了大幅提升。

Sale Whatsapp

功能、与 O1 的比较、发布日期等

功能、与 O1 的比较、发布日期等