图片来源:Unsplash
OpenAI正在更新其AI代理Operator所采用的AI模型,该代理能够自主浏览网页,并通过云端托管的虚拟机使用特定软件来满足用户需求。
很快,Operator将改用基于o3的模型这是OpenAI最新o系列"推理"模型之一。此前Operator一直依赖定制版的GPT-4o。
从多项基准测试来看,o3是一个先进得多的模型,尤其在涉及数学和推理的任务上表现突出。
OpenAI在博客文章中写道 :"我们正将Operator当前基于GPT-4o的模型替换为基于OpenAI o3的版本。(Operator的)API版本将保持基于4o不变。"
Operator是AI公司近几个月发布的众多智能体工具之一。各公司竞相开发高度复杂的智能体,这些智能体基本无需监督就能可靠地完成各种任务。
谷歌通过其Gemini API提供了能浏览网页并代表用户执行操作的"计算机使用"智能体,以及更面向消费者的Mariner服务。Anthropic的模型同样具备执行计算机任务的能力,包括打开文件和浏览网页。
据OpenAI称,这款名为o3 Operator的新模型"针对计算机使用场景进行了额外安全数据的微调",包含专门用于"教授模型OpenAI在确认与拒绝操作上的决策边界"的数据集。
OpenAI发布的技术报告显示,o3 Operator在特定安全评估中表现优异。根据该报告,与GPT-4o Operator模型相比,o3 Operator更少拒绝执行"非法"活动或搜索敏感个人数据,且对提示注入这类AI攻击方式的抵抗力更强。
o3 Operator采用了与4o版本相同的多层安全防护机制,"OpenAI在博客中写道,"虽然o3 Operator继承了o3的编程能力,但它并不具备直接访问编程环境或终端的原生权限。
参考资料:
https://techcrunch.com/2025/05/23/openai-upgrades-the-ai-model-powering-its-operator-agent/
编译:ChatGPT
本文网址: