首页
智能设备
数据安全
绿色科技
栏目分类

绿色科技

你的位置:未来探索网 > 绿色科技 > 打响OpenAI AI智能体当头炮!Operator规定电脑自动奉行任务,订票、网购齐可代劳

打响OpenAI AI智能体当头炮!Operator规定电脑自动奉行任务,订票、网购齐可代劳

发布日期:2025-03-02 06:04    点击次数:84

打响OpenAI AI智能体当头炮!Operator规定电脑自动奉行任务,订票、网购齐可代劳

本文作家:李丹

开始:硬AI

两周多过去,OpenAI CEO Sam Altman在反想ChatGPT问世两周年的博文中预言,2025年将是东谈主工智能智能体(AI agent)的“大年”,这一年可能有第一批AI智能体“加入劳能源雄师”,并彰着改革企业产出。当今OpenAI打响了推出AI智能体的第一枪。

好意思东技艺1月23日周四,OpenAI晓喻上线名为Operator的首款AI智能体,它能通过网页奉行各式任务。

Operator不错像东谈主类雷同使用互联网奉行各式任务,不错绽放一个浏览器,点击页面的按钮并打字输入履行。东谈主类用户上网会作念的那些事,比如预订机票、货仓订房、筹办购物订单并完成网购,齐不错由Operator代劳。

如以下截图所示,Operator的界面中有多种任务类别可供用户采用,包括购物、送货、餐饮、旅行、新闻,扫数这些类别齐撑合手不同类型的自动化奉行任务。

OpenAI的Operator家具和工程支配Yash Kumar称,OpenAI和包括Instacart、OpenTable、Uber、StubHub在内的多家公司市欢设置Operator,确保该奇迹能在这些市欢方的网站顺畅开动。

联接GPT-4o视觉功能与高等推理才略 无需API

OpenAI先容,Operator的软件联接了OpenAI的一些盘算机视觉功能,以及旨在师法东谈主类推理格式的多门径问题惩处才略。撑合手Operator的是简称CUA的模子,全称的字面兴味为电脑使用代理(Computer-Using Agent),是一种通过强化学习将OpenAI旗舰模子GPT-4o的视觉功能与高等推理相联接的模子。

经过考验,CUA不错像东谈主类雷同与图形用户界面(GUI)、即东谈主们在屏幕上看到的按钮、菜单和文本字段进行交互。因此它豪迈活泼地奉行数字任务,“无需使用特定操作系统或网页的API(应用要领编程接口)。”

OpenAI称,在浏览器使用和浏览器使用的基准测试中,CUA齐取得了比之前最优成果模子(SOTA)更高的得分。

浏览器使用方面,在应用离线自托管开源网站模拟电子商务、在线商店履行照应 (CMS)、酬酢论坛平台等真实场景的WebArena测试中,CUA的到手率为58.1%,在亚马逊、GitHub和谷歌舆图等在线及时网站上测试性能的WebVoyager⁠测试中,CUA的到手率为87%,不事后者的大多数任务齐相对浮浅,前者相对更复杂。之前电脑使用SOTA在WebArena和WebVoyager⁠测试的到手率分散为36.2%和56%,之前网页浏览智能体SOTA的到手率分散为57.1%和87%。

电脑使用方面,在评估模子规定 Ubuntu、Windows 和 macOS 等圆善操作系统才略的OSWorld⁠基准测试中,CUA 的到手率为38.1%。之前SOTA的到手率为22.0%。OpenAI指出,跟着测试技艺蔓延、即允许更多门径时,CUA的收获会提升。比较东谈主类的测试水平、到手率72.4%,CUA还有很大的转换空间。

接续预览版最初在好意思上线 面向ChatGPT Pro用户

本周四OpenAI推出的是接续预览版Operator,它最初在好意思国商场上线,好意思国的用户不错通过每月订阅费200好意思元的ChatGPT Pro套餐使用Operator奇迹。

接续预览版的Operator可通过网站operator.chatgpt.com拜访。OpenAI示意,但愿将Operator纳入到旗下扫数面向客户的ChatGPT奇迹中。

OpenAI示意,磋议最终将Operator的功能扩充到旗下ChatGPT Plus、Team 和Enterprise版。CEO Altman还称,Operator的功能“将很快在其他国度推出。缺憾的是,(在)欧洲需要一段技艺。”

OpenAI同期教学,Operator“仍在学习和演化,可能会犯罅隙。举例,它目下边临创建幻灯片或照应日期等复杂界面的挑战。”

有东谈主高呼多量众人智能体将至 有东谈主以为没招引力、不如专心作念模子

最近不啻一家媒体爆出OpenAI将推出Operator,比如本周稍早华尔街见闻提到,有媒体获悉,行将问世的出Operator能自动完成诸如餐厅预订、旅行筹办等任务。用户可采用不同类型的任务,如餐饮、购物和旅行,并在小屏幕上检察操作经由。

关于本周四OpenAI清雅官宣Operator,酬酢媒体平台X的网友考虑不一。有东谈主径直喊冲啊,有东谈主哀叹一个月要花200好意思元才调用。

企业决议AI初创Instadeep的CEO Karim Beguir对Operator示意接待。他评论称,这种AI不错拜访网站、截取屏幕截图、决定在那里购买杂货或预订电影院的座位,无需罕见 API,AI智能体的期间如故到来,很快就会出现多量众人智能体。

而一条赢得1000多个点赞的网友评论写谈:“Operator极少招引力齐莫得,这玩意应该是苹果的iOS来作念,而不是OpenAI来作念。OpenAI应该聚焦推出弘远的模子,而不是和生态系统抢饭吃。”

本文来自微信公众号“硬AI”,温和更多AI前沿资讯请移步这里

风险指示及免责条件 商场有风险,投资需严慎。本文不组成个东谈主投资提议,也未探讨到个别用户罕见的投资磋议、财务景色或需要。用户应试虑本文中的任何成见、不雅点或论断是否适应其特定景色。据此投资,职守舒心。