OpenAI 推出 AI 智能體,能替用戶上網(wǎng)辦事
能\x26quot;替用戶上網(wǎng)辦事\x26quot;的智能工具,在官方博客中被描述為\x26quot;自帶瀏覽器,可瀏覽網(wǎng)頁并通過點(diǎn)擊、輸入等操作完成任務(wù)\x26quot;。
原標(biāo)題:OpenAI 推出 AI 智能體,能替用戶上網(wǎng)辦事
文章來源:AI范兒
內(nèi)容字?jǐn)?shù):1205字
OpenAI Operator:AI 上網(wǎng)代理人的技術(shù)嘗鮮
OpenAI 最新推出的 AI 代理 Operator 正式開啟“技術(shù)嘗鮮”模式,為 ChatGPT Pro 用戶提供“替用戶上網(wǎng)辦事”的服務(wù)。這項(xiàng)功能目前僅限于美國市場,每月訂閱費(fèi)為 200 美元。
1. Operator 的核心功能與技術(shù)架構(gòu)
Operator 能夠像人類一樣瀏覽網(wǎng)頁,并通過點(diǎn)擊、輸入等操作完成任務(wù)。其技術(shù)架構(gòu)融合了 GPT-4o 的視覺識別能力和強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的推理系統(tǒng),形成獨(dú)特的“計(jì)算機(jī)使用代理”模型。它能夠“觀察”(通過屏幕截圖)網(wǎng)頁內(nèi)容,并使用鼠標(biāo)和鍵盤進(jìn)行交互,無需依賴專用接口。
2. 智能糾錯(cuò)與安全機(jī)制
Operator 的亮點(diǎn)之一是智能糾錯(cuò)功能,系統(tǒng)可以自主修正操作失誤,并在遇到難題時(shí)將控制權(quán)交還給用戶。為確保安全,Operator 在登錄認(rèn)證等敏感環(huán)節(jié)會(huì)主動(dòng)請求用戶接管,執(zhí)行關(guān)鍵操作(例如發(fā)送郵件)前也需要用戶確認(rèn)。此外,系統(tǒng)內(nèi)置了拒絕有害指令和過濾違規(guī)內(nèi)容的安全機(jī)制。
3. 實(shí)用性與合作
為了提高實(shí)用性,OpenAI 與 DoorDash、Instacart 等生活服務(wù)平臺合作,力求 Operator 的功能設(shè)計(jì)符合現(xiàn)實(shí)場景需求。盡管如此,官方承認(rèn)當(dāng)前版本在處理“制作幻燈片、管理日程等復(fù)雜界面”時(shí)仍存在不足。
4. 商業(yè)化路徑與未來展望
OpenAI 計(jì)劃逐步將 Operator 向 ChatGPT Plus、Team 及企業(yè)用戶開放,最終將其核心能力深度集成至 ChatGPT 平臺。Operator 的推出標(biāo)志著“AI 上網(wǎng)代理人”技術(shù)實(shí)驗(yàn)的正式開啟。
5. 總結(jié)
OpenAI 的 Operator 代表了 AI 技術(shù)在自動(dòng)化網(wǎng)絡(luò)操作方面的最新進(jìn)展。其強(qiáng)大的功能和內(nèi)置的安全機(jī)制使其具有顯著的潛力,但也面臨著在處理復(fù)雜界面方面的挑戰(zhàn)。未來,隨著技術(shù)的不斷完善和應(yīng)用場景的拓展,Operator 有望成為提高生產(chǎn)效率和簡化用戶體驗(yàn)的重要工具。
聯(lián)系作者
文章來源:AI范兒
作者微信:
作者簡介:專注于探索 AIGC,發(fā)掘人工智能的樂趣。