OpenAI突發(fā)AI智能體大招,像人一樣操作電腦,解放打工人神器
阿爾特曼:AI進(jìn)入Level 3,更多智能體已在路上。
原標(biāo)題:OpenAI突發(fā)AI智能體大招,像人一樣操作電腦,解放打工人神器
文章來源:智東西
內(nèi)容字?jǐn)?shù):4676字
OpenAI發(fā)布首款A(yù)I智能體Operator:進(jìn)入Level 3
OpenAI CEO薩姆·阿爾特曼近日發(fā)布了首款能夠像人類一樣操作電腦完成任務(wù)的AI智能體——Operator。這款智能體能夠幫助用戶完成訂票、購物、填寫表格等多種任務(wù),極大提升效率。目前Operator向美國(guó)ChatGPT Pro用戶開放,未來將擴(kuò)展至其他用戶群體并集成到ChatGPT中。
Operator的工作原理與功能
1. **解放雙手,高效完成任務(wù):**用戶只需描述需求,Operator即可自動(dòng)執(zhí)行后續(xù)步驟,例如:根據(jù)手寫購物清單購買日用品、預(yù)訂機(jī)票、辦理退款、查找露營(yíng)地等。涉及隱私信息時(shí),Operator會(huì)主動(dòng)暫停并請(qǐng)求用戶接管。
2. **底層模型CUA:**Operator由名為Computer-Using Agent (CUA) 的新模型驅(qū)動(dòng)。CUA結(jié)合了GPT-4的視覺功能和高級(jí)推理能力,能夠與圖形用戶界面(GUI)交互,完成點(diǎn)擊、滾動(dòng)、輸入等操作。CUA通過感知、推理、操作的迭代循環(huán)運(yùn)行,并具備自我糾正和尋求用戶幫助的能力。
3. **多任務(wù)處理和自定義設(shè)置:**用戶可以創(chuàng)建新對(duì)話讓Operator同時(shí)處理多個(gè)任務(wù)。同時(shí),用戶可以保存常用提示,并為特定網(wǎng)站設(shè)置自定義偏好。
安全保障措施
1. **三層保護(hù):**OpenAI設(shè)置了接管模式(處理敏感信息時(shí))、用戶確認(rèn)(重要操作前)和任務(wù)限制(拒絕敏感任務(wù))三層保護(hù)措施,確保用戶安全。
2. **數(shù)據(jù)隱私保護(hù):**用戶可以一鍵刪除所有瀏覽數(shù)據(jù)和歷史對(duì)話記錄,并選擇退出數(shù)據(jù)用于模型訓(xùn)練。
3. **防御惡意行為:**OpenAI建立了防御措施,以應(yīng)對(duì)隱藏提示、惡意代碼和網(wǎng)絡(luò)釣魚等惡意行為。
Operator的局限性和未來發(fā)展
1. **當(dāng)前局限性:**Operator目前仍處于早期階段,在處理制作PPT、管理日歷等復(fù)雜任務(wù)方面表現(xiàn)欠佳。
2. **未來計(jì)劃:**OpenAI計(jì)劃公開CUA模型的API,方便開發(fā)者構(gòu)建自己的計(jì)算機(jī)使用智能體,并提升Operator處理更長(zhǎng)、更復(fù)雜工作流程的能力。
Operator的出現(xiàn)標(biāo)志著AI智能體發(fā)展進(jìn)入新的階段,這類智能體能夠顯著降低用戶與計(jì)算機(jī)交互的門檻,并為用戶帶來更高的效率。
聯(lián)系作者
文章來源:智東西
作者微信:
作者簡(jiǎn)介:智能產(chǎn)業(yè)新媒體!智東西專注報(bào)道人工智能主導(dǎo)的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)升級(jí)。聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。