阿爾特曼:AI進入Level 3,更多智能體已在路上。
原標題:OpenAI突發AI智能體大招,像人一樣操作電腦,解放打工人神器
文章來源:智東西
內容字數:4676字
OpenAI發布首款AI智能體Operator:進入Level 3
OpenAI CEO薩姆·阿爾特曼近日發布了首款能夠像人類一樣操作電腦完成任務的AI智能體——Operator。這款智能體能夠幫助用戶完成訂票、購物、填寫表格等多種任務,極大提升效率。目前Operator向美國ChatGPT Pro用戶開放,未來將擴展至其他用戶群體并集成到ChatGPT中。
Operator的工作原理與功能
1. **解放雙手,高效完成任務:**用戶只需描述需求,Operator即可自動執行后續步驟,例如:根據手寫購物清單購買日用品、預訂機票、辦理退款、查找露營地等。涉及隱私信息時,Operator會主動暫停并請求用戶接管。
2. **底層模型CUA:**Operator由名為Computer-Using Agent (CUA) 的新模型驅動。CUA結合了GPT-4的視覺功能和高級推理能力,能夠與圖形用戶界面(GUI)交互,完成點擊、滾動、輸入等操作。CUA通過感知、推理、操作的迭代循環運行,并具備自我糾正和尋求用戶幫助的能力。
3. **多任務處理和自定義設置:**用戶可以創建新對話讓Operator同時處理多個任務。同時,用戶可以保存常用提示,并為特定網站設置自定義偏好。
安全保障措施
1. **三層保護:**OpenAI設置了接管模式(處理敏感信息時)、用戶確認(重要操作前)和任務限制(拒絕敏感任務)三層保護措施,確保用戶安全。
2. **數據隱私保護:**用戶可以一鍵刪除所有瀏覽數據和歷史對話記錄,并選擇退出數據用于模型訓練。
3. **防御惡意行為:**OpenAI建立了防御措施,以應對隱藏提示、惡意代碼和網絡釣魚等惡意行為。
Operator的局限性和未來發展
1. **當前局限性:**Operator目前仍處于早期階段,在處理制作PPT、管理日歷等復雜任務方面表現欠佳。
2. **未來計劃:**OpenAI計劃公開CUA模型的API,方便開發者構建自己的計算機使用智能體,并提升Operator處理更長、更復雜工作流程的能力。
Operator的出現標志著AI智能體發展進入新的階段,這類智能體能夠顯著降低用戶與計算機交互的門檻,并為用戶帶來更高的效率。
聯系作者
文章來源:智東西
作者微信:
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。