OpenAI智能體新線索曝光!網(wǎng)友:新ChatGPT時(shí)刻要來(lái)了
多個(gè)基準(zhǔn)跑分超過(guò)Claude智能體

原標(biāo)題:OpenAI智能體新線索曝光!網(wǎng)友:新ChatGPT時(shí)刻要來(lái)了
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):3327字
OpenAI智能體時(shí)代來(lái)臨?Operator即將上線!
OpenAI的智能體“Operator”即將問(wèn)世的消息引發(fā)熱議。據(jù)爆料,該智能體已在Mac版ChatGPT桌面應(yīng)用中隱藏了啟用/禁用選項(xiàng),能夠接管用戶PC自主執(zhí)行操作,例如編碼、訂餐、做攻略等。
1. Operator性能超越競(jìng)爭(zhēng)對(duì)手
多位博主和“情報(bào)員”證實(shí)了Operator的內(nèi)測(cè)消息,并曝光了其與其他競(jìng)爭(zhēng)對(duì)手(如Anthropic的Claude)的性能對(duì)比。在多個(gè)基準(zhǔn)測(cè)試中,Operator展現(xiàn)出優(yōu)異的自動(dòng)化任務(wù)執(zhí)行能力,在部分測(cè)試中甚至超越了人類(lèi)操作水平,例如在WebVoyager測(cè)試中取得了87%的好成績(jī),略高于人類(lèi)的85.3%。 但在其他測(cè)試,例如OSWorld和WebArena,Operator的表現(xiàn)雖然領(lǐng)先于Claude,但仍未達(dá)到人類(lèi)水平的一半。
2. Operator與GPT-4o的區(qū)別
有網(wǎng)友將Operator與GPT-4o進(jìn)行比較。有網(wǎng)友指出兩者區(qū)別在于:Operator是自主操作,而GPT-4o是輔助人類(lèi)操作,教用戶做事。在安全性方面,GPT-4o在拒絕非法活動(dòng)方面表現(xiàn)完美,而Operator則略遜一籌。
3. OpenAI對(duì)Agent的重點(diǎn)布局
早在去年,便有消息稱OpenAI計(jì)劃推出Operator。OpenAI CEO奧特曼也在新年目標(biāo)中將Agent列為重點(diǎn)。近期OpenAI推出的ChatGPT新功能“Tasks”也被視為Agent的初級(jí)階段。這表明OpenAI正大力投入Agent領(lǐng)域。
4. Agent市場(chǎng)前景廣闊
市場(chǎng)研究公司預(yù)測(cè),AI Agent市場(chǎng)規(guī)模到2030年將達(dá)到471億美元。 科技巨頭如英偉達(dá)也對(duì)Agent技術(shù)表示看好,認(rèn)為未來(lái)公司IT部門(mén)將成為Agent人力資源部門(mén),這預(yù)示著Agent技術(shù)在未來(lái)將得到廣泛應(yīng)用,并帶動(dòng)相關(guān)技術(shù)人才需求的增長(zhǎng)。
5. 總結(jié)
Operator的即將上線標(biāo)志著OpenAI在智能體領(lǐng)域邁出了重要一步。其優(yōu)異的性能和廣闊的市場(chǎng)前景,預(yù)示著2025年將成為Agent技術(shù)爆發(fā)之年,企業(yè)和個(gè)人都將面臨新的機(jī)遇與挑戰(zhàn)。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號(hào)