阿里全新Agent玩轉手機:刷短視頻自主點贊評論,還學會了跨應用操作
AIGC動態(tài)歡迎閱讀
原標題:阿里全新Agent玩轉手機:刷短視頻自主點贊評論,還學會了跨應用操作
關鍵字:報告,操作,任務,指令,模型
文章來源:量子位
內容字數:2920字
內容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAI會操縱手機的智能體,又迎來了全新升級!
新的Agent打破了APP的界限,能夠跨應用完成任務,成為了真·超級手機助手。
比如根據指示,它可以自行搜索籃球比賽的結果,然后根據賽況在備忘錄中撰寫文稿。
來自阿里的一篇最新論文,展示了全新手機操縱智能體框架Mobile-Agent,可以玩轉10款應用,還能跨越APP完成用戶交給的任務,而且即插即用無需訓練。
依托多模態(tài)大模型,整個操縱過程完全基于視覺能力實現,不再需要給APP編寫XML操作文檔。
在Mobile-Agent還只有演示視頻的時候,就已經讓一眾網友為之驚艷:
和樹莓派結合到一起,將完爆Rabbit R1(一款大模型硬件)。
想象一下如果它支持語音操縱,并且學會了說話……
那么,Mobile-Agent操縱手機到底有多6呢?
支持跨應用任務目前,Mobile-Agent已經學會了十個APP的操作,以及一些跨應用任務。
比如搜索導航路線、幫忙在購物網站下單,它總能精準找到搜索框并完成目標。
也可以“刷”視頻,然后點贊評論,看上去就像熟練的老手。
甚至是安裝應用、修改系統(tǒng)設置,也難不倒
原文鏈接:阿里全新Agent玩轉手機:刷短視頻自主點贊評論,還學會了跨應用操作
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業(yè)新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...