一句話手機(jī)自己打車,開源多智能體AI助手,非蘋果手機(jī)也能玩
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:一句話手機(jī)自己打車,開源多智能體AI助手,非蘋果手機(jī)也能玩
關(guān)鍵字:操作,任務(wù),智能,指令,視頻
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
Mobile-Agent團(tuán)隊(duì) 投稿量子位 | 公眾號(hào) QbitAI一句話讓AI自動(dòng)化操作手機(jī),打個(gè)車已經(jīng)不是難事了。
從官方公布的演示視頻來看,用戶只需要說出目的地,Agent就能夠通過規(guī)劃、決策和反思的流程自動(dòng)化幫用戶完成目的地輸入,呼叫車輛等操作,適用于老人及視障人群,解決他們不會(huì)使用或者無法使用手機(jī)APP的問題。
這項(xiàng)成果來自阿里通義實(shí)驗(yàn)室Mobile-Agent的v2版本更新,具體來說,本次升級(jí)有三大亮點(diǎn):
首次在手機(jī)操作任務(wù)上采用多智能體架構(gòu),并延續(xù)了一代的純視覺方案
多智能體各司其職,實(shí)現(xiàn)了更有效的任務(wù)進(jìn)度追蹤、任務(wù)相關(guān)信息記憶和操作反思
更強(qiáng)大的復(fù)雜指令拆解能力、跨應(yīng)用操作能力和多語言場景操作能力
任務(wù)難度提升,v2也能搞定首先我們關(guān)注一下Mobile-Agent-v2的演示效果。從作者團(tuán)隊(duì)發(fā)布的演示視頻來看,Mobile-Agent-v2能夠完成的任務(wù)難度相比于Mobile-Agent有明顯的提升。下面將展示部分演示視頻中的例子。
在跨應(yīng)用操作任務(wù)上,作者展示是查看軟件中的未讀消息,并按照未讀消息的要求完成任務(wù),其中未讀消息需要分享一個(gè)TikTok中寵物相關(guān)的視頻給
原文鏈接:一句話手機(jī)自己打車,開源多智能體AI助手,非蘋果手機(jī)也能玩
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破