一句話手機自己打車,開源多智能體AI助手,非蘋果手機也能玩

AIGC動態(tài)歡迎閱讀
原標(biāo)題:一句話手機自己打車,開源多智能體AI助手,非蘋果手機也能玩
關(guān)鍵字:操作,任務(wù),智能,指令,視頻
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
Mobile-Agent團隊 投稿量子位 | 公眾號 QbitAI一句話讓AI自動化操作手機,打個車已經(jīng)不是難事了。
從官方公布的演示視頻來看,用戶只需要說出目的地,Agent就能夠通過規(guī)劃、決策和反思的流程自動化幫用戶完成目的地輸入,呼叫車輛等操作,適用于老人及視障人群,解決他們不會使用或者無法使用手機APP的問題。
這項成果來自阿里通義實驗室Mobile-Agent的v2版本更新,具體來說,本次升級有三大亮點:
首次在手機操作任務(wù)上采用多智能體架構(gòu),并延續(xù)了一代的純視覺方案
多智能體各司其職,實現(xiàn)了更有效的任務(wù)進度追蹤、任務(wù)相關(guān)信息記憶和操作反思
更強大的復(fù)雜指令拆解能力、跨應(yīng)用操作能力和多語言場景操作能力
任務(wù)難度提升,v2也能搞定首先我們關(guān)注一下Mobile-Agent-v2的演示效果。從作者團隊發(fā)布的演示視頻來看,Mobile-Agent-v2能夠完成的任務(wù)難度相比于Mobile-Agent有明顯的提升。下面將展示部分演示視頻中的例子。
在跨應(yīng)用操作任務(wù)上,作者展示是查看軟件中的未讀消息,并按照未讀消息的要求完成任務(wù),其中未讀消息需要分享一個TikTok中寵物相關(guān)的視頻給
原文鏈接:一句話手機自己打車,開源多智能體AI助手,非蘋果手機也能玩
聯(lián)系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

粵公網(wǎng)安備 44011502001135號