GLM-PC是一款由智譜科技研發(fā)的先進(jìn)通用Agent,基于CogAgent視覺(jué)多模態(tài)模型,旨在模擬人類操作計(jì)算機(jī),實(shí)現(xiàn)“無(wú)人駕駛”PC的技術(shù)創(chuàng)新。它能夠自主執(zhí)行多種任務(wù),包括安排會(huì)議、處理文檔和搜索網(wǎng)頁(yè)等,并支持遠(yuǎn)程與定時(shí)操作。GLM-PC通過(guò)模擬人眼的視覺(jué)、腦部的思考及手部的執(zhí)行,展現(xiàn)出跨平臺(tái)的強(qiáng)大能力,無(wú)需依賴HTML或API,具備更高的能力上限。目前,該產(chǎn)品正處于內(nèi)測(cè)階段,致力于提升工具的使用能力并探索自我學(xué)習(xí)的潛力。
GLM-PC是什么
GLM-PC是智譜科技推出的一款通用Agent,基于CogAgent視覺(jué)多模態(tài)模型,旨在模擬人類如何使用計(jì)算機(jī),從而實(shí)現(xiàn)“無(wú)人駕駛”的技術(shù)探索。它不僅可以執(zhí)行如會(huì)議安排、文檔處理和網(wǎng)頁(yè)搜索總結(jié)等任務(wù),還能遠(yuǎn)程和定時(shí)操作。GLM-PC通過(guò)模擬人眼的視覺(jué)、腦部的思維和手部的操作來(lái)進(jìn)行計(jì)算機(jī)使用,具備跨平臺(tái)能力,且不依賴于HTML或API,擁有更高的能力上限。該產(chǎn)品目前正在內(nèi)測(cè)中,旨在提升工具的使用效率并探索自我學(xué)習(xí)的可能性。
GLM-PC的主要功能
- 會(huì)議助手:協(xié)助用戶安排和參與會(huì)議,并提供會(huì)議總結(jié)。
- 文檔處理:支持文檔的下載、發(fā)送以及內(nèi)容的理解和總結(jié)。
- 網(wǎng)頁(yè)搜索與總結(jié):在特定平臺(tái)(如微信公眾號(hào)、知乎、小紅書等)上搜索關(guān)鍵詞,并完成信息的閱讀和總結(jié)。
- 遠(yuǎn)程與定時(shí)操作:用戶可以通過(guò)手機(jī)遠(yuǎn)程發(fā)送指令,讓GLM-PC自主完成電腦操作,或在未來(lái)特定時(shí)間點(diǎn)執(zhí)行任務(wù)。
- 隱形工作模式:在用戶工作時(shí),GLM-PC可以在不占用屏幕的情況下自主完成工作,釋放用戶的屏幕使用權(quán)。
產(chǎn)品官網(wǎng)
希望體驗(yàn)GLM-PC的用戶可以訪問(wèn)其官方網(wǎng)站進(jìn)行申請(qǐng),內(nèi)測(cè)申請(qǐng)地址為「邀請(qǐng)?bào)w驗(yàn)」,需填寫問(wèn)卷以申請(qǐng)內(nèi)測(cè)。
如何使用GLM-PC
- 安裝與設(shè)置:
- 確保您的電腦為搭載M系列芯片的Mac設(shè)備,推薦使用M1或M3系列。
- 訪問(wèn)GLM-PC的官方網(wǎng)站下載安裝包。
- 按照網(wǎng)站指示完成下載和安裝。
- 用戶授權(quán):首次使用時(shí)需要授權(quán)GLM-PC訪問(wèn)部分電腦功能,以便其執(zhí)行任務(wù)。
- 輸入指令:打開(kāi)GLM-PC應(yīng)用后,在對(duì)話框中輸入操作指令,例如“查詢B站熱門內(nèi)容”或“預(yù)定騰訊會(huì)議并發(fā)送邀請(qǐng)”。
- 執(zhí)行任務(wù):GLM-PC會(huì)評(píng)估指令并制定操作計(jì)劃,自動(dòng)執(zhí)行相應(yīng)任務(wù),例如打開(kāi)瀏覽器進(jìn)行搜索或打開(kāi)日歷應(yīng)用安排會(huì)議。
- 確認(rèn)敏感操作:在遇到敏感的操作時(shí),GLM-PC會(huì)暫停并等待用戶確認(rèn),用戶需點(diǎn)擊控制條上的繼續(xù)按鈕以繼續(xù)任務(wù)。
- 遠(yuǎn)程操作:如果需要通過(guò)手機(jī)遠(yuǎn)程控制電腦,請(qǐng)?jiān)贕LM-PC設(shè)置中開(kāi)啟“掛起模式”,并發(fā)送遠(yuǎn)程指令。
GLM-PC的應(yīng)用場(chǎng)景
- 信息處理:適用于微信、飛書、釘釘?shù)绕脚_(tái),與聯(lián)系人或群聊發(fā)送信息。
- 會(huì)議安排:支持騰訊會(huì)議、飛書會(huì)議等,安排會(huì)議日程并發(fā)送邀請(qǐng);可定時(shí)加入指定會(huì)議。
- 文檔處理:支持文檔的下載、發(fā)送及內(nèi)容的理解與總結(jié)。
- 網(wǎng)頁(yè)內(nèi)容處理:打開(kāi)瀏覽器,在百度、公眾號(hào)、知乎、小紅書等平臺(tái)進(jìn)行關(guān)鍵詞搜索,完成閱讀、總結(jié)或翻譯。
- 電子商務(wù):能夠在淘寶上購(gòu)買特定尺碼的商品并完成交易流程。