AI預(yù)測(cè)論文能不能中,8B超越70B大模型,港大發(fā)布圖文融合多智能體GraphAgent
連接結(jié)構(gòu)化圖數(shù)據(jù)與非結(jié)構(gòu)化文本數(shù)據(jù)
原標(biāo)題:AI預(yù)測(cè)論文能不能中,8B超越70B大模型,港大發(fā)布圖文融合多智能體GraphAgent
文章來源:量子位
內(nèi)容字?jǐn)?shù):9934字
港大黃超教授團(tuán)隊(duì)提出GraphAgent:AI預(yù)測(cè)論文能否中
香港大學(xué)黃超教授團(tuán)隊(duì)研發(fā)了一種名為GraphAgent的多智能體自動(dòng)化框架,能夠預(yù)測(cè)學(xué)術(shù)論文的錄取可能性,并具備更廣泛的預(yù)測(cè)和生成能力。該框架通過融合大語(yǔ)言模型(LLM)和圖語(yǔ)言模型的優(yōu)勢(shì),在處理結(jié)構(gòu)化圖數(shù)據(jù)和非結(jié)構(gòu)化文本數(shù)據(jù)方面取得了顯著成果,并在零樣本學(xué)習(xí)和跨域泛化等方面展現(xiàn)出優(yōu)勢(shì)。
1. GraphAgent的核心挑戰(zhàn)與架構(gòu)
現(xiàn)實(shí)世界的數(shù)據(jù)呈現(xiàn)出結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的混合特性,GraphAgent旨在解決以下三大挑戰(zhàn):異構(gòu)數(shù)據(jù)融合、多層次關(guān)系理解和任務(wù)多元化。為了應(yīng)對(duì)這些挑戰(zhàn),GraphAgent采用了一個(gè)由三大核心智能體組成的框架:
- 圖生成智能體 (Graph Generator Agent):負(fù)責(zé)構(gòu)建語(yǔ)義知識(shí)圖譜 (SKG),通過兩階段迭代機(jī)制從非結(jié)構(gòu)化文本中提取和整合深層語(yǔ)義信息。首先,它采用自適應(yīng)分層策略識(shí)別知識(shí)實(shí)體;然后,它增強(qiáng)知識(shí)表示的豐富度和準(zhǔn)確性,構(gòu)建完整的知識(shí)聯(lián)系。
- 任務(wù)規(guī)劃智能體 (Task Planning Agent):作為框架的決策核心,它通過三階段處理機(jī)制完成復(fù)雜任務(wù)的規(guī)劃和分解。包括意圖識(shí)別與任務(wù)制定、圖結(jié)構(gòu)標(biāo)準(zhǔn)化處理以及圖文特征融合。
- 任務(wù)執(zhí)行智能體 (Task Execution Agent):作為框架的核心執(zhí)行單元,它通過三維處理架構(gòu)實(shí)現(xiàn)任務(wù)的精準(zhǔn)執(zhí)行和性能優(yōu)化。包括智能化任務(wù)處理機(jī)制、深度圖指令對(duì)齊技術(shù)和漸進(jìn)式學(xué)習(xí)策略。
這三大智能體協(xié)同運(yùn)作,實(shí)現(xiàn)了圖結(jié)構(gòu)與語(yǔ)義信息的深度融合,支持預(yù)測(cè)型和生成型等多樣化任務(wù)。
2. GraphAgent的實(shí)驗(yàn)結(jié)果與優(yōu)勢(shì)
研究團(tuán)隊(duì)在六個(gè)基準(zhǔn)數(shù)據(jù)集上對(duì)GraphAgent進(jìn)行了評(píng)估,涵蓋了節(jié)點(diǎn)分類、文本生成、論文錄用預(yù)測(cè)等任務(wù)。結(jié)果顯示,GraphAgent在各種任務(wù)中均取得了優(yōu)異的性能,僅用8B參數(shù)規(guī)模就達(dá)到了與GPT-4、Gemini等大型封閉源模型相當(dāng)?shù)男阅芩健?/p>
GraphAgent的主要優(yōu)勢(shì)體現(xiàn)在以下幾個(gè)方面:
- 卓越的零樣本學(xué)習(xí)和跨域泛化能力:在低資源場(chǎng)景下表現(xiàn)出色,并在不同數(shù)據(jù)集上展現(xiàn)了強(qiáng)大的遷移學(xué)習(xí)能力。
- 高效的語(yǔ)義理解能力:能夠精準(zhǔn)把握復(fù)雜語(yǔ)義依賴關(guān)系,在各項(xiàng)評(píng)估指標(biāo)上超越了Llama3-70b和Qwen2-72b等大規(guī)模模型。
- 強(qiáng)大的文本生成能力:在圖增強(qiáng)文本生成任務(wù)中,其困惑度(PPL)等核心指標(biāo)顯著優(yōu)于基線模型,并在與GPT-4的對(duì)比中展現(xiàn)出優(yōu)勢(shì)。
3. 未來研究方向
團(tuán)隊(duì)未來的研究方向包括:多模態(tài)能力拓展(將視覺信息整合到框架中)、模型性能優(yōu)化(模型壓縮和計(jì)算資源優(yōu)化)以及應(yīng)用場(chǎng)景擴(kuò)展(科學(xué)研究輔助和商業(yè)智能分析等)。
總而言之,GraphAgent是一個(gè)具有創(chuàng)新性的多智能體框架,它在預(yù)測(cè)和生成任務(wù)中展現(xiàn)了強(qiáng)大的能力,為人工智能在學(xué)術(shù)研究和商業(yè)領(lǐng)域的應(yīng)用提供了新的可能性。
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破