開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版
AIGC動態(tài)歡迎閱讀
原標題:開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版
關鍵字:騰訊,模型,視覺,圖像,區(qū)域
文章來源:量子位
內容字數:0字
內容摘要:
VSA團隊 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。
港中文MMLab、上海AI Lab、騰訊團隊簡易實現了Vision Search Assistant,模型設計簡單,只要兩張RTX3090就可復現。
Vision Search Assistant(VSA)以視覺語言模型(VLM)為基礎,巧妙地將Web搜索能力融入其中,讓VLM內部的知識得到實時更新,使其更加靈活和智能。
目前,VSA已經針對通用圖像進行了實驗,可視化和量化結果良好。但不同類別的圖像各具特色,還可以針對不同種類的圖像(比如表格、醫(yī)學等)構建出更為特定的VSA應用。
更令人振奮的是,VSA的潛力并不僅限于圖像處理。還有更廣闊的可探索空間,比如視頻、3D模型和聲音等領域,期待能將多模態(tài)研究推向新的高度。
讓VLM處理未見過的圖像和新概念大型語言模型(LLM)的出現讓人類可以利用模型的強大零樣本問答能力來獲取陌生知識。
在此基礎上,檢索增強生成(RAG)等技術進一步提高了LLM在知識密集型、開放域問答任務中的表現。然而,VLM在面對未見過的圖像和新概念時,它們往往不能利
原文鏈接:開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...