AIGC動態歡迎閱讀
原標題:我的眼睛就是尺!80億參數OtterHD帶你「清明上河圖」數駱駝!南洋理工華人團隊打造
文章來源:新智元
內容字數:5131字
內容摘要:新智元報道編輯:好困【新智元導讀】最近,由南洋理工華人團隊新提出的80億參數多模態大模型OtterHD,不僅可以搞定讓GPT-4V都發愁的難題,甚至還可以數出來《清明上河圖》(局部)里到底有多少只駱駝!想知道《清明上河圖》里面有多少頭駱駝嗎?來看看這個支持超高清輸入的多模態模型吧。最近,來自南洋理工的華人團隊基于Fuyu-8B打造出了80億參數的多模態大模型OtterHD。論文地址:https://arxiv.org/abs/2311.04219與受限于固定尺寸視覺編碼器的傳統模型不同,OtterHD-8B具有處理靈活輸入尺寸的能力,確保了其在各種推理需求下的通用性。同時,團隊還提出了一個全新的基準測試MagnifierBench,可以細致地評測LLM辨別大尺寸圖像中物體的微小細節和空間關系的能力。結果顯示,OtterHD-8B的表現,尤其是在直接處理高分辨率輸入時,遠遠優于同類模型。效果…
原文鏈接:點此閱讀原文:我的眼睛就是尺!80億參數OtterHD帶你「清明上河圖」數駱駝!南洋理工華人團隊打造
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...