AIGC動態歡迎閱讀
原標題:字節攜港大南大升級 LLaVA-NeXT:借 LLaMA-3 和 Qwen-1.5 脫胎換骨,輕松追平 GPT-4V
關鍵字:騰訊,模型,字節跳動,侵權,解讀
文章來源:算法邦
內容字數:7543字
內容摘要:
【2024騰訊云生成式AI產業應用峰會】定檔5月17日,完整議程已公布,騰訊集團高級執行副總款、云與智慧產業事業群CEO湯道生等6位騰訊云高管、負責人聚焦大模型落地場景需求,將發布混元大模型最新進展,以及15+款重磅產品,歡迎報名預約直播。文章轉載自公眾號:AI科技大本營,本文只做學術/技術分享,如有侵權,聯系刪文。
2023 年,威斯康星大學麥迪遜分校、微軟研究院和哥倫比亞大學的研究人員共同開發的 LLaVA 首次亮相,彼時它被視為一個端到端訓練的大型多模態模型,展現了在視覺與語言融合領域的潛力。今年 1 月 30 日,LLaVA 的后續版本 LLaVA-NeXT 推出,它利用了當時最強的 LLM——Yi-34B,進一步增強了多模態理解、OCR(光學字符識別)和世界知識等方面的能力,甚至在一些基準測試上與 Gemini-Pro 和 GPT-V 相媲美。在全世界默默等待 GPT-5 消息的這幾個月里,開源社區出現了 LLaMA-3 和 Qwen-1.5 等語言能力更為強大的模型,阿里的 Qwen 更是在昨天發布了 2.5 版本,劍指 GPT-4。因此,LLaVA-NeXT 的研究團隊開
原文鏈接:字節攜港大南大升級 LLaVA-NeXT:借 LLaMA-3 和 Qwen-1.5 脫胎換骨,輕松追平 GPT-4V
聯系作者
文章來源:算法邦
作者微信:allplusai
作者簡介:智猩猩矩陣賬號之一,聚焦生成式AI,重點關注模型與應用。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...