AIGC動態歡迎閱讀
原標題:超越 GPT-4V 和 Gemini Pro!HyperGAI 發布最新多模態大模型 HPT,已開源
關鍵字:模型,視覺,示例,基準,語言
文章來源:夕小瑤科技說
內容字數:5356字
內容摘要:
夕小瑤科技說 原創作者 | 任同學隨著AI從有限數據邁向真實世界,極速增長的數據規模不僅賦予了模型令人驚喜的能力,也給多模態模型提供了更多的可能性。OpenAI在發布GPT-4V時就已經明確表示:
將額外模態(如圖像輸入)融入大語言模型(LLMs)被認為是 AI 研究和發展的一個關鍵新領域。
昨天,HyperGAI 研究團隊推出了 HPT(Hyper-Pretrained Transformers)系列,包含兩個模型,HPT Air 和 HPT Pro。
其中HPT Pro 在部分基準測試中已經超越了 GPT-4V 和 Gemini Pro 的表現。同時,高效的版本 HPT Air 也相當強大,在同等小規模的模型中效果達到了最優,且已經開源。
圖1.HPT(Hyper-Pretrained Transformers)模型結構的介紹。
項目地址:
Github: https://github.com/hyperGAI/HPT
huggingface: https://huggingface.co/HyperGAI/HPT
過去模型只處理單一類型的數據,如文本、圖像或者音頻,往往單一模態下
原文鏈接:超越 GPT-4V 和 Gemini Pro!HyperGAI 發布最新多模態大模型 HPT,已開源
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:更快的AI前沿,更深的行業洞見。聚集25萬AI一線開發者、互聯網中高管和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備行業嗅覺與報道深度。