AIGC動態歡迎閱讀
原標題:馬斯克發布Grok-1.5V!xAI首款多模態大模型,能看圖寫代碼、算熱量
關鍵字:甲板,模型,代碼,團隊,能力
文章來源:智東西
內容字數:5527字
內容摘要:
一個月內,馬斯克三個大模型大招。
作者|ZeR0
編輯|漠影
智東西4月13日消息,剛剛,馬斯克的大模型創企xAI推出了其首款多模態大模型Grok-1.5V。
這是OpenAI的大語言模型勁敵之一。如今,除了文本功能外,Grok現在還可以處理各種各樣的視覺信息,包括文檔、圖表、圖表、屏幕截圖、照片,并能進行多學科推理。
xAI重點展示了Grok-1.5V的7個示例,包括:將手繪圖表轉換成Python代碼、看食品標簽計算卡路里、根據孩子的繪畫講個睡前故事、解釋梗圖、將表格轉換成csv格式、為生活日常問題答疑解惑、解決代碼問題。
至此,xAI正式加入前沿多模態大模型的競賽。
與GPT-4V、Claude 3 Sonnet、Claude 3 Opus、Gemini Pro 1.5相比,Grok-1.5V的表現不相上下,在一些基準測試中略勝一籌。
尤其是在RealWorld,用于衡量真實世界空間理解能力的QA基準測試中,Grok明顯優于同類模型。xAI團隊對Grok理解物理世界的能力感到特別興奮。對于上面的數據集,該團隊在沒有思維鏈提示的情況下在零樣本設置中評估Grok。
xAI宣布向社區
原文鏈接:馬斯克發布Grok-1.5V!xAI首款多模態大模型,能看圖寫代碼、算熱量
聯系作者
文章來源:智東西
作者微信:zhidxcom
作者簡介:智能產業新媒體!智東西專注報道人工智能主導的前沿技術發展,和技術應用帶來的千行百業產業升級。聚焦智能變革,服務產業升級。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...