AIGC動態歡迎閱讀
原標題:馬斯克新作!Grok-1.5V多模態模型震撼發布:數字與物理世界完美融合
關鍵字:模型,用戶,世界,基準,代碼
文章來源:新智元
內容字數:8824字
內容摘要:
新智元報道編輯:編輯部
【新智元導讀】馬斯克xAI的多模態模型Grok-1.5V橫空出世了!不僅多項基準測試超越GPT-4V,而且看懂梗圖寫Python代碼也都不在話下。并且,為了評估模型對于真實世界的空間理解,xAI此次還推出了新基準RealWorldQA。馬斯克的第一代多模態模型Grok-1.5V,終于來了!
Grok 1.5V,號稱是能連接數字世界和物理世界。
除了文本功能,它還能處理文檔、圖標、屏幕截圖和照片之類的各種視覺信息。
很快,所有早期測試者和所有Grok用戶就能用上Grok 1.5V了。
英偉達高級科學家Jim Fan發現了Grok-1.5V的「最大亮點」:在他看來,Grok-1.5V最令人感興趣的,就是解決自動駕駛邊緣案例的潛力。
如果使用語言進行「思維鏈」,幫助汽車分解復雜場景,用規則和反事實進行推理,解釋其決策,Grok-1.5V就能將像素->動作映射提升為像素->語言->動作。
由此,特斯拉FSD V13就很有可能會理解語言Token!
特斯拉的優勢是,具有高度成熟的數據管線,因此,就不難用高質量的人類解釋痕跡來標記大量邊緣案例,在多模態FSD推理上,微調G
原文鏈接:馬斯克新作!Grok-1.5V多模態模型震撼發布:數字與物理世界完美融合
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...