商湯在交互這塊玩了個大的
原標題:“造假”齊白石的《蝦》,被國產AI一眼識破!
文章來源:量子位
內容字數:6012字
商湯日日新大模型:更快、更準、更好的人工智能交互體驗
本文總結了量子位對商湯最新發布的日日新融合大模型交互版(SenseNova-5o,簡稱“新5o”)的測評文章。該模型主打多模態能力,旨在提升AI交互質量,其顯著特點是速度快、準確性高、體驗好。
1. “新5o”的驚艷表現
文章通過多個例子展現了“新5o”的強大能力:它能識別出用真蝦“造假”的齊白石畫作,并推測出另一種可能性——模型;它能準確識別并解讀繁體書法作品“寧靜致遠”,并解釋閱讀方向;它在交互過程中延遲極低,通常在2秒以內,并能模擬人類的語氣、停頓和情緒,極大提升了交互的真實感和流暢度。
2. 超強記憶力與多模態能力
測試顯示,“新5o”擁有不低于5分鐘的記憶力。它能準確記住并回憶起之前看到的菜品和食材,即使在對話過程中被打斷也能迅速回應。這不僅僅是信息的存儲,更體現了其深入的理解和回憶能力。 此外,“新5o”還能玩“大家來找茬”游戲,準確指出圖片中與年代不相符的物品。
3. 輕松應對復雜任務
文章展示了“新5o”在解決復雜問題上的能力。它能解答2024年北京高考物理選擇題,并對答案進行詳細解析;它還能識別并講解復雜的神經網絡架構圖。 甚至,文章還安排了“新5o”與GPT-4進行對話,展現了其自然流暢的交互能力,并且在速度上略勝一籌。
4. 原生融合多模態技術的突破
“新5o”的強大能力源于其底層技術——國內首個原生融合多模態模型。這不同于簡單的模態融合,它在模型架構和訓練過程中實現了多種模態信息的深度融合,打破了模態間的壁壘,從而更有效地處理復雜任務。商湯通過海量數據訓練,包括利用逆渲染等技術合成數據,并構建大量跨模態任務,最終實現了模型對多模態信息的整合理解和分析能力。
5. 亮眼的評測成績與未來應用
“新5o”在SuperCLUE和OpenCompass兩個權威榜單上取得了優異成績,展現了其在語言、推理和多模態信息處理方面的領先水平。 未來,原生融合多模態技術將在自動駕駛、具身智能等領域發揮重要作用,例如提升自動駕駛安全性,增強智能體對環境的感知理解能力。
6. 結語
商湯的“新5o”在AI交互領域取得了顯著突破,其快速、準確、真實的交互體驗令人印象深刻。原生融合多模態技術的應用,為AI發展指明了新的方向,也預示著未來更加智能、便捷的人機交互體驗。
聯系作者
文章來源:量子位
作者微信:
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破