“造假”齊白石的《蝦》,被國(guó)產(chǎn)AI一眼識(shí)破!
商湯在交互這塊玩了個(gè)大的
原標(biāo)題:“造假”齊白石的《蝦》,被國(guó)產(chǎn)AI一眼識(shí)破!
文章來(lái)源:量子位
內(nèi)容字?jǐn)?shù):6012字
商湯日日新大模型:更快、更準(zhǔn)、更好的人工智能交互體驗(yàn)
本文總結(jié)了量子位對(duì)商湯最新發(fā)布的日日新融合大模型交互版(SenseNova-5o,簡(jiǎn)稱(chēng)“新5o”)的測(cè)評(píng)文章。該模型主打多模態(tài)能力,旨在提升AI交互質(zhì)量,其顯著特點(diǎn)是速度快、準(zhǔn)確性高、體驗(yàn)好。
1. “新5o”的驚艷表現(xiàn)
文章通過(guò)多個(gè)例子展現(xiàn)了“新5o”的強(qiáng)大能力:它能識(shí)別出用真蝦“造假”的齊白石畫(huà)作,并推測(cè)出另一種可能性——模型;它能準(zhǔn)確識(shí)別并解讀繁體書(shū)法作品“寧?kù)o致遠(yuǎn)”,并解釋閱讀方向;它在交互過(guò)程中延遲極低,通常在2秒以?xún)?nèi),并能模擬人類(lèi)的語(yǔ)氣、停頓和情緒,極大提升了交互的真實(shí)感和流暢度。
2. 超強(qiáng)記憶力與多模態(tài)能力
測(cè)試顯示,“新5o”擁有不低于5分鐘的記憶力。它能準(zhǔn)確記住并回憶起之前看到的菜品和食材,即使在對(duì)話(huà)過(guò)程中被打斷也能迅速回應(yīng)。這不僅僅是信息的存儲(chǔ),更體現(xiàn)了其深入的理解和回憶能力。 此外,“新5o”還能玩“大家來(lái)找茬”游戲,準(zhǔn)確指出圖片中與年代不相符的物品。
3. 輕松應(yīng)對(duì)復(fù)雜任務(wù)
文章展示了“新5o”在解決復(fù)雜問(wèn)題上的能力。它能解答2024年北京高考物理選擇題,并對(duì)答案進(jìn)行詳細(xì)解析;它還能識(shí)別并講解復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)圖。 甚至,文章還安排了“新5o”與GPT-4進(jìn)行對(duì)話(huà),展現(xiàn)了其自然流暢的交互能力,并且在速度上略勝一籌。
4. 原生融合多模態(tài)技術(shù)的突破
“新5o”的強(qiáng)大能力源于其底層技術(shù)——國(guó)內(nèi)首個(gè)原生融合多模態(tài)模型。這不同于簡(jiǎn)單的模態(tài)融合,它在模型架構(gòu)和訓(xùn)練過(guò)程中實(shí)現(xiàn)了多種模態(tài)信息的深度融合,打破了模態(tài)間的壁壘,從而更有效地處理復(fù)雜任務(wù)。商湯通過(guò)海量數(shù)據(jù)訓(xùn)練,包括利用逆渲染等技術(shù)合成數(shù)據(jù),并構(gòu)建大量跨模態(tài)任務(wù),最終實(shí)現(xiàn)了模型對(duì)多模態(tài)信息的整合理解和分析能力。
5. 亮眼的評(píng)測(cè)成績(jī)與未來(lái)應(yīng)用
“新5o”在SuperCLUE和OpenCompass兩個(gè)權(quán)威榜單上取得了優(yōu)異成績(jī),展現(xiàn)了其在語(yǔ)言、推理和多模態(tài)信息處理方面的領(lǐng)先水平。 未來(lái),原生融合多模態(tài)技術(shù)將在自動(dòng)駕駛、具身智能等領(lǐng)域發(fā)揮重要作用,例如提升自動(dòng)駕駛安全性,增強(qiáng)智能體對(duì)環(huán)境的感知理解能力。
6. 結(jié)語(yǔ)
商湯的“新5o”在AI交互領(lǐng)域取得了顯著突破,其快速、準(zhǔn)確、真實(shí)的交互體驗(yàn)令人印象深刻。原生融合多模態(tài)技術(shù)的應(yīng)用,為AI發(fā)展指明了新的方向,也預(yù)示著未來(lái)更加智能、便捷的人機(jī)交互體驗(yàn)。
聯(lián)系作者
文章來(lái)源:量子位
作者微信:
作者簡(jiǎn)介:追蹤人工智能新趨勢(shì),關(guān)注科技行業(yè)新突破