微軟Florence-2官宣開源,一統(tǒng)視覺基礎(chǔ)模型!華人團(tuán)隊(duì)聯(lián)手打造
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:微軟Florence-2官宣開源,一統(tǒng)視覺基礎(chǔ)模型!華人團(tuán)隊(duì)聯(lián)手打造
關(guān)鍵字:模型,任務(wù),數(shù)據(jù),圖像,視覺
文章來源:新智元
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
新智元報(bào)道編輯:桃子
【新智元導(dǎo)讀】等了半年,微軟視覺基礎(chǔ)模型Florence-2終于開源了。它能夠根據(jù)提示,完成字幕、對(duì)象檢測(cè)、分割等各種計(jì)算機(jī)視覺和語言的任務(wù)。網(wǎng)友們實(shí)測(cè)后,堪稱「游戲規(guī)則改變者」。一統(tǒng)視覺界的基礎(chǔ)模型終于開源了!
最近,微軟團(tuán)隊(duì)悄悄放出了Florence-2權(quán)重和代碼,而且任何人皆可試玩。
去年11月,F(xiàn)lorence-2首次發(fā)布之初,憑借驚艷的能力在全網(wǎng)掀起軒然。
只需要一個(gè)提示,就可以指示模型完成諸如字幕、對(duì)象檢測(cè)、分割等各種各樣的CV和CV語言任務(wù)。
Figure的首席執(zhí)行官將其稱之為,「計(jì)算機(jī)視覺領(lǐng)域的重大突破」。在大多數(shù)基準(zhǔn)中,F(xiàn)lorence-2甚至打敗了多數(shù)數(shù)十億美元的模型,就像Phi-3一樣,表明了數(shù)據(jù)質(zhì)量非常重要。
現(xiàn)在,模型的所有權(quán)重代碼,已經(jīng)放在開源平臺(tái)Hugging Face上了,還有MIT許可證,隨取隨用。
體驗(yàn)后的網(wǎng)友稱,它就是許多視覺任務(wù)的游戲規(guī)則改變者,不僅有極高精度,還有炸裂的速度。就看這鋪屏的標(biāo)注能力,簡直強(qiáng)大到令人發(fā)指!
它竟然還可以識(shí)別出鏡子。更多精彩演示Florence-2更多案例如下,高密度的區(qū)域標(biāo)注,能夠?qū)?fù)雜區(qū)
原文鏈接:微軟Florence-2官宣開源,一統(tǒng)視覺基礎(chǔ)模型!華人團(tuán)隊(duì)聯(lián)手打造
聯(lián)系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺(tái),致力于推動(dòng)中國從互聯(lián)網(wǎng)+邁向智能+新紀(jì)元。重點(diǎn)關(guān)注人工智能、機(jī)器人等前沿領(lǐng)域發(fā)展,關(guān)注人機(jī)融合、人工智能和機(jī)器人對(duì)人類社會(huì)與文明進(jìn)化的影響,領(lǐng)航中國新智能時(shí)代。