AI項目和框架

OpenCoder

OpenCoder是墨爾本大學(xué)、復(fù)旦大學(xué)等高校研究人員聯(lián)合無限光年推出的開源代碼大型語言模型(LLM),能提升開源代碼LLM的性能至專有模型水平,推動代碼AI研究的...
閱讀原文

Infinity-MM

Infinity-MM是智源研究院推出的千萬級多模態(tài)指令數(shù)據(jù)集,包含4300萬條樣本,數(shù)據(jù)量達10TB。數(shù)據(jù)集經(jīng)過質(zhì)量過濾和去重,確保高質(zhì)量和多樣性,能提升開源視覺-...
閱讀原文

FabricDiffusion

FabricDiffusion是谷歌和卡內(nèi)基梅隆大學(xué)共同推出的高保真度3D服裝生成技術(shù),能將現(xiàn)實世界中2D服裝圖像的紋理和印花高質(zhì)量地轉(zhuǎn)移到任意形狀的3D服裝模型上。Fa...
閱讀原文

HourVideo

HourVideo是斯坦福大學(xué)李飛飛和吳佳俊團隊推出的長視頻理解基準數(shù)據(jù)集,包含500個第一人稱視角視頻,時長20至120分鐘,覆蓋77種日常活動,能評估多模態(tài)模型對...
閱讀原文

App Intents

App Intents是蘋果推出的支持開發(fā)者在iOS、macOS等平臺上集成Siri和Apple Intelligence的新框架,實現(xiàn)應(yīng)用功能與系統(tǒng)體驗(如Siri、Spotlight搜索、快捷指令...
閱讀原文

DimensionX

DimensionX是香港科技大學(xué)、清華大學(xué)和生數(shù)科技共同推出的框架,能從單張圖片生成高逼真度的3D和4D場景,基于視頻擴散技術(shù)實現(xiàn)對空間和時間維度的精確控制。...
閱讀原文

SeedEdit

SeedEdit是字節(jié)跳動豆包大模型團隊推出的通用圖像編輯模型,基于簡單的自然語言指令編輯圖像,包括修圖、換裝、美化、風格轉(zhuǎn)換及在指定區(qū)域添加或刪除元素等...
閱讀原文

HK-O1aw

HK-O1aw是香港生成式AI研發(fā)中心(HKGAI)旗下AI for Reasoning團隊(HKAIR)與北京大學(xué)對齊團隊(PKU-Alignment Team)合作推出的全球首個慢思考范式法律推理大模型...
閱讀原文

AnimePro FLUX

AnimePro FLUX是基于Apache 2.0許可的動漫風格圖像生成模型,專為生成高質(zhì)量二次元插畫設(shè)計。AnimePro FLUX基于Flux.1 Shnell模型微調(diào),克服DEV版本的許可限...
閱讀原文

VideoChat

VideoChat是開源的實時數(shù)字人對話系統(tǒng),支持語音輸入和實時對話功能。用戶自定義數(shù)字人的形象和音色,無需訓(xùn)練即可進行音色克隆,首包延遲可低至3秒,適用于...
閱讀原文

TableGPT2

TableGPT2是浙江大學(xué)推出的新型大型多模態(tài)模型,針對表格數(shù)據(jù)的整合與處理。首次將結(jié)構(gòu)化數(shù)據(jù)作為獨立模態(tài)進行訓(xùn)練,直接理解并操作數(shù)據(jù)庫、Excel等數(shù)據(jù),執(zhí)...
閱讀原文

GenXD

GenXD是新加坡國立大學(xué)和微軟公司共同推出的3D-4D聯(lián)合生成框架,能從任意數(shù)量的條件圖像中生成高質(zhì)量的3D和4D場景??蚣苡靡粋€數(shù)據(jù)整理流程從視頻中提取相機...
閱讀原文

AlphaFold 3

AlphaFold 3是谷歌DeepMind團隊推出的AI模型,能預(yù)測蛋白質(zhì)、核酸(DNA和RNA)、小分子、離子及修飾殘基等生物分子的三維結(jié)構(gòu)。模型在結(jié)構(gòu)預(yù)測的準確性上取得...
閱讀原文
1143144145