AI項(xiàng)目和框架

ExAvatar

ExAvatar是DGIST和Meta公司Codec Avatars Lab聯(lián)合推出的3D數(shù)字形象生成模型,通過簡短視頻克隆人像并轉(zhuǎn)化為3D數(shù)字形象。支持手機(jī)掃描快速捕捉全身動(dòng)作和表情...
閱讀原文

Tailor

Tailor是免費(fèi)開源的AI視頻編輯工具,集成了人臉識(shí)別、語音識(shí)別等智能技術(shù),提供視頻編輯、生成和優(yōu)化三大功能。能實(shí)現(xiàn)人臉剪輯、語音剪輯、口播生成、字幕和...
閱讀原文

StableDrag

StableDrag是騰訊聯(lián)合南京大學(xué)推出的AI圖像編輯框架。讓拖拽圖片變得既穩(wěn)又準(zhǔn),就像給圖片裝上了精準(zhǔn)的GPS。無論你想怎么調(diào)整,StableDrag都能幫你準(zhǔn)確無誤地...
閱讀原文

La Plateforme

La Plateforme是Mistral AI公司推出AI開發(fā)工具,支持用戶通過微調(diào)來優(yōu)化AI模型,更好地適應(yīng)特定的應(yīng)用場景和數(shù)據(jù)集。在La Plateforme上用戶能夠用自己的數(shù)據(jù)...
閱讀原文

智譜AI開放平臺(tái)

智譜AI開放平臺(tái) 是一個(gè)面向開發(fā)者的大模型開發(fā)平臺(tái)。整合了先進(jìn)的模型能力、豐富的開發(fā)資源、自定義知識(shí)庫及應(yīng)用體驗(yàn)中心,助力開發(fā)者利用GLM大模型的技術(shù)潛...

GLM-4-long

GLM-4-long 是智譜AI推出的200萬字長文本模型,現(xiàn)已在 智譜AI開放平臺(tái) BigModel 上開放API調(diào)用。支持超長輸入專為處理超長文本和記憶型任務(wù)設(shè)計(jì),上下文長度...
閱讀原文

Qwen2-Audio

Qwen2-Audio是阿里通義千問團(tuán)隊(duì)最新推出的開源AI語音模型,支持直接語音輸入和多語言文本輸出。具備語音聊天、音頻分析功能,支持超過8種語言。Qwen2-Audio在...
閱讀原文

Imagen 3

Imagen 3是Google推出的AI圖像生成模型,可以生成高質(zhì)量、逼真的圖像。Imagen 3對(duì)提示詞理解更好,可捕捉更多細(xì)節(jié),生成更廣泛的視覺風(fēng)格。基于谷歌的文生圖...
閱讀原文

EAFormer

EAFormer是復(fù)旦推出的AI文本分割框架。擅長在照片中找到文字,并且能很精確地把文字從背景中分離出來。即使文字的邊緣很模糊或者背景很復(fù)雜,EAFormer也能做...
閱讀原文

WiseFlow

WiseFlow是開源的AI信息挖掘工具,能從網(wǎng)站、微信公眾號(hào)、社交平臺(tái)等多源信息中智能提取并分類數(shù)據(jù)。結(jié)合了統(tǒng)計(jì)學(xué)習(xí)和大型語言模型(LLM),支持多種新聞頁面...
閱讀原文

Agents

Agents是AIWaves公司推出的AI Agent開發(fā)工具,支持用戶對(duì)AI模型進(jìn)行詳細(xì)調(diào)整和優(yōu)化,構(gòu)建更加智能和個(gè)性化的AI Agent。通過Agents平臺(tái),用戶可以自定義AI模型...
閱讀原文

MiniCPM-V

MiniCPM-V是面壁智能推出的開源多模態(tài)大模型,擁有80億參數(shù),擅長圖像和視頻理解。MiniCPM-V在單圖像理解上超越了GPT-4V等模型,并首次支持在iPad等設(shè)備上實(shí)...
閱讀原文

VideoDoodles

VideoDoodles是Adobe公司聯(lián)合多所大學(xué)推出的AI視頻編輯框架。支持用戶在視頻中輕松插入手繪動(dòng)畫,實(shí)現(xiàn)與視頻內(nèi)容的無縫融合。通過預(yù)處理視頻幀,系統(tǒng)提供平面...
閱讀原文

CharacterFactory

CharacterFactory是大連理工大學(xué)IIAU團(tuán)隊(duì)推出的AI角色創(chuàng)作工具,通過擴(kuò)散模型在無需參考圖片的情況下,僅需2.5GB顯存和10分鐘訓(xùn)練,即可快速生成具有一致性特...
閱讀原文

UniBench

UniBench是Meta FAIR機(jī)構(gòu)推出的視覺語言模型(VLM)評(píng)估框架,對(duì)視覺語言模型(VLM)進(jìn)行全面評(píng)估。UniBench包含50多個(gè)基準(zhǔn)測試,涵蓋物體識(shí)別、空間理解、推理等...
閱讀原文