AI項(xiàng)目和框架

xGen-MM

xGen-MM是Salesforce推出的一款開源多模態(tài)AI模型,具有處理交錯(cuò)數(shù)據(jù)的能力,能同時(shí)理解和生成文本、圖像等多種數(shù)據(jù)類型。xGen-MM通過學(xué)習(xí)大量的圖片和文字信...
閱讀原文

Seed-ASR

Seed-ASR是字節(jié)跳動(dòng)開發(fā)的一款基于大型語(yǔ)言模型(LLM)的語(yǔ)音識(shí)別(ASR)模型。在超過2000萬(wàn)小時(shí)的語(yǔ)音數(shù)據(jù)和近90萬(wàn)小時(shí)的配對(duì)ASR數(shù)據(jù)上訓(xùn)練,支持普通話和13...
閱讀原文

Moffee

Moffee是開源的Markdown轉(zhuǎn)PPT工具,支持用戶使用Markdown語(yǔ)法快速創(chuàng)建專業(yè)的幻燈片。Moffee自動(dòng)處理布局、分頁(yè)和樣式,支持實(shí)時(shí)預(yù)覽和導(dǎo)出為PDF或HTML格式。
閱讀原文

浦語(yǔ)靈筆

浦語(yǔ)靈筆IXC-2.5是上海人工智能實(shí)驗(yàn)室推出的新一代多模態(tài)大模型,具備7B規(guī)模的大型語(yǔ)言模型后端。能處理長(zhǎng)達(dá)96K的長(zhǎng)上下文,支持超高分辨率圖像和細(xì)粒度視頻...
閱讀原文

新壹視頻大模型

新壹視頻大模型是新壹科技推出的AI視頻創(chuàng)作大模型,自研AI算法和深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)從劇本到成品的一鍵式創(chuàng)作。具備劇本生成、情感化語(yǔ)音合成、3D元素創(chuàng)建和...
閱讀原文

書生·浦語(yǔ)

書生·浦語(yǔ)是上海人工智能實(shí)驗(yàn)室推出的開源AI大模型,具有卓越的推理能力和超長(zhǎng)文本處理功能。書生·浦語(yǔ)支持高達(dá)一百萬(wàn)詞元的文本輸入,能自主進(jìn)行網(wǎng)絡(luò)搜索并...
閱讀原文

Half_illustration

Half_illustration是一個(gè)基于Flux.1模型的LoRA圖像創(chuàng)意模型,融合了攝影寫實(shí)與插畫藝術(shù)的元素,創(chuàng)造出獨(dú)特的視覺效果。這種風(fēng)格在圖像中同時(shí)展現(xiàn)了逼真的人物...
閱讀原文

ProPainter

ProPainter是南洋理工大學(xué)S-Lab團(tuán)隊(duì)推出的AI視頻修復(fù)項(xiàng)目。通過結(jié)合雙域傳播和蒙版引導(dǎo)的稀疏視頻Transformer,有效提高了視頻修復(fù)的性能。ProPainter能自動(dòng)...
閱讀原文

TurboEdit

TurboEdit是Adobe Research 推出的AI即時(shí)圖像編輯模型。通過編碼器迭代反演和基于文本的精細(xì)控制,能夠在幾步內(nèi)實(shí)現(xiàn)對(duì)圖像的精確編輯。利用詳細(xì)的文本提示,...
閱讀原文

Wav2Lip

Wav2Lip是開源的唇形同步工具,支持用戶將音頻文件轉(zhuǎn)換成與口型同步的視頻,廣泛應(yīng)用于視頻編輯和游戲開發(fā)等領(lǐng)域。Wav2Lip不僅能夠?qū)崿F(xiàn)實(shí)時(shí)口型生成,還支持...
閱讀原文

AuraFlow

AuraFlow v0.1是Fal團(tuán)隊(duì)推出的開源AI文生圖模型,擁有6.8B參數(shù)量。優(yōu)化了MMDiT架構(gòu),提升了模型的計(jì)算效率和可擴(kuò)展性。AuraFlow擅長(zhǎng)精準(zhǔn)圖像生成,尤其在物體...
閱讀原文

LongWriter

LongWriter 是清華大學(xué)聯(lián)合智譜AI推出的長(zhǎng)文本生成模型,能生成超10,000字的連貫文本,項(xiàng)目已開源。通過分析現(xiàn)有大型語(yǔ)言模型的輸出限制,創(chuàng)建了"LongWr...
閱讀原文

源2.0-M32

源2.0-M32是浪潮信息推出的擁有32個(gè)專家的混合專家模型(MoE)。采用創(chuàng)新的"Attention Router"技術(shù),提高了模型選擇專家的效率和準(zhǔn)確性。模型總參數(shù)...
閱讀原文

Zion

Zion是一個(gè)零代碼AI應(yīng)用開發(fā)平臺(tái),通過可視化配置和拖拽式交互,大幅降低了應(yīng)用開發(fā)的技術(shù)門檻。用戶無(wú)需編程知識(shí)即可快速構(gòu)建小程序、網(wǎng)站等應(yīng)用。Zion集成...
閱讀原文

Dify

Dify是開源的生成式AI應(yīng)用開發(fā)平臺(tái),提供從 Agent 構(gòu)建到 AI workflow 編排、RAG 檢索、模型管理等一站式服務(wù)。Dify使開發(fā)者能專注于創(chuàng)造應(yīng)用的核心價(jià)值,并...
閱讀原文