AI項(xiàng)目和框架

LightRAG

LightRAG是由香港大學(xué)研究團(tuán)隊(duì)推出的一種檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)系統(tǒng),基于整合圖結(jié)構(gòu)索引和雙層檢索機(jī)制,提升大型語(yǔ)言模型在...
閱讀原文

Gen2Act

Gen2Act是由谷歌、卡內(nèi)基梅隆大學(xué)和斯坦福大學(xué)共同推出的一種機(jī)器人操作策略,基于預(yù)測(cè)網(wǎng)絡(luò)數(shù)據(jù)中的運(yùn)動(dòng)信息來(lái)生成人類視頻,并將視頻用在引導(dǎo)機(jī)器人執(zhí)行新任...
閱讀原文

T2V-Turbo

T2V-Turbo是一種先進(jìn)的文本到視頻生成模型,由Google、UC Santa Barbara(加利福尼亞大學(xué)圣塔芭芭拉分校)、和University of Waterloo(滑鐵盧大學(xué))的研究人...
閱讀原文

FLUX.1-Turbo-Alpha

FLUX.1-Turbo-Alpha是阿里媽媽創(chuàng)意團(tuán)隊(duì)基于FLUX.1-dev模型訓(xùn)練的8步蒸餾Lora模型。基于多頭判別器技術(shù),升圖像生成的質(zhì)量,支持文本到圖像的生成及修復(fù)控制網(wǎng)...
閱讀原文

OpenR

OpenR是一個(gè)由倫敦大學(xué)學(xué)院(UCL)、上海交通大學(xué)、利物浦大學(xué)、香港科技大學(xué)(廣州)和西湖大學(xué)聯(lián)合開源的全鏈條訓(xùn)練框架,旨在提升大型語(yǔ)言模型(LLM)的復(fù)...
閱讀原文

Agent-S

Agent-S 是創(chuàng)新的代理框架,旨在基于圖形用戶界面(GUI)實(shí)現(xiàn)人機(jī)交互的自動(dòng)化。Agent-S 基于模擬人類的操作方式,用鼠標(biāo)和鍵盤直接與計(jì)算機(jī)交互,處理復(fù)雜的...
閱讀原文

Adobe Firefly

Adobe Firefly 是 Adobe 推出的一系列創(chuàng)意生成式 AI 模型,旨在幫助用戶擴(kuò)展其天生的創(chuàng)造力。這些模型集成在 Adobe 的旗艦應(yīng)用程序和 Adobe Stock 中,支持的...
閱讀原文

Augmented Physics

Augmented Physics是一個(gè)創(chuàng)新的教育工具,基于集成機(jī)器學(xué)習(xí)技術(shù),將物理教科書中的靜態(tài)圖表轉(zhuǎn)換成互動(dòng)式和嵌入式的物理模擬。工具基于先進(jìn)的計(jì)算機(jī)視覺技術(shù),...
閱讀原文

podlm-public

podlm-public是一個(gè)開源AI播客工具,旨在創(chuàng)建一個(gè)中文版的NotebookLM替代品,專門用在將任意URL轉(zhuǎn)換成播客內(nèi)容,再推送到小宇宙平臺(tái)。項(xiàng)目基于先進(jìn)的AI技術(shù),...
閱讀原文

Yi-Lightning

Yi-Lightning 是零一萬(wàn)物公司最新發(fā)布的旗艦?zāi)P停趪?guó)際權(quán)威盲測(cè)榜單 LMSYS 上取得了顯著成績(jī),超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic C...
閱讀原文

FunASR

FunASR是由阿里巴巴達(dá)摩院開源的語(yǔ)音識(shí)別工具包,提供包括語(yǔ)音識(shí)別(ASR)、語(yǔ)音活動(dòng)檢測(cè)(VAD)、標(biāo)點(diǎn)恢復(fù)、語(yǔ)言模型、說(shuō)話人驗(yàn)證、說(shuō)話人分離及多說(shuō)話人ASR...
閱讀原文

CleanS2S

CleanS2S是一個(gè)流式語(yǔ)音到語(yǔ)音(S2S)交互智能體原型,提供高質(zhì)量、實(shí)時(shí)的語(yǔ)音交互體驗(yàn)。CleanS2S項(xiàng)目基于單文件實(shí)現(xiàn),簡(jiǎn)化配置和理解過(guò)程,便于用戶和研究人...
閱讀原文

Hallo2

Hallo2是復(fù)旦大學(xué)、百度公司和南京大學(xué)共同推出的音頻驅(qū)動(dòng)視頻生成模型。能將單張參考圖片和持續(xù)幾分鐘的音頻輸入結(jié)合起來(lái),基于可選的文本提示調(diào)節(jié)肖像表情...
閱讀原文

模型判官

模型判官是一個(gè)基于 Next.js 構(gòu)建的在線AI模型評(píng)測(cè)平臺(tái),用戶輸入問(wèn)題并選擇多個(gè)AI模型進(jìn)行測(cè)試,幫助用戶快速識(shí)別出最適于需求的AI模型。平臺(tái)的特色在于,提...
閱讀原文

AgentStack

AgentStack是一個(gè)開源工具,旨在幫助開發(fā)者快速構(gòu)建AI代理項(xiàng)目。基于提供一個(gè)預(yù)配置的模板和集成流行的代理框架及大型語(yǔ)言模型(LLM)提供商,簡(jiǎn)化從零開始創(chuàng)...
閱讀原文