AI項目和框架

MLE-bench

MLE-bench 是 OpenAI 推出的一個基準測試工具,旨在衡量AI代理(AI Agent)在機器學習工程任務中的表現。測試包含75個來自 Kaggle 的競賽任務,覆蓋自然語言...
閱讀原文

GTSinger

GTSinger是由浙江大學研究團隊推出的大型開源高質量歌聲數據集,旨在支持多樣化的歌聲任務。GTSinger包含80.59小時的專業錄音棚錄制的歌聲,涵蓋九種不同語言...
閱讀原文

LightRAG

LightRAG是由香港大學研究團隊推出的一種檢索增強生成(Retrieval-Augmented Generation, RAG)系統,基于整合圖結構索引和雙層檢索機制,提升大型語言模型在...
閱讀原文

Gen2Act

Gen2Act是由谷歌、卡內基梅隆大學和斯坦福大學共同推出的一種機器人操作策略,基于預測網絡數據中的運動信息來生成人類視頻,并將視頻用在引導機器人執行新任...
閱讀原文

T2V-Turbo

T2V-Turbo是一種先進的文本到視頻生成模型,由Google、UC Santa Barbara(加利福尼亞大學圣塔芭芭拉分校)、和University of Waterloo(滑鐵盧大學)的研究人...
閱讀原文

FLUX.1-Turbo-Alpha

FLUX.1-Turbo-Alpha是阿里媽媽創意團隊基于FLUX.1-dev模型訓練的8步蒸餾Lora模型。基于多頭判別器技術,升圖像生成的質量,支持文本到圖像的生成及修復控制網...
閱讀原文

OpenR

OpenR是一個由倫敦大學學院(UCL)、上海交通大學、利物浦大學、香港科技大學(廣州)和西湖大學聯合開源的全鏈條訓練框架,旨在提升大型語言模型(LLM)的復...
閱讀原文

Agent-S

Agent-S 是創新的代理框架,旨在基于圖形用戶界面(GUI)實現人機交互的自動化。Agent-S 基于模擬人類的操作方式,用鼠標和鍵盤直接與計算機交互,處理復雜的...
閱讀原文

Adobe Firefly

Adobe Firefly 是 Adobe 推出的一系列創意生成式 AI 模型,旨在幫助用戶擴展其天生的創造力。這些模型集成在 Adobe 的旗艦應用程序和 Adobe Stock 中,支持的...
閱讀原文

Augmented Physics

Augmented Physics是一個創新的教育工具,基于集成機器學習技術,將物理教科書中的靜態圖表轉換成互動式和嵌入式的物理模擬。工具基于先進的計算機視覺技術,...
閱讀原文

podlm-public

podlm-public是一個開源AI播客工具,旨在創建一個中文版的NotebookLM替代品,專門用在將任意URL轉換成播客內容,再推送到小宇宙平臺。項目基于先進的AI技術,...
閱讀原文

Yi-Lightning

Yi-Lightning 是零一萬物公司最新發布的旗艦模型,在國際權威盲測榜單 LMSYS 上取得了顯著成績,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic C...
閱讀原文

FunASR

FunASR是由阿里巴巴達摩院開源的語音識別工具包,提供包括語音識別(ASR)、語音活動檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離及多說話人ASR...
閱讀原文

CleanS2S

CleanS2S是一個流式語音到語音(S2S)交互智能體原型,提供高質量、實時的語音交互體驗。CleanS2S項目基于單文件實現,簡化配置和理解過程,便于用戶和研究人...
閱讀原文

Hallo2

Hallo2是復旦大學、百度公司和南京大學共同推出的音頻驅動視頻生成模型。能將單張參考圖片和持續幾分鐘的音頻輸入結合起來,基于可選的文本提示調節肖像表情...
閱讀原文