AI項目和框架

Augmented Physics

Augmented Physics是一個創新的教育工具,基于集成機器學習技術,將物理教科書中的靜態圖表轉換成互動式和嵌入式的物理模擬。工具基于先進的計算機視覺技術,...
閱讀原文

podlm-public

podlm-public是一個開源AI播客工具,旨在創建一個中文版的NotebookLM替代品,專門用在將任意URL轉換成播客內容,再推送到小宇宙平臺。項目基于先進的AI技術,...
閱讀原文

Yi-Lightning

Yi-Lightning 是零一萬物公司最新發布的旗艦模型,在國際權威盲測榜單 LMSYS 上取得了顯著成績,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic C...
閱讀原文

FunASR

FunASR是由阿里巴巴達摩院開源的語音識別工具包,提供包括語音識別(ASR)、語音活動檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離及多說話人ASR...
閱讀原文

CleanS2S

CleanS2S是一個流式語音到語音(S2S)交互智能體原型,提供高質量、實時的語音交互體驗。CleanS2S項目基于單文件實現,簡化配置和理解過程,便于用戶和研究人...
閱讀原文

Hallo2

Hallo2是復旦大學、百度公司和南京大學共同推出的音頻驅動視頻生成模型。能將單張參考圖片和持續幾分鐘的音頻輸入結合起來,基于可選的文本提示調節肖像表情...
閱讀原文

模型判官

模型判官是一個基于 Next.js 構建的在線AI模型評測平臺,用戶輸入問題并選擇多個AI模型進行測試,幫助用戶快速識別出最適于需求的AI模型。平臺的特色在于,提...
閱讀原文

AgentStack

AgentStack是一個開源工具,旨在幫助開發者快速構建AI代理項目?;谔峁┮粋€預配置的模板和集成流行的代理框架及大型語言模型(LLM)提供商,簡化從零開始創...
閱讀原文

Marco

Marco是阿里國際最新推出的大規模商用翻譯大模型,支持15種全球主流語種,包括中、英、日、韓、西、法等。在BLEU評測指標上超越Google翻譯、DeepL、GPT-4等競...
閱讀原文

Ministral 3B/8B

Ministral 3B和8B是由Mistral AI推出的兩款新型AI小模型,專為設備端計算和邊緣使用場景設計。在知識、常識、推理、功能調用和效率方面為10億參數以下的類別...
閱讀原文

TANGO

TANGO 是一個由東京大學和 CyberAgent AI Lab 共同推出的開源框架,專注于生成與目標語音同步的全身手勢視頻。基于分層音頻運動嵌入和擴散插值網絡,將目標語...
閱讀原文

Nemotron-70B-Instruct

Nemotron-70B-Instruct 是英偉達(NVIDIA)發布的一個大型語言模型,基于一種新穎的混合訓練方法提升模型遵循指令時的響應質量和一致性。模型結合Bradley-Ter...
閱讀原文

Sana

SANA是由NVIDIA、麻省理工學院和清華大學共同推出的文本到圖像生成框架,能高效地生成高達4096×4096分辨率的高清晰度圖像。SANA基于深度壓縮自編碼器、線性擴...
閱讀原文

Chat2DB

Chat2DB是一款AI驅動的數據庫管理和分析工具,基于自然語言處理技術,支持用戶用自然語言與數據庫進行交互,簡化SQL代碼的編寫和數據庫管理。Chat2DB支持多種...
閱讀原文

IterComp

IterComp是一個由清華大學、北京大學、LibAI Lab、中國科學技術大學、牛津大學和普林斯頓大學的研究人員聯合推出的文本到圖像生成框架?;诘答亴W習機制...
閱讀原文