AI項目和框架

ImageRAG

ImageRAG 是基于檢索增強生成(Retrieval-Augmented Generation, RAG)的圖像生成技術,通過動態檢索相關圖像來提升文本到圖像(T2I)模型生成罕見或未見概念...
閱讀原文

X-R1

X-R1是基于強化學習的低成本訓練框架,能加速大規模語言模型的后訓練(Scaling Post-Training)開發。X-R1用極低的成本訓練0.5B(5億參數)規模的R1-Zero模型...
閱讀原文

Step-Video-T2V

Step-Video-T2V 是階躍星辰團隊推出的開源文本到視頻預訓練模型,擁有 300 億參數,能生成長達 204 幀的高質量視頻。模型基于深度壓縮的變分自編碼器(Video-...
閱讀原文

unsloth

unsloth 是開源的大型語言模型(LLM)微調工具,基于優化計算步驟和 GPU 內核,顯著提升模型訓練速度減少內存使用。Unsloth支持多種主流 LLM,如 Llama-3、Mi...
閱讀原文

騰訊混元T1

T1(Thinker)是騰訊混元推出的最新深度思考模型,已正式上線接入騰訊元寶。模型專注于邏輯推理和深度思考,支持聯網搜索功能,能從互聯網信源、微信公眾號、...
閱讀原文

ConsistentDreamer

ConsistentDreamer 是華為慕尼黑研究中心提出的新型圖像到 3D 資產生成技術,通過單張圖像生成視圖一致的 3D 網格。方法通過多視圖先驗圖像引導的高斯優化,...
閱讀原文

FoloUp

FoloUp 是開源的AI語音面試平臺,能幫助企業高效地進行招聘面試。FoloUp能根據職位描述自動生成定制化的面試問題,基于AI技術與候選人進行自然、對話式的語音...
閱讀原文

FoloUp

FoloUp 是開源的AI語音面試平臺,能幫助企業高效地進行招聘面試。FoloUp能根據職位描述自動生成定制化的面試問題,基于AI技術與候選人進行自然、對話式的語音...
閱讀原文

KTransformers

KTransformers是清華大學KVCache.AI團隊聯合趨境科技推出的開源項目,能優化大語言模型的推理性能,降低硬件門檻。KTransformers基于GPU/CPU異構計算策略,用...
閱讀原文

DragAnything

DragAnything 是快手聯合浙江大學和新加坡國立大學 Show Lab推出的,基于實體表示的可控視頻生成方法,基于簡單的軌跡輸入實現對視頻中任意物體的精確運動控...
閱讀原文

GENERator

GENERator是阿里云飛天實驗室 AI for Science 團隊推出的生成式基因組基礎模型,專注于 DNA 序列的設計和生成。模型基于 Transformer 解碼器架構,具有 98k ...
閱讀原文

NPOA

NPOA 是開源的功能強大的輿情監測工具,可以幫助用戶實時監控網絡輿情,了解公眾對特定話題或品牌的看法。系統基于先進的自然語言處理技術,可以分析大量的網...
閱讀原文

Long-VITA

Long-VITA 是騰訊優圖實驗室、南京大學、廈門大學開源的多模態模型,能處理超過100萬tokens的長文本輸入,在短文本任務中表現出色。Long-VITA基于分階段訓練...
閱讀原文

WiseDiag

WiseDiag 是杭州智診科技推出的全球領先的醫療大模型,專注于基于人工智能技術提升醫療服務的效率和質量。模型具有 730 億參數和 32k 的上下文長度,基于超過...
閱讀原文

CustomVideoX

CustomVideoX 是中科大和浙大等聯合提出的創新的個性化視頻生成框架,通過參考圖像和文本描述生成高質量的定制化視頻。框架基于視頻擴散變換器(Video Diffus...
閱讀原文
16364656667146