AI項目和框架

NarratoAI

NarratoAI 是基于AI技術自動化影視解說和編輯的工具。通過大型語言模型(LLM)理解視頻內容,自動生成解說文案,并將文案轉化為配音,同時進行視頻剪輯和字幕...
閱讀原文

Skywork-Reward

Skywork-Reward 是昆侖萬維推出的一系列高性能獎勵模型,包括 Skywork-Reward-Gemma-2-27B 和 Skywork-Reward-Llama-3.1-8B。主要用于指導和優(yōu)化大語言模型的...
閱讀原文

Torch-MLU

Torch-MLU 是寒武紀開源的 PyTorch 設備后端擴展插件,支持開發(fā)者將寒武紀 MLU 系列智能加速卡作為 PyTorch 的加速后端使用。插件實現(xiàn)了對 PyTorch 的原生支...
閱讀原文

ImageBind

ImageBind是Meta公司推出的開源多模態(tài)AI模型,將文本、音頻、視覺、溫度和運動數(shù)據(jù)等六種不同類型的信息整合到一個統(tǒng)一的嵌入空間中。模型通過圖像模態(tài)作為橋...
閱讀原文

LlamaCoder

LlamaCoder 是一個開源的 AI 工具,使用 Llama 3.1 405B 模型快速生成全棧應用程序。旨在提供一種替代 Claude Artifacts 的解決方案。集成了 Sandpack、Next....
閱讀原文

XVERSE-MoE-A36B

XVERSE-MoE-A36B是由元象推出的中國最大的MoE(Mixture of Experts,混合專家模型)開源大模型。模型具有2550億的總參數(shù)和360億的激活參數(shù),性能上與超過100B...
閱讀原文

PyVideoTrans

PyVideoTrans 是開源的視頻翻譯配音工具,將視頻內容從一種語言自動翻譯成另一種語言,并添加相應的字幕和配音。PyVideoTrans支持多語言,具備高效的語音識別...
閱讀原文

LongCite

ongCite是由清華大學推出的項目,旨在提升大型語言模型(LLMs)在長文本問答任務中的可信度和可驗證性。項目通過生成細粒度的句子級引用,使用戶能驗證模型的...
閱讀原文

CSGO AI

CSGO(Content-Style Composition in Text-to-Image Generation)是由南京理工大學、小紅書等機構合作開發(fā)的圖像風格遷移和文本到圖像生成的研究項目。CSGO的...
閱讀原文

GameGen-O

GameGen-O 是騰訊推出的一款基于 Transformer 架構的游戲視頻生成模型,專門用于生成開放世界視頻游戲。模型能模擬游戲引擎的多種功能,包括生成游戲角色、動...
閱讀原文

SleepFM

SleepFM 是斯坦福大學開源的多模態(tài)睡眠分析模型,基于超過14,000名參與者的100,000小時睡眠數(shù)據(jù),通過融合大腦活動、心電圖和呼吸信號,提供全面的睡眠健康評...
閱讀原文

書生·筑夢2.0(Vchitect 2.0)

書生·筑夢2.0(Vchitect 2.0)是由上海人工智能實驗室推出的升級版視頻生成開源大模型,旨在生成符合中國文化和東方審美的視頻內容。模型支持長達20秒的視頻...
閱讀原文

AI Youtube Shorts Generator

AI Youtube Shorts Generator 是一款開源的 AI 視頻編輯工具,基于 GPT-4、FFmpeg 和 OpenCV 等技術自動分析長視頻,提取最精彩的片段,將其裁剪成適合短視頻...
閱讀原文

PhotoPrism

PhotoPrism 是一個開源的AI照片管理工具,用 Go 語言編寫,旨在為用戶提供一個去中心化的照片存儲和組織解決方案。支持用戶在自己的硬件上運行,完全控制自己...
閱讀原文

Claude Dev

Claude Dev是一個集成在Visual Studio Code中的AI編程助手,基于Anthropic公司的Claude 3.5 Sonnet模型,為開發(fā)者提供自動化的編程支持。Claude Dev自動處理...
閱讀原文