AI項目和框架

云錦天章:基于DCFormer架構的通用大模型由彩云科技發布

云錦天章是彩云科技推出的基于DCFormer架構的通用大模型,DCFormer在性能上實現對傳統Transformer模型1.7-2倍的提升。云錦天章在虛構的世界觀基礎上賦予小說...
閱讀原文

Void:開源AI編碼工具的智能補全與建議功能

Void 是基于 Visual Studio Code 構建的開源文本編輯器,集成AI技術增強編程體驗。Void支持代碼自動補全、內聯編輯、AI 驅動的代碼搜索,直接與大型語言模型...
閱讀原文

PDFMathTranslate

PDFMathTranslate是開源的PDF文檔翻譯工具,設計用于翻譯科技論文等PDF文件,能保留原文的排版,包括公式和圖表。PDFMathTranslate支持雙語對照,保持原有目...
閱讀原文

MoneyPrinterTurbo

MoneyPrinterTurbo是開源的AI短視頻生成工具,能自動化地根據用戶提供的視頻主題或關鍵詞生成視頻文案、素材、字幕和背景音樂,合成高清短視頻。工具支持API...
閱讀原文

文心iRAG

文心iRAG是百度在2024年百度世界大會上推出的檢索增強的文生圖技術(iRAG)技術,結合了百度搜索的億級圖片資源和強大的基礎模型能力,解決大模型在文生圖方...
閱讀原文

ORMBG

ORMBG是開源的AI圖像分割工具,由開發者schirrmacher在GitHub上發起。ORMBG專注于從圖片中準確去除背景,用先進的圖像處理技術,實現對圖像中前景和背景的精...
閱讀原文

VITA

VITA是騰訊優圖實驗室推出的全球首個開源多模態大語言模型(MLLM),能理解和處理視頻、圖像、文本和音頻。基于Mixtral 8×7B模型,擴展了中文詞匯量,進行了...
閱讀原文

CrewAI

CrewAI是專注于構建多個 AI Agents 高效協作的開源平臺,通過簡化 AI Agents 框架的使用,企業能快速構建和部署智能自動化解決方案。CrewAI平臺的核心優勢在...
閱讀原文

Phi-3.5

Phi-3.5是微軟推出的新一代AI模型系列,包含 Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct 和 Phi-3.5-vision-instruct 三個版本,分別針對輕量級推理、混合...
閱讀原文

MetaHuman-Stream

MetaHuman-Stream 是一項前沿的實時交互流式AI數字人技術,集成了 ERNerf、MuseTalk、Wav2lip 等多種先進模型,支持聲音克隆和深度學習算法,確保對話流暢自...
閱讀原文

Roop

Roop 是開源的AI視頻換臉工具,Roop支持用戶通過一張圖片替換視頻中的面部,無需復雜的數據集或訓練過程。安裝和使用需要一定的技術技能,適合有一定基礎的用...
閱讀原文

ComfyUI-Bxb

ComfyUI-Bxb是“SD變現寶”,一鍵把 ComfyUI 工作流轉換成小程序,專為小程序開發者設計,實現快速變現。ComfyUI-Bxb的核心功能是將ComfyUI工作流轉換為微信小...
閱讀原文

MARS5-TTS

MARS5-TTS是CAMB.AI推出開源的AI聲音克隆工具,有突破性逼真的韻律,支持140多種語言支持。還能處理復雜韻律場景,如體育解說和動漫AI配音等。MARS5-TTS具有1...
閱讀原文

LanceDB

LanceDB 是一款專為人工智能應用設計的無服務器向量數據庫,支持向量搜索、全文搜索和SQL查詢,優化了多模態數據處理。它采用向量索引技術,實現高效相似度搜...
閱讀原文

Kotaemon

Kotaemon 是一款基于 RAG 技術的開源工具,支持用戶通過自然語言與文檔進行互動,快速檢索和理解信息。適合需要處理大量文檔的場合,如學術研究、企業文檔管...
閱讀原文