AI項(xiàng)目和框架

ChatLearn

ChatLearn 是由阿里云推出的一個(gè)靈活、易用、高效的大規(guī)模Alignmant 訓(xùn)練框架。ChatLearn是為了支持大型語言模型(LLMs)的 Alignment 訓(xùn)練而設(shè)計(jì)的。ChatLea...
閱讀原文

Docmatix

Docmatix 是一個(gè)用于文檔視覺問答(Document Visual Question Answering,簡(jiǎn)稱 DocVQA)任務(wù)設(shè)計(jì)的大規(guī)模數(shù)據(jù)集。它包含了240萬張圖像和950萬個(gè)問題答案對(duì),...
閱讀原文

Stable Diffusion整合包

Stable Diffusion整合包是B站UP主秋葉aaaki發(fā)布的SD繪畫本地部署解決方案,包含了Stable Diffusion WebUI、必要的運(yùn)行環(huán)境、預(yù)裝模型以及一些常用插件的集合...
閱讀原文

MiniCPM 3.0

MiniCPM 3.0是面壁智能推出的一款高性能端側(cè)AI模型,具備4B參數(shù),以較小的模型規(guī)模實(shí)現(xiàn)了超越GPT-3.5的性能表現(xiàn)。MiniCPM 3.0采用LLMxMapReduce技術(shù),支持無...
閱讀原文

Reflection 70B

Reflection 70B是HyperWrite公司推出的開源AI大模型,以卓越的性能在多個(gè)基準(zhǔn)測(cè)試中超越了GPT-4o和Llama 3.1。Reflection 70B基于Meta的Llama 3.1 70B Instru...
閱讀原文

Loopy

Loopy是字節(jié)跳動(dòng)推出的音頻驅(qū)動(dòng)的AI視頻生成模型,用戶可以讓一張靜態(tài)照片動(dòng)起來,照片中的人物根據(jù)給定的音頻文件進(jìn)行面部表情和頭部動(dòng)作的同步,生成逼真的...
閱讀原文

xLAM

xLAM 是 Salesforce 開源的一款大型語言模型,專為功能調(diào)用任務(wù)設(shè)計(jì)。模型能理解和執(zhí)行基于自然語言指令的 API 調(diào)用,它在自動(dòng)化任務(wù)和與各種數(shù)字服務(wù)交互方...
閱讀原文

CodeFormer

CodeFormer是一款由南洋理工大學(xué)和商湯科技聯(lián)合開發(fā)的AI照片和視頻修復(fù)工具。融合了變分自動(dòng)編碼器(VQGAN)和Transformer技術(shù),對(duì)模糊和馬賽克的照片或視頻...
閱讀原文

Mini-Omni

Mini-Omni 是一個(gè)開源的端到端語音對(duì)話模型,具備實(shí)時(shí)語音輸入和輸出的能力,能在對(duì)話中實(shí)現(xiàn)“邊思考邊說話”的功能。模型的設(shè)計(jì)支持在不需要額外的自動(dòng)語音識(shí)...
閱讀原文

Composio

Composio 是一個(gè)AI智能體開發(fā)輔助工具,提供100+集成工具,簡(jiǎn)化了 AI Agent的開發(fā)和部署,支持開發(fā)者通過一行代碼調(diào)用多種工具和框架,如 OpenAI 和 Claude、...
閱讀原文

DeepSeek-V2.5

DeepSeek-V2.5 是DeepSeek推出的融合通用與代碼能力的全新開源模型。保留了之前 Chat 模型的通用對(duì)話能力以及 Coder 模型的代碼處理能力,更好地對(duì)齊了人類的...
閱讀原文

MLE-Agent

MLE-Agent 是一款專為機(jī)器學(xué)習(xí)工程師和研究人員設(shè)計(jì)的智能助手,通過自動(dòng)化基線創(chuàng)建、集成最新研究資源、智能調(diào)試、文件系統(tǒng)和工具集成,以及交互式命令行聊...
閱讀原文

ViewCrafter

ViewCrafter 是北大和港中文聯(lián)合騰訊提出的一種先進(jìn)的視頻擴(kuò)散模型,能從單個(gè)或少量圖像中合成高保真的新視圖。結(jié)合了視頻擴(kuò)散模型的生成能力和基于點(diǎn)的3D表...
閱讀原文

FluxMusic

FluxMusic 是一個(gè)開源的音樂生成模型,基于擴(kuò)散模型和 Transformer 架構(gòu)將文本描述轉(zhuǎn)換成音樂。模型能處理復(fù)雜的文本指令,生成具有特定情感、風(fēng)格和樂器的音...
閱讀原文

LightEval

LightEval是Hugging Face推出的一款輕量級(jí)AI評(píng)估工具,專門用于評(píng)估大型語言模型(LLMs)。LightEval支持多任務(wù)處理和復(fù)雜模型配置,能在多種硬件上運(yùn)行,包...
閱讀原文