一鍵將視頻和音頻轉(zhuǎn)化為各種風格的文檔。
開源視頻生成模型,支持多種生成任務。
一個簡單易用的語音克隆和語音模型訓練工具。
輕松將現(xiàn)有代理框架中的工具、代理和調(diào)度器轉(zhuǎn)換為 MCP 服務器。
Pusa 是一個新穎的視頻擴散模型,支持多種視頻生成任務。
一個開放源代碼的 14B 參數(shù)編程模型,具備高效的代碼推理能力。
復旦大學發(fā)布MOSS大模型開源項目,包含核心代碼和模型權(quán)重。
一個強大的文本生成模型,適用于多種對話應用。
通過強化學習驅(qū)動的金融推理大模型。
生成高質(zhì)量 SVG 代碼的基礎模型。
百川智能開發(fā)的專為醫(yī)療場景優(yōu)化的開源大語言模型,具備卓越的通用能力和醫(yī)療領(lǐng)域性能。
一款幫助用戶整理房間的趣味提醒應用
一種通過文本迷宮解決任務來增強大型語言模型視覺推理能力的創(chuàng)新方法
一個從URL、YouTube視頻或文本提示生成交互式思維導圖的Web應用。
一款開源的14B參數(shù)量的數(shù)學模型,通過強化學習訓練,性能卓越。
一個開源文本轉(zhuǎn)語音系統(tǒng),致力于實現(xiàn)人類語音的自然化。
Gen AI Toolbox for Databases 是一個開源服務器,用于簡化與數(shù)據(jù)庫交互的 Gen AI 工具的開發(fā)。
TableGPT2-7B 是一款專注于表格數(shù)據(jù)處理的大語言模型,適用于數(shù)據(jù)分析和商業(yè)智能任務。
NeoBase 是一款開源的 AI 數(shù)據(jù)庫助手,讓你用自然語言與數(shù)據(jù)庫交互。
一個用于從文本和圖像中提取結(jié)構(gòu)化數(shù)據(jù)的代理API,基于LLMs實現(xiàn)。
Steiner 是一個基于合成數(shù)據(jù)訓練的推理模型,旨在探索多種推理路徑并自主驗證。
On-device Sora 是一個基于擴散模型的移動設備端文本到視頻生成項目。
FilmAgent是一個基于LLM的多智能體協(xié)作框架,用于虛擬3D空間中的端到端電影自動化制作。
EasyWeb是一個用于構(gòu)建和部署與瀏覽器交互的AI代理的開放平臺。
CocoIndex 是一個開源的數(shù)據(jù)索引引擎,支持自定義轉(zhuǎn)換邏輯和增量更新。
一個開源項目,用于在瀏覽器中演示 AI 視頻生成模型。
一種用于控制視頻擴散模型運動模式的高效方法,支持運動模式的自定義和遷移。
SkyReels V1 是一個開源的人類中心視頻基礎模型,專注于高質(zhì)量影視級視頻生成。
將電子書轉(zhuǎn)換為有聲書的工具。
基于Kokoro和ONNX運行時的文本到語音(TTS)項目。
首個面向語境智能的人類級實時交互系統(tǒng),支持多情感、多風格語音交互。
開源工業(yè)級自動語音識別模型,支持普通話、方言和英語,性能卓越。
OpenI AI助手在線工具硅基流動豆包Trae扣子Coze即夢繪蛙