AI項目和框架

AutoDocs

AutoDocs 是 TrySita 開發的開源代碼文檔自動化工具,幫助開發者高效生成和維護代碼庫文檔。通過深度解析代碼庫的抽象語法樹(AST)和構建依賴圖,生成準確且...
閱讀原文

AnyI2V

AnyI2V 是復旦大學、阿里巴巴達摩院和湖畔實驗室聯合推出的創新圖像動畫生成框架。框架無需大量訓練數據,能將靜態條件圖像(如網格、點云等)轉化為動態視頻...
閱讀原文

MiniMax Music 1.5

MiniMax Music 1.5 是先進的 AI 音樂生成模型,支持最長 4 分鐘的音樂創作,能根據用戶輸入的風格、情緒和場景等自然語言描述生成高質量的音樂作品。
閱讀原文

K2-Think

K2-Think是阿聯酋穆罕默德·本·扎耶德人工智能大學MBZUAI與G42聯合推出的開源推理模型,擁有320億參數,在數學推理、代碼生成和科學知識等多領域表現出色,尤...
閱讀原文

LMDeploy

LMDeploy 是上海人工智能實驗室推出的大模型推理部署工具,能顯著提升大模型的推理性能,支持多種硬件架構,包括 NVIDIA 的 Hopper 和 Ampere 系列 GPU,實現...
閱讀原文

文心大模型X1.1

文心大模型X1.1是百度推出的深度思考模型,基于迭代式混合強化學習框架,在事實性、指令遵循能力和智能體能力上顯著提升,分別提高34.8%、12.5%和9.6%。在權...
閱讀原文

SpikingBrain-1.0

SpikingBrain-1.0(瞬悉 1.0)是中國科學院自動化研究所推出的類腦脈沖大模型。模型基于內生復雜性,用新型非Transformer架構,突破Transformer架構在處理超...
閱讀原文

混元圖像2.1

混元圖像2.1(HunyuanImage 2.1)是騰訊推出的開源文生圖模型,支持原生2K分辨率,具備強大的復雜語義理解能力,能精準生成場景細節、人物表情和動作。
閱讀原文

REFRAG

REFRAG是Meta超級智能實驗室推出的針對檢索增強生成(RAG)任務的高效解碼框架,通過“壓縮(Compress)、感知(Sense)、擴展(Expand)”的流程優化大型語言...
閱讀原文

XTuner V1

XTuner V1 是上海人工智能實驗室開源的新一代大模型訓練引擎,基于 PyTorch FSDP 開發,針對超大模型訓練中的顯存、通信和負載問題進行系統性優化,支持 1T ...
閱讀原文

Qwen3-ASR-Flash

Qwen3-ASR-Flash 是通義千問系列最新語音識別模型,基于 Qwen3 基座模型,經海量多模態及 ASR 數據訓練而成。模型支持 11 種語言和多種口音,具備高精度、高...
閱讀原文

AntSK FileChunk

AntSK FileChunk是基于語義理解的智能文本切片工具,專門用在處理PDF和Word文檔。工具基于先進的語義分析技術,將長文檔分割成語義完整且連貫的片段,避免傳...
閱讀原文

AI Video Transcriber

AI Video Transcriber 是開源的視頻轉錄與總結工具,支持YouTube、TikTok等30多個平臺。工具用Faster-Whisper進行高精度語音轉文字,通過AI優化文本,糾正拼...
閱讀原文

DeepDoc

DeepDoc 是開源的深度研究工具,專注于對本地知識庫進行深度研究。工具通過研究式工作流,提取本地資源(如 PDF、DOCX、JPG、TXT 等)中的文本,分割存儲在向...
閱讀原文

Visual Story-Writing

Visual Story-Writing是創新的AI寫作工具,通過可視化界面幫助用戶構建和編輯故事。工具用GPT-4o技術自動解析文本,能轉換成事件、角色和動作的可視化結構,...
閱讀原文
11314151617155