AI項目和框架

IndexTTS2

IndexTTS2是B站語音團隊開發的新型文本轉語音(TTS)模型,已經正式開源。模型在情感表達和時長控制方面實現了重大突破,是首個支持精確時長控制的自回歸TTS...
閱讀原文

Stand-In

Stand-In 是騰訊微信視覺團隊推出的輕量級的視頻生成框架,專注于生成身份保護視頻。框架通過訓練1%的基礎模型參數,能生成高保真度、身份一致的視頻,且具有...
閱讀原文

ST-Raptor

ST-Raptor 是用在半結構化表格問答的工具,僅需一個 Excel 格式的表格和一個自然語言問題作為輸入,能產生精確的答案。
閱讀原文

Strix

Strix 是開源的 AI 驅動安全測試工具,能幫助開發人員和安全團隊快速發現、驗證應用程序中的漏洞。工具通過模擬真實黑客攻擊,動態運行代碼,減少誤報。
閱讀原文

HuMo

HuMo是清華大學和字節跳動智能創作實驗室共同提出的多模態視頻生成框架,專注于人類中心的視頻生成。能從文本、圖像和音頻等多種模態輸入中生成高質量、精細...
閱讀原文

FireRedTTS-2

FireRedTTS-2 是先進的長格式流式文本轉語音(TTS)系統,專注于多說話人對話生成。采用12.5Hz流式語音分詞器和雙Transformer架構,能實現低延遲、高保真、多...
閱讀原文

SRPO

SRPO(Semantic Relative Preference Optimization)是騰訊混元推出的文本到圖像生成模型,通過將獎勵信號設計為文本條件信號,實現對獎勵的在線調整,減少對...
閱讀原文

Qwen3-Next

Qwen3-Next是阿里通義開源的新一代混合架構大模型,包含指令版(Qwen3-Next-80B-A3B-Instruct )和思維版(Qwen3-Next-80B-A3B-Thinking)兩個版本。
閱讀原文

AutoDocs

AutoDocs 是 TrySita 開發的開源代碼文檔自動化工具,幫助開發者高效生成和維護代碼庫文檔。通過深度解析代碼庫的抽象語法樹(AST)和構建依賴圖,生成準確且...
閱讀原文

AnyI2V

AnyI2V 是復旦大學、阿里巴巴達摩院和湖畔實驗室聯合推出的創新圖像動畫生成框架。框架無需大量訓練數據,能將靜態條件圖像(如網格、點云等)轉化為動態視頻...
閱讀原文

MiniMax Music 1.5

MiniMax Music 1.5 是先進的 AI 音樂生成模型,支持最長 4 分鐘的音樂創作,能根據用戶輸入的風格、情緒和場景等自然語言描述生成高質量的音樂作品。
閱讀原文

K2-Think

K2-Think是阿聯酋穆罕默德·本·扎耶德人工智能大學MBZUAI與G42聯合推出的開源推理模型,擁有320億參數,在數學推理、代碼生成和科學知識等多領域表現出色,尤...
閱讀原文

LMDeploy

LMDeploy 是上海人工智能實驗室推出的大模型推理部署工具,能顯著提升大模型的推理性能,支持多種硬件架構,包括 NVIDIA 的 Hopper 和 Ampere 系列 GPU,實現...
閱讀原文

文心大模型X1.1

文心大模型X1.1是百度推出的深度思考模型,基于迭代式混合強化學習框架,在事實性、指令遵循能力和智能體能力上顯著提升,分別提高34.8%、12.5%和9.6%。在權...
閱讀原文

SpikingBrain-1.0

SpikingBrain-1.0(瞬悉 1.0)是中國科學院自動化研究所推出的類腦脈沖大模型。模型基于內生復雜性,用新型非Transformer架構,突破Transformer架構在處理超...
閱讀原文
134567145