AI項目和框架

BettaFish

BettaFish(微輿) 是開源的多智能體輿情分析系統,能幫助用戶快速了解公眾對事件、品牌或產品的看法。系統通過自然語言驅動,用戶只需像聊天一樣提出需求,...
閱讀原文

AI Research Foundations

AI Research Foundations是Google DeepMind與倫敦大學學院(UCL)聯合推出的免費在線課程。課程能幫助學習者深入理解Transformer模型,通過實踐掌握現代語言...
閱讀原文

LongCat-Flash-Omni

LongCat-Flash-Omni 是美團?LongCat?團隊開源的全模態大語言模型,基于 LongCat-Flash 系列高效架構設計,創新性地集成多模態感知和語音重建模塊,擁有 5600 ...
閱讀原文

SWE-1.5

SWE-1.5 是AI獨角獸 Cognition 推出的專為軟件工程設計的高性能 AI 編程模型。擁有數百億參數,具備接近最先進水平的編碼能力,同時在速度上取得重大突破,推...
閱讀原文

LTX-2

LTX-2 是 Lightricks 開發的先進 AI 視頻生成模型,專為高質量視頻創作設計。能以原生 4K 分辨率和 50fps 的幀率生成電影級視頻,支持多模態輸入,包括文字、...
閱讀原文

WOWService

WOWService 是美團 LongCat 團隊發布的智能交互系統,通過融合大型語言模型(LLMs)和多智能體架構,優化用戶體驗并降低成本。系統針對智能交互領域的五大挑...
閱讀原文

Aardvark

Aardvark 是 OpenAI 推出的基于 GPT-5 的智能體,能自動發現和修復代碼中的安全漏洞。Aardvark通過不間斷地分析源代碼倉庫,識別漏洞、評估可利用性、劃分嚴...
閱讀原文

Kimi Linear

Kimi Linear 是月之暗面推出的新型混合線性注意力架構,專為提升大型語言模型(LLMs)在長序列任務中的效率和性能設計。核心組件 Kimi Delta Attention(KDA...
閱讀原文

Music 2.0

Music 2.0 是MiniMax最新推出的先進音樂創作模型。模型能精準捕捉和還原人聲的細膩情緒與器樂的動態張力,支持多種唱法和風格切換,如流行、爵士、搖滾等,還...
閱讀原文

Firefly Image 5

Firefly Image 5 是 Adobe 發布的最新圖像生成模型。具備原生400萬像素輸出能力,能直接生成高分辨率圖像,細節表現力大幅提升。在人物渲染方面,新模型優化...
閱讀原文

Speech 2.6

Speech 2.6 是MiniMax推出的全新語音生成模型,專為新一代語音智能體設計,具備超低延時(低于250毫秒),確保實時對話流暢;支持多種語言的網址、郵箱、電話...
閱讀原文

FIBO

FIBO 是首個開源的、原生支持 JSON 的文本生成圖像模型,專為長結構化描述訓練而成。模型在超過 1 億條結構化 JSON 描述(每條約 1,000 字)上訓練,能精確、...
閱讀原文

Sonic-3

Sonic-3是Cartesia最新發布的語音AI引擎,是當前市場上速度最快、最自然的實時語音對話模型。采用創新的“狀態空間模型”(SSM)架構,非傳統的Transformer模型...
閱讀原文

SoulX-Podcast

SoulX-Podcast 是 Soul AI Lab 推出的多說話人文本到語音(TTS)模型,專為生成長篇播客對話設計。模型參數為1.7B,支持普通話、英語及多種漢語方言(如四川...
閱讀原文

GigaBrain-0

GigaBrain-0 是新型的視覺-語言-行動(VLA)基礎模型,由世界模型生成的數據驅動。模型通過大規模生成多樣化數據,減少了對真實機器人數據的依賴,顯著提升了...
閱讀原文
12345154