標簽:自然語言處理

Mobius

Mobius 是先進的無縫循環視頻生成技術,能通過人工智能算法從文本描述生成無限循環的視頻內容。核心在于強大的AI模型,能自動識別視頻中的關鍵元素并生成平滑...
閱讀原文

HippoRAG 2

HippoRAG 2是俄亥俄州立大學推出的檢索增強生成(RAG)框架,解決現有RAG系統在模擬人類長期記憶動態性和關聯性方面的局限性。HippoRAG 2基于個性化PageRank...
閱讀原文

AIMv2

AIMv2是蘋果公司開源的多模態自回歸預訓練視覺模型,通過圖像和文本的深度融合提升視覺模型的性能。采用創新的預訓練框架,將圖像劃分為非重疊的圖像塊,將文...
閱讀原文

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音頻大語言模型,支持無縫集成音頻理解和生成功能,實現支持高質量、可控的實時中英雙語對話。Baichuan-Audio基于多碼...
閱讀原文

Pika 2.2

Pika 2.2 是 Pika Labs 推出的升級版 AI 視頻生成工具,基于深度學習技術,能將圖片或文字提示轉化為高質量的視頻內容。與前代版本相比,Pika 2.2 在功能和性...
閱讀原文

SEO AI Agent

SEO AI Agent 是 Writesonic 推出的革命性的自動化 SEO 工具,通過人工智能技術,為用戶提供全流程的 SEO 解決方案。能快速完成關鍵詞研究、競爭對手分析、內...
閱讀原文

3FS

3FS(Fire-Flyer File System)是DeepSeek推出的高性能分布式文件系統,專為AI訓練和推理任務設計。3FS用現代SSD和RDMA網絡技術,基于分離式架構聚合數千個SS...
閱讀原文

IndexTTS

IndexTTS 是 B 站推出的工業級可控文本轉語音(TTS)系統。基于 XTTS 和 Tortoise 模型開發,結合了 GPT 風格的生成技術,能將文本高效轉化為自然流暢的語音...
閱讀原文

All Voice Lab

All Voice Lab(趣丸千音)是全球領先的AI語音創作平臺,提供一站式智能語音解決方案,基于趣丸科技與香港中文大學(深圳)聯合研發的MaskGCT語音大模型開發...
閱讀原文

a0.dev

a0.dev 是基于 AI 技術的開發平臺,專注于快速生成 React Native 應用。a0.dev 基于自然語言輸入,自動生成完整的 React Native 項目代碼,包括前端界面、狀...
閱讀原文

騰訊混元Turbo S

騰訊混元Turbo S是騰訊推出的新一代快思考模型。模型采用創新的Hybrid-Mamba-Transformer融合架構,有效降低了傳統Transformer的計算復雜度,減少了KV-Cache...
閱讀原文

EPLB

EPLB(Expert Parallelism Load Balancer)是 DeepSeek 推出的專家并行負載均衡器,能解決大規模模型訓練中不同專家模型(Expert)負載不均的問題。EPLB 基于...
閱讀原文

Landing

Landing是AI落地頁生成工具,通過 AI 技術,能在幾分鐘內快速生成美觀且高效的落地頁。用戶只需輸入品牌信息和關鍵詞,Landing會自動提取品牌風格,生成匹配...
閱讀原文

Flame

Flame是開源的多模態AI模型,支持將UI設計截圖轉換為高質量的現代前端代碼。Flame基于視覺語言建模、自動化數據合成和結構化訓練流程,生成符合React等現代前...
閱讀原文

TinyR1-Preview

TinyR1-Preview是北京大學計算機學院與360公司聯合推出的32B參數量的推理模型。模型僅用5%的參數量,逼近Deepseek-R1-671B的性能,TinyR1-Preview在數學領域...
閱讀原文
1151617181967