標簽:多語言翻譯

ContentV

ContentV是字節跳動開源的80億參數文生視頻模型框架。將Stable Diffusion 3.5 Large的2D-VAE替換為3D-VAE并引入3D位置編碼,使圖像模型快速獲得視頻生成能力。
閱讀原文

靈語文檔

靈語文檔(MindLink)是AI驅動的云文檔編輯平臺,為企業提供一站式文檔編輯和共享服務。平臺具備多組態支持,包括思維導圖、原型白板、可視化圖表等功能,支...
閱讀原文

Lillian

Lillian是Scrumball團隊推出的AI網紅營銷助手,基于AI技術為品牌提供高效、精準的網紅合作解決方案。Lillian能在短時間內完成網紅發現、分析與管理,解決傳統...
閱讀原文

TEN VAD

TEN VAD 是高性能的實時語音活動檢測系統,專為企業級應用設計。TEN VAD能精確地檢測音頻流中的語音活動,具有低延遲、輕量級和高精度的特點。TEN VAD 基于先...
閱讀原文

VITA-Audio

VITA-Audio 是開源的端到端多模態語音大模型,具有低延遲、推理速度快的特點。通過輕量級的多模態交叉標記預測(MCTP)模塊,可在首次前向傳播中生成音頻輸出...
閱讀原文

HoloTime

HoloTime 是北京大學深圳研究生院和鵬城實驗室推出的全景 4D 場景生成框架,基于視頻擴散模型將單張全景圖像轉化為具有真實動態效果的全景視頻,進一步重建為...
閱讀原文

TxGemma

TxGemma 是谷歌推出的用于藥物發現的通用人工智能模型,通過 AI 技術加速藥物研發進程。基于 Google 的 Gemma 框架開發,能理解常規文本以及化學物質、分子和...
閱讀原文

Gemini 2.5 Pro

Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個“思考模型”,能在回應前進行推理,提升性能和準確性。模型在多個基準測試中表現卓越,在推理和代碼生成方面...
閱讀原文

Revid AI

Revid AI 是 AI 視頻生成工具,幫助用戶快速創作吸引人的短視頻。Revid AI基于分析海量熱門視頻數據,提供從腳本生成、語音選擇到視頻風格定制的一站式服務。...
閱讀原文

如此AI

如此AI是AI驅動的內容營銷平臺,專為內容創作者和營銷團隊設計。如此AI提供一站式智能寫作、內容管理和多平臺分發工具,快速生成符合SEO標準且具有原創性和個...
閱讀原文

OLMo 2 32B

OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新開源語言模型,是 OLMo 2 系列的重要成果。擁有 320 億參數,是首個在多技能學術基準測試中超越 GPT-...
閱讀原文

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是多模態對話練習工具,幫助用戶應對各種困難對話場景而設計。支持創建和分享多種對話場景,如面試、職場溝通、銷售談判等,提供智能對...
閱讀原文

PySpur

PySpur 是開源的輕量級可視化 AI 智能體工作流構建器,簡化 AI 系統的開發流程。基于拖拽式界面讓用戶能快速構建、測試和迭代 AI 工作流,無需編寫復雜代碼。...
閱讀原文

SynCD

SynCD(Synthetic Customization Dataset)是卡內基梅隆大學和Meta推出的高質量合成訓練數據集,用在提升文本到圖像模型的定制化能力。SynCD包含多個相同對象...
閱讀原文

Onion AI

Onion AI是AI聚合搜索引擎,支持無縫切換多個AI搜索引擎,如Perplexity、ChatGPT、Google等,用戶能快速獲取不同平臺的搜索結果。Onion AI支持保存常用提示詞...
閱讀原文
1234