標簽:多語言支持

Boogie AI

Boogie AI是一款AI跳舞軟件,使用AI技術將用戶上傳的照片轉化為舞蹈視頻。自發布以來,Boogie AI迅速在美國iOS端免費應用排行榜上升至第18位,并在一個月內下...
閱讀原文

LabelU

LabelU 是一款開源的多模態數據標注工具,支持圖像、視頻和音頻的標注,具備拉框、多邊形、標點、標線、分類、描述等圖像標注能力,能滿足目標檢測、圖像分類...
閱讀原文

Subtitle Edit

Subtitle Edit是一款免費開源的多功能字幕編輯器,支持超過300種字幕格式,包括SRT、MicroDVD和Sub Station Alpha等。具備字幕同步、創建、翻譯、音頻波形可...
閱讀原文

神采PromeAI

神采PromeAI是一款專為設計師打造的AI設計助手。適合建筑師、室內設計師、產品設計師和游戲動漫設計師使用,通過強大的AIGC模型風格庫,用戶能通過簡單的文字...
閱讀原文

Linly-Dubbing

Linly-Dubbing是一個開源的智能視頻多語言AI配音和翻譯工具,能自動將視頻內容翻譯成多種語言,并生成字幕。通過WhisperX和FunASR進行精準語音識別,基于Edge...
閱讀原文

Odyssey

Odyssey是一個好萊塢級的AI視頻生成和編輯工具,OdysseyML提供技術支持,通過訓練四個高級生成模型,專注于創造精細的幾何圖形、逼真的材質、震撼的光照效果...
閱讀原文

Glyph-ByT5

Glyph-ByT5-v2由微軟亞洲研究院、清華大學、北京大學和利物浦大學聯合開發的多語言視覺文本渲染項目。Glyph-ByT5-v2支持10種不同語言的準確視覺文本渲染,審...
閱讀原文

Llama-3.1-Minitron

Llama-3.1-Minitron是由英偉達和Meta合作開發的AI模型,通過剪枝和知識蒸餾技術從Llama 3.1 8B模型精煉而成的更小型4B參數模型。這種優化減少了模型大小和復...
閱讀原文

Seed-ASR

Seed-ASR是字節跳動開發的一款基于大型語言模型(LLM)的語音識別(ASR)模型。在超過2000萬小時的語音數據和近90萬小時的配對ASR數據上訓練,支持普通話和13...
閱讀原文

Moffee

Moffee是開源的Markdown轉PPT工具,支持用戶使用Markdown語法快速創建專業的幻燈片。Moffee自動處理布局、分頁和樣式,支持實時預覽和導出為PDF或HTML格式。
閱讀原文

浦語靈筆

浦語靈筆IXC-2.5是上海人工智能實驗室推出的新一代多模態大模型,具備7B規模的大型語言模型后端。能處理長達96K的長上下文,支持超高分辨率圖像和細粒度視頻...
閱讀原文

新壹視頻大模型

新壹視頻大模型是新壹科技推出的AI視頻創作大模型,自研AI算法和深度學習技術,實現從劇本到成品的一鍵式創作。具備劇本生成、情感化語音合成、3D元素創建和...
閱讀原文

AskManyAI

AskManyAI是一站式AI大模型聚合平臺,匯聚了眾多頂尖AI模型,包括GPT、Claude、Kimi等,提供多角度的解答以提升問題解決的效率和可信度。用戶可以通過AskMany...
閱讀原文

TurboEdit

TurboEdit是Adobe Research 推出的AI即時圖像編輯模型。通過編碼器迭代反演和基于文本的精細控制,能夠在幾步內實現對圖像的精確編輯。利用詳細的文本提示,...
閱讀原文

源2.0-M32

源2.0-M32是浪潮信息推出的擁有32個專家的混合專家模型(MoE)。采用創新的"Attention Router"技術,提高了模型選擇專家的效率和準確性。模型總參數...
閱讀原文
1414243444561