標簽:多語言支持

FunASR

FunASR是由阿里巴巴達摩院開源的語音識別工具包,提供包括語音識別(ASR)、語音活動檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離及多說話人ASR...
閱讀原文

Hallo2

Hallo2是復旦大學、百度公司和南京大學共同推出的音頻驅動視頻生成模型。能將單張參考圖片和持續(xù)幾分鐘的音頻輸入結合起來,基于可選的文本提示調節(jié)肖像表情...
閱讀原文

Marco

Marco是阿里國際最新推出的大規(guī)模商用翻譯大模型,支持15種全球主流語種,包括中、英、日、韓、西、法等。在BLEU評測指標上超越Google翻譯、DeepL、GPT-4等競...
閱讀原文

TANGO

TANGO 是一個由東京大學和 CyberAgent AI Lab 共同推出的開源框架,專注于生成與目標語音同步的全身手勢視頻。基于分層音頻運動嵌入和擴散插值網(wǎng)絡,將目標語...
閱讀原文

Any Summary

Any Summary是一款基于人工智能技術的文檔總結工具,能快速分析和總結長文本、音頻或視頻文件。用戶可以上傳文件或提供鏈接,Any Summary將用AI技術提取關鍵...
閱讀原文

adcopy

adcopy 是一款專為 Meta(Facebook)廣告平臺設計的 AI 驅動廣告工具,通過運用人工智能技術幫助用戶生成廣告文案、優(yōu)化廣告投放,并提供 A/B 測試數(shù)據(jù)。支持...
閱讀原文

yaara.ai

yaara.ai 是一款AI驅動的內容創(chuàng)作工具,幫助用戶快速生成高質量、高轉化率的文章、博客、社交媒體帖子等。平臺支持25種語言,提供2分鐘快速注冊,支持免費試...
閱讀原文

EVE

EVE是一款由自然選擇(深圳)智能有限公司推出的3D AI伴侶產(chǎn)品,旨在基于先進的AI技術和藝術設計,為用戶提供深度的情感陪伴體驗。EVE基于億級獨家語料庫,自...
閱讀原文

ChatGPT Windows客戶端

ChatGPT Windows客戶端是OpenAI為Windows操作系統(tǒng)用戶推出的桌面應用程序。支持用戶在Windows設備上更便捷地使用ChatGPT的功能,無需用瀏覽器訪問網(wǎng)頁版。Cha...
閱讀原文

CodeWP

CodeWP 是一款專為 WordPress 開發(fā)者和內容創(chuàng)作者設計的人工智能平臺。通過運用專門針對 WordPress 及其流行插件(如 Gutenberg 和 Elementor)訓練的 AI 模...
閱讀原文

Siuuu.AI

Siuuu.AI 是一款多功能的AI寫作輔助工具,專為作家、學生、教育者和營銷人員等各類用戶設計。Siuuu.AI基于一系列創(chuàng)新的 AI 功能,如故事寫作、論文撰寫和博客...
閱讀原文

IterComp

IterComp是一個由清華大學、北京大學、LibAI Lab、中國科學技術大學、牛津大學和普林斯頓大學的研究人員聯(lián)合推出的文本到圖像生成框架。基于迭代反饋學習機制...
閱讀原文

Spirit LM

Spirit LM是由Meta AI團隊推出的一種多模態(tài)語言模型,能無縫地混合文本和語音數(shù)據(jù)。Spirit LM基于一個預訓練的文本語言模型,用持續(xù)在文本和語音單元上的訓練...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個輕量級且獨立的代碼庫,旨在助力大規(guī)模訓練語言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構、損失函數(shù)和...
閱讀原文

ComfyGen

ComfyGen是由NVIDIA和特拉維夫大學研究人員推出的一種文本到圖像生成系統(tǒng),基于大型語言模型(LLM)自動創(chuàng)建與用戶文本提示相匹配的工作流,提升圖像生成的質...
閱讀原文
1515253545562