標簽:語音識別
呱呱有聲:全流程一體化AI配音平臺打造高品質(zhì)長音頻內(nèi)容
呱呱有聲是AIGC長音頻數(shù)字內(nèi)容生產(chǎn)開放平臺,靈伴智能開發(fā)。通過人工智能技術(shù),實現(xiàn)了從“文本”到“作品”的全流程AI生產(chǎn),大幅提升產(chǎn)能。平臺特色包括人機結(jié)合...
DupDub:智能內(nèi)容創(chuàng)作平臺助您快速生成高質(zhì)量視頻、文本與音頻內(nèi)容
DupDub是出門問問推出的創(chuàng)新AI內(nèi)容生成平臺,旨在幫助內(nèi)容創(chuàng)作者高效制作視頻、文本和音頻內(nèi)容。提供AI寫作、文本轉(zhuǎn)語音、AI頭像動畫化和視頻編輯等功能,支...
SAM 2.1:Meta開源的先進視覺分割模型提升圖像處理精度與效率
SAM 2.1(全稱Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先進視覺分割模型,用于圖像和視頻。基于簡單的Transformer架構(gòu)和流式記憶設(shè)計...
金舟AI助手:創(chuàng)新設(shè)計與卓越性能的完美結(jié)合提升您的生活品質(zhì)
金舟AI助手是創(chuàng)新的營銷內(nèi)容創(chuàng)作平臺,基于人工智能和大數(shù)據(jù)技術(shù),為創(chuàng)作者、品牌主和營銷服務(wù)公司提供高效的內(nèi)容創(chuàng)作解決方案。平臺能快速生成富有創(chuàng)意和針...
DynaSaur:Adobe創(chuàng)新推出的多功能大語言模型代理框架提升創(chuàng)作效率與智能化體驗
DynaSaur是Adobe Research推出的大型語言模型(LLM)代理框架,突破傳統(tǒng)LLM代理系統(tǒng)受限于預(yù)定義動作集合的限制。框架支持代理動態(tài)創(chuàng)建和組合動作,基于生成...
Takin AudioLLM:創(chuàng)新零樣本語音生成模型助力個性化語音合成體驗
Takin AudioLLM是喜馬拉雅Everest團隊推出的一系列高質(zhì)量零樣本語音生成模型,包括Takin TTS、Takin VC和Takin Morphing。模型用最新的大型語言模型技術(shù),專...
Meta開源大禮包:探索圖像分割、語音識別、文本處理等前沿科技的無限可能!
原標題:一文看盡Meta開源大禮包!全面覆蓋圖像分割、語音、文本、表征、材料發(fā)現(xiàn)、密碼安全性等 文章來源:新智元 內(nèi)容字數(shù):6434字Meta開源AI項目推動技術(shù)...
AI醬:實時多語言對話的二次元風格AI助手
AI醬是二次元風格的AI多語言智能聊天APP,提供了多個二次元萌妹和帥哥形象,用戶可以與這些角色進行面對面的即時對話。應(yīng)用基于語音識別能力和人工智能技術(shù),...
滴文:智能化標書定制服務(wù)助力高效投標管理
滴文是在線服務(wù)平臺,基于AI技術(shù)簡化標書的制作和交付流程。在短時間內(nèi)生成多頁標書文檔,滿足緊急交付需求。平臺提供多行業(yè)覆蓋的標書模板,確保輸出的標書...
LEOPARD:騰訊AI Lab推出的視覺語言模型賦能多模態(tài)理解與生成
LEOPARD是騰訊AI Lab西雅圖實驗室推出的視覺語言模型,專為理解和處理含有大量文本的多圖像任務(wù)設(shè)計。LEOPARD基于兩個主要技術(shù)創(chuàng)新:一是策劃約一百萬條專門...
顛覆語音通話體驗:字節(jié)跳動豆包大模型實現(xiàn)實時互動新
原標題:字節(jié)跳動豆包大模型支持實時語音通話 文章來源:小夏聊AIGC 內(nèi)容字數(shù):3297字豆包大模型實時語音通話使用教程 隨著人工智能技術(shù)的快速發(fā)展,豆包大...
躍問視頻:智能生成視頻的全新工具助力創(chuàng)意無限
躍問視頻是階躍星辰推出的AI視頻生成工具,支持多種視頻創(chuàng)作主題,例如城市、科幻、自然、跑車、美食等。用戶可以通過躍問視頻官方提供的視頻示例獲得創(chuàng)意靈...
訊飛星辰:個性化AI大模型定制訓練平臺助力智能應(yīng)用創(chuàng)新
訊飛星辰是科大訊飛推出的AI大模型定制訓練平臺,創(chuàng)建你的專屬定制大模型。訊飛星辰匯集20多個行業(yè)內(nèi)知名的優(yōu)質(zhì)模型,如星火大模型、Llama3等,支持零代碼微...