微軟聯(lián)合清華推出的多模態(tài)生成模型
LatentLM是微軟研究院和清華大學(xué)共同推出的多模態(tài)生成模型,能統(tǒng)一處理離散數(shù)據(jù)(如文本)和連續(xù)數(shù)據(jù)(如圖像、音頻)。模型用變分自編碼器(VAE)將連續(xù)數(shù)據(jù)...
Lyra:提升多模態(tài)交互體驗的SmartMore創(chuàng)新解決方案
Lyra是香港中文大學(xué)、SmartMore和香港科技大學(xué)推出的高效多模態(tài)大型語言模型(MLLM),專注于提升語音、視覺和語言模態(tài)的交互能力。Lyra基于開源大型模型、多...
圖森未來推出的圖生視頻大模型
Ruyi是圖森未來科技有限公司推出的圖生視頻大模型,專為在消費級顯卡上運行設(shè)計,支持多分辨率、多時長視頻生成,具備首幀、首尾幀控制、運動幅度控制和鏡頭...
AI服裝設(shè)計工具,覆蓋設(shè)計核心環(huán)節(jié)款式生成、局部優(yōu)化等功能
潮際主設(shè)是AI時尚設(shè)計工具,專為服裝設(shè)計師、時尚從業(yè)者和創(chuàng)意人士打造。基于AI技術(shù)賦能設(shè)計流程,從靈感生成到細節(jié)優(yōu)化,提高設(shè)計效率,激發(fā)創(chuàng)意。潮際主設(shè)...
Large Action Models:微軟行動大模型開發(fā)框架助力高效智能應(yīng)用構(gòu)建與部署
Large Action Models(LAMs)是微軟推出大型行動模型的開發(fā)框架,能執(zhí)行真實世界行動的智能系統(tǒng),LAMs超越傳統(tǒng)LLMs(Large Language Models,大型語言模型)...
Meta 開源的圖像生成框架,精確控制人物的外觀和姿勢
Leffa(Learning Flow Fields in Attention)是 Meta AI推出的用在可控人物圖像生成框架,基于在注意力機制中引入流場學(xué)習(xí),精確控制人物的外觀和姿勢。Leffa...
專為電商營銷領(lǐng)域打造的 AI 商拍工具
潮際好麥?zhǔn)腔贏I技術(shù)為核心的電商營銷平臺,專為電商從業(yè)者設(shè)計。潮際好麥基于虛擬試衣、服飾換色、AI換臉和背景替換等功能,幫助用戶低成本、高效率地生成...
Apollo:Meta與斯坦福大學(xué)攜手推出創(chuàng)新多模態(tài)模型,實現(xiàn)圖像與文本的深度融合與理解
Apollo是Meta和斯坦福大學(xué)合作推出的大型多模態(tài)模型(LMMs),專注于視頻理解。Apollo基于系統(tǒng)研究,揭示視頻理解在LMMs中的關(guān)鍵驅(qū)動因素,推出“Scaling Cons...
Whisk:谷歌全新AI圖像生成工具助力創(chuàng)意無限,輕松打造精彩視覺作品
Whisk 是谷歌推出的 AI 圖像生成工具,支持用戶上傳圖像指定生成圖像的主題、場景和風(fēng)格,無需長文本提示。用戶能為每個類別提供多張圖像,或用谷歌自動填充...
BrushEdit:智能指令驅(qū)動的圖像編輯與修復(fù)框架全面提升創(chuàng)作效率與質(zhì)量
BrushEdit是騰訊和北京大學(xué)等機構(gòu)聯(lián)合推出的先進圖像編輯框架,是BrushNet模型的高級迭代版本。框架結(jié)合多模態(tài)大型語言模型(MLLMs)和雙分支圖像修復(fù)模型,...
AI虛擬人物生成器,高度定制化生成多語言虛擬形象
TalkingAvatar.ai 是AI虛擬形象創(chuàng)作平臺,支持用戶基于AI技術(shù)重寫和重配音視頻,實現(xiàn)聲音克隆和唇形同步。平臺適合內(nèi)容創(chuàng)作者、廣告代理商、市場營銷人員和教...
AI合同審查工具,自動分析提取關(guān)鍵條款識別風(fēng)險語言
LEGAL ROBOT是基于AI技術(shù)自動化分析和簡化法律文件的平臺。LEGAL ROBOT能自動提取合同中的關(guān)鍵條款,將復(fù)雜的法律術(shù)語翻譯成通俗易懂的語言,提高合同的可理...
AI音樂生成工具,創(chuàng)建個性化的說唱歌曲和歌詞
Rap Generator是基于AI技術(shù)的在線說唱音樂生成工具,支持許用戶免費創(chuàng)建和生成個性化的說唱歌曲和歌詞。用戶自定義輸入歌詞,選擇配樂和音樂風(fēng)格,為歌曲命名...
AI日程管理助手,自動分析日歷和待辦任務(wù)
reclaimai 是基于AI技術(shù)為團隊打造的智能日程安排工具,能提高工作效率和優(yōu)化時間管理。reclaimai基于自動化日程安排、集成日歷和任務(wù)管理,幫助用戶減少時間...
AI文本轉(zhuǎn)語音工具,支持多語言轉(zhuǎn)換、調(diào)整語速、音調(diào)、情感表達
Speechelo是先進的AI文本轉(zhuǎn)語音軟件,能將文本內(nèi)容迅速轉(zhuǎn)換成自然、逼真的人類語音。Speechelo能在語音中添加語調(diào),提供超過30種聽起來像人類的聲音,支持24...