Inverse Painting
Inverse Painting 是一種AI技術(shù),由華盛頓大學(xué)的研究人員推出,能逆向重現(xiàn)繪畫(huà)過(guò)程。通過(guò)分析藝術(shù)家的繪畫(huà)視頻,學(xué)習(xí)繪畫(huà)技巧和順序,然后生成一系列繪畫(huà)指令...
Playground v3
Playground v3(PGv3)是由Playground Research推出的最新文本到圖像模型,基于深度融合的大型語(yǔ)言模型(LLM)技術(shù),實(shí)現(xiàn)在圖形設(shè)計(jì)任務(wù)上超越人類(lèi)設(shè)計(jì)師的能...
Transkriptor
Transkriptor 是一款強(qiáng)大的在線(xiàn)音頻和視頻轉(zhuǎn)錄工具,基于先進(jìn)的AI技術(shù)將語(yǔ)音內(nèi)容轉(zhuǎn)換成文本。工具支持100多種語(yǔ)言,處理各種格式的音頻和視頻文件,為用戶(hù)提...
Reverb ASR
Reverb ASR是Rev公司推出的開(kāi)源自動(dòng)語(yǔ)音識(shí)別和說(shuō)話(huà)人分離模型,基于20萬(wàn)小時(shí)的人工轉(zhuǎn)錄英語(yǔ)數(shù)據(jù)訓(xùn)練而成。模型在長(zhǎng)語(yǔ)音識(shí)別領(lǐng)域表現(xiàn)卓越,適合處理如播客和財(cái)...
Open NotebookLM
Open NotebookLM 是一個(gè)開(kāi)源的AI工具,基于最新的開(kāi)源AI模型,如Llama 3.1 405B、MeloTTS和Bark,將PDF文檔轉(zhuǎn)換成播客形式的音頻內(nèi)容。工具適合將書(shū)面信息轉(zhuǎn)...
StoryDiffusion
StoryDiffusion是一個(gè)先進(jìn)的AI圖像和視頻生成框架,用于從文本描述生成具有一致性的圖像和視頻序列。基于Consistent Self-Attention機(jī)制增強(qiáng)圖像間的一致性,...
InteriorAI Room Planner
InteriorAI Room Planner 是一款基于人工智能技術(shù)的在線(xiàn)室內(nèi)設(shè)計(jì)工具,能讓用戶(hù)通過(guò)上傳房間照片,快速獲得AI生成的室內(nèi)設(shè)計(jì)方案。結(jié)合了室內(nèi)設(shè)計(jì)智慧和先進(jìn)...