標簽:用戶行為追蹤
FlagevalMM:智源多模態(tài)模型評測框架的創(chuàng)新特性與應(yīng)用潛力
FlagEvalMM是北京智源人工智能研究院開源的多模態(tài)模型評測框架,能全面評估處理文本、圖像、視頻等多種模態(tài)的模型,支持多種任務(wù)和指標。框架采用評測與模型...
Fugatto:英偉達推出性多功能AI音頻生成模型,支持高質(zhì)量音頻合成與實時語音轉(zhuǎn)換
Fugatto是英偉達(NVIDIA)推出的音頻合成和轉(zhuǎn)換模型,全稱為"Foundational Generative Audio Transformer Opus 1"。模型能根據(jù)文本提示生成音頻或...
Momen:全面無代碼開發(fā)平臺助力AI應(yīng)用快速構(gòu)建與全棧支持
Momen是無代碼全棧Web應(yīng)用構(gòu)建平臺,支持用戶無需編程知識即可設(shè)計、構(gòu)建和部署定制化的Web應(yīng)用。平臺提供直觀的可視化界面,覆蓋從前端設(shè)計到后端邏輯的完整...
kadoa:高效便捷的零編碼工具助力輕松提取網(wǎng)頁非結(jié)構(gòu)化數(shù)據(jù)
kadoa是AI驅(qū)動的網(wǎng)絡(luò)數(shù)據(jù)抓取工具,用自動化的方式幫助用戶從網(wǎng)站提取非結(jié)構(gòu)化數(shù)據(jù),無需編碼即可從網(wǎng)站、PDF、電子郵件和演示文稿等來源提取和處理數(shù)據(jù)。基...
LinkFox AI
LinkFox AI 是專為跨境電商設(shè)計開發(fā)的AI工具。提供AI文案生成和高效作圖功能,幫助賣家快速創(chuàng)建吸引人的產(chǎn)品描述和專業(yè)圖片。LinkFox AI 集成了多種分析工具...
Follow-Your-Click
Follow-Your-Click是一個由來自騰訊公司(混元團隊)聯(lián)合清華大學(xué)和香港科技大學(xué)的研究人員共同研發(fā)的圖像到視頻(Image-to-Video,簡稱I2V)生成模型,允許...
ConFiner
ConFiner 是一個創(chuàng)新的視頻生成框架,由多所大學(xué)和研究機構(gòu)共同推出。結(jié)合多個現(xiàn)成的擴散模型專家,無需額外訓(xùn)練可生成高質(zhì)量且連貫的視頻內(nèi)容。
Realtime API
Realtime API是OpenAI推出的一種低延遲、多模態(tài)的對話式API,支持文本和音頻作為輸入和輸出。Realtime API允許開發(fā)者構(gòu)建接近實時的交互體驗,例如語音對語音...
Ferret-UI 2
Ferret-UI 2是蘋果公司推出的多模態(tài)大型語言模型,用在理解和交互移動用戶界面。Ferret-UI 2能識別和理解各種移動設(shè)備屏幕上的UI元素,執(zhí)行復(fù)雜的用戶指令,...
12