標(biāo)簽:情感分析
Llama Nemotron
Llama Nemotron是NVIDIA推出的一系列推理模型,專注于推理和多種智能代理(agentic AI)任務(wù)。模型基于Llama開源模型,經(jīng)過NVIDIA的后訓(xùn)練,加入推理能力,在...
Nova Sonic
Nova Sonic 是亞馬遜推出的新型生成式 AI 語音模型。將語音理解與生成能力整合到一個(gè)模型中,能根據(jù)說話者的語調(diào)、風(fēng)格等聲學(xué)上下文調(diào)整生成的語音響應(yīng),對(duì)話...
SeniorTalk
SeniorTalk 是智源研究院聯(lián)合南開大學(xué)計(jì)算機(jī)學(xué)院人類語言技術(shù)實(shí)驗(yàn)室(HLT Lab)推出的全球首個(gè)中文超高齡老年人對(duì)話語音數(shù)據(jù)集。數(shù)據(jù)集包含202位75歲及以上超...
Quasar Alpha
Quasar Alpha 是 OpenRouter 發(fā)布的預(yù)發(fā)布版 AI 模型。擁有 100 萬 token 的超大上下文窗口,可處理超長文本和復(fù)雜文檔。代碼生成能力出色,生成速度快,延遲...
OmniTalker
OmniTalker 是阿里巴巴發(fā)布的實(shí)時(shí)文本驅(qū)動(dòng)的說話頭像生成技術(shù),能同時(shí)處理文本、圖像、音頻和視頻等多種模態(tài)輸入,以流式方式生成自然語音響應(yīng)。核心架構(gòu)為 T...
WorldScore
WorldScore 是斯坦福大學(xué)提出的用于世界生成模型的統(tǒng)一評(píng)估基準(zhǔn)。將世界生成分解為一系列的下一個(gè)場(chǎng)景生成任務(wù),通過明確的基于相機(jī)軌跡的布局規(guī)范來實(shí)現(xiàn)不同...
HeroUI Chat
HeroUI Chat 是基于AI技術(shù),將用戶提供的提示或屏幕截圖快速轉(zhuǎn)化為美觀能直接投入生產(chǎn)的 React 應(yīng)用程序工具。HeroUI Chat 讓用戶無需復(fù)雜的前端開發(fā)知識(shí),生...
Actor Mode
Actor Mode 是 ElevenLabs 推出的AI語音生成工具,支持用戶通過自己的聲音指導(dǎo) AI 生成語音內(nèi)容。用戶只需錄制一段音頻或上傳已有音頻文件,AI 能分析其語調(diào)...