AI項(xiàng)目和框架
OpenAudio S1
OpenAudio S1是Fish Audio推出的文本轉(zhuǎn)語音(TTS)模型,基于超過200萬小時的音頻數(shù)據(jù)訓(xùn)練,支持13種語言。采用雙自回歸(Dual-AR)架構(gòu)和強(qiáng)化學(xué)習(xí)與人類反饋...
PlayDiffusion
PlayDiffusion是PlayAI推出的新型音頻編輯模型,基于擴(kuò)散模型技術(shù),專門用在音頻的精細(xì)編輯和修復(fù)。模型將音頻編碼為離散的標(biāo)記序列,對需要修改的部分進(jìn)行掩...
Auto Think
Auto Think是快手Kwaipilot團(tuán)隊(duì)開源的KwaiCoder-AutoThink-preview自動思考大模型,模型針對深度思考大模型存在的“過度思考”問題進(jìn)行了深入研究,提出了一種...
Firesearch
Firesearch 是 Mendable AI 團(tuán)隊(duì)推出的 AI 驅(qū)動的深度研究工具。基于 Firecrawl 多源網(wǎng)絡(luò)內(nèi)容提取技術(shù),結(jié)合 OpenAI GPT-4o 的搜索規(guī)劃和內(nèi)容生成能力,將復(fù)...
Google AI Edge Gallery
Google AI Edge Gallery 是谷歌推出的實(shí)驗(yàn)性應(yīng)用,支持讓用戶在本地設(shè)備上體驗(yàn)和使用機(jī)器學(xué)習(xí)(ML)及生成式人工智能(GenAI)模型。應(yīng)用目前支持在 Android...
Circuit Tracer
Circuit Tracer 是 Anthropic 推出的開源工具,用在研究大型語言模型的內(nèi)部工作機(jī)制。Circuit Tracer 基于生成歸因圖(attribution graphs)揭示模型在生成特...
粵公網(wǎng)安備 44011502001135號