標簽:自然語言處理

Lobe Chat

Lobe Chat是一個免費開源的高性能AI聊天機器人框架,提供了高顏值的聊天界面程序和豐富靈活的功能,支持語音合成、多模態、可擴展的插件系統,可一鍵免費部署...
閱讀原文

OpenVoice

OpenVoice是由MyShell推出的一個免費開源的AI即時語音克隆項目,相較于其他的語音克隆技術,OpenVoice的優勢在于僅需一段簡短的音頻,便能以驚人的準確度復刻...
閱讀原文

Perplexity

Perplexity AI是一款聊天機器人式的搜索引擎,允許用戶用自然語言提出問題,并使用生成式AI技術從各種來源收集獲取信息并給出答案。該AI搜索引擎將人工智能與...
閱讀原文

AnyText

AnyText是阿里巴巴智能計算研究院的團隊推出的一個基于擴散的多語言視覺文本生成和編輯模型,專注于在圖像中渲染準確和連貫的文本。AnyText包括兩個主要元素...
閱讀原文

360AI搜索

360AI搜索是360公司推出的一款集成了人工智能技術的搜索引擎,類似于Perplexity被設計為新一代答案引擎,旨在為用戶提供更加精準、全面和智能的搜索體驗。當...
閱讀原文

DiffusionGPT

DiffusionGPT是由來自字節跳動與中山大學的研究人員推出的一個開源的大模型(LLM)驅動的文本到圖像生成系統,旨在解決文生圖領域無法處理不同的輸入或者僅限...
閱讀原文

StarCoder 2

StarCoder 2是由BigCode項目團隊開發的新一代大型代碼語言模型,旨在為代碼生成、編輯和推理任務提供強大的支持。該系列模型在前一代StarCoder模型的基礎上進...
閱讀原文

DUSt3R

DUSt3R是由來自芬蘭阿爾托大學和Naver歐洲實驗室的研究人員推出的一個3D重建框架,旨在簡化從任意圖像集合中重建三維場景的過程,而無需事先了解相機校準或視...
閱讀原文

Claude 3

Claude 3是人工智能初創公司Anthropic開發的新一代人工智能模型,旨在提供先進的認知能力和智能處理任務。Claude 3模型家族包括三個不同級別的模型,按性能強...
閱讀原文

ResAdapter

ResAdapter是由字節跳動的研究人員推出的一種為擴散模型(如Stable Diffusion)設計的分辨率適配器,允許這些圖像生成模型生成具有任意分辨率和寬高比的圖像...
閱讀原文

ELLA

ELLA(Efficient Large Language Model Adapter,高效的大模型適配器)是由騰訊的研究人員推出的一種新型方法,旨在提升文本到圖像生成模型在處理復雜文本提...
閱讀原文

Grok-1

Grok-1 是由馬斯克旗下的人工智能初創公司 xAI 開發的一款大型語言模型,是一個混合專家(MoE)模型,擁有 3140 億參數,使其成為目前參數量最大的開源大語言...
閱讀原文

LATTE3D

LATTE3D是由英偉達的研究人員推出的一個文本生成3D對象的模型,能夠從文本提示描述快速生成高質量的3D內容(僅需400毫秒)。該技術的核心在于采用了一種稱為“...
閱讀原文

SUPIR

SUPIR是一個突破性的圖像修復和畫質增強方法,利用了大規模的生成模型StableDiffusion-XL(SDXL)和模型擴展技術,通過深度學習和多模態方法,實現了對低質量...
閱讀原文

VoiceCraft

VoiceCraft是一個由德克薩斯大學奧斯汀分校研究團隊開源的神經編解碼器語言模型,專注于零樣本語音編輯和文本到語音(TTS)任務。該模型采用Transformer架構...
閱讀原文
1444546474867