標簽:文本生成

什么是NLP自然語言處理?定義、重要性、發展和應用

NLP(Natural Language Processing),即自然語言處理,是計算機科學的一個領域,重點是創建能夠理解人類語音和語言的計算機和軟件。NLP使用人工智能和機器學...
閱讀原文

Perplexity

Perplexity AI是一款聊天機器人式的搜索引擎,允許用戶用自然語言提出問題,并使用生成式AI技術從各種來源收集獲取信息并給出答案。該AI搜索引擎將人工智能與...
閱讀原文

DiffusionGPT

DiffusionGPT是由來自字節跳動與中山大學的研究人員推出的一個開源的大模型(LLM)驅動的文本到圖像生成系統,旨在解決文生圖領域無法處理不同的輸入或者僅限...
閱讀原文

Mistral Large

Mistral Large是由法國人工智能公司Mistral AI開發的一款先進的大型語言模型(LLM),具備頂級的推理能力,能夠處理復雜的多語言推理任務,包括文本理解、轉...
閱讀原文

EMO

EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院的研究人員開發的框架,一個音頻驅動的AI肖像視頻生成系統,能夠通過輸入單一的參考圖像和語...
閱讀原文

TextDiffuser-2

Text-Diffuser 2是由來自微軟研究院、香港科技大學和中山大學的研究人員最新推出的一個基于擴散模型的文本渲染方法,旨在解決圖像擴散模型生成文字時在靈活性...
閱讀原文

Claude 3

Claude 3是人工智能初創公司Anthropic開發的新一代人工智能模型,旨在提供先進的認知能力和智能處理任務。Claude 3模型家族包括三個不同級別的模型,按性能強...
閱讀原文

Llama 3

Llama 3是Meta公司最新開源推出的新一代大型語言模型(LLM),包含8B和70B兩種參數規模的模型,標志著開源人工智能領域的又一重大進步。作為Llama系列的第三...
閱讀原文

CogVLM2

CogVLM2是由智譜AI推出的新一代多模態大模型,在視覺和語言理解方面實現了顯著的性能提升,支持高達8K的文本長度和1344*1344分辨率的圖像輸入,具備強大的文...
閱讀原文

Gemma 2

Gemma 2是谷歌DeepMind推出的新一代開源人工智能模型,包含90億和270億參數版本。該模型以卓越的性能、高效的推理速度和廣泛的硬件兼容性為特點,能夠與參數...
閱讀原文

Moshi

Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,并能模擬70種不同的情緒和風格進行交流。作為對標...
閱讀原文

盤盤單詞

盤盤單詞是百度網盤推出的AI英語學習微信小程序。采用生成式AI技術,分析用戶百度網盤的照片,提取關鍵元素,自動生成與用戶生活緊密相關的英語單詞和例句,...
閱讀原文

DCLM-7B

DCLM-7B是由蘋果公司聯合研究團隊推出的70億參數開源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,蘋果公司作為 DataComp-LM(DCLM)項目的研究機...
閱讀原文

Llama3.1

Llama 3.1是Meta最新發布的開源AI模型,包括8B、70B和405B三個版本,其中405B版本以其4050億參數量成為目前最大的開源模型之一。Llama 3.1支持128K的上下文長...
閱讀原文

Amuse AI

Amuse 2.0是AMD最新推出的AI圖像生成工具,專為AMD硬件優化,支持在PC上生成高質量圖像。Amuse 2.0具備設計模式,能夠將用戶草圖和文本提示轉化為圖像,同時...
閱讀原文
1789101113