標簽:文本生成

EMO

EMO(Emote Portrait Alive)是一個由阿里巴巴集團智能計算研究院的研究人員開發的框架,一個音頻驅動的AI肖像視頻生成系統,能夠通過輸入單一的參考圖像和語...
閱讀原文

TextDiffuser-2

Text-Diffuser 2是由來自微軟研究院、香港科技大學和中山大學的研究人員最新推出的一個基于擴散模型的文本渲染方法,旨在解決圖像擴散模型生成文字時在靈活性...
閱讀原文

Claude 3

Claude 3是人工智能初創公司Anthropic開發的新一代人工智能模型,旨在提供先進的認知能力和智能處理任務。Claude 3模型家族包括三個不同級別的模型,按性能強...
閱讀原文

Llama 3

Llama 3是Meta公司最新開源推出的新一代大型語言模型(LLM),包含8B和70B兩種參數規模的模型,標志著開源人工智能領域的又一重大進步。作為Llama系列的第三...
閱讀原文

CogVLM2

CogVLM2是由智譜AI推出的新一代多模態大模型,在視覺和語言理解方面實現了顯著的性能提升,支持高達8K的文本長度和1344*1344分辨率的圖像輸入,具備強大的文...
閱讀原文

Gemma 2

Gemma 2是谷歌DeepMind推出的新一代開源人工智能模型,包含90億和270億參數版本。該模型以卓越的性能、高效的推理速度和廣泛的硬件兼容性為特點,能夠與參數...
閱讀原文

Moshi

Moshi是由法國的的人工智能研究實驗室Kyutai推出的一款端到端實時音頻多模態AI模型,擁有聽、說、看的能力,并能模擬70種不同的情緒和風格進行交流。作為對標...
閱讀原文

盤盤單詞

盤盤單詞是百度網盤推出的AI英語學習微信小程序。采用生成式AI技術,分析用戶百度網盤的照片,提取關鍵元素,自動生成與用戶生活緊密相關的英語單詞和例句,...
閱讀原文

DCLM-7B

DCLM-7B是由蘋果公司聯合研究團隊推出的70億參數開源小模型,性能超越Mistral-7B,接近Llama 3和Gemma。最近,蘋果公司作為 DataComp-LM(DCLM)項目的研究機...
閱讀原文

Llama3.1

Llama 3.1是Meta最新發布的開源AI模型,包括8B、70B和405B三個版本,其中405B版本以其4050億參數量成為目前最大的開源模型之一。Llama 3.1支持128K的上下文長...
閱讀原文

Amuse AI

Amuse 2.0是AMD最新推出的AI圖像生成工具,專為AMD硬件優化,支持在PC上生成高質量圖像。Amuse 2.0具備設計模式,能夠將用戶草圖和文本提示轉化為圖像,同時...
閱讀原文

智譜AI開放平臺

智譜AI開放平臺 是一個面向開發者的大模型開發平臺。整合了先進的模型能力、豐富的開發資源、自定義知識庫及應用體驗中心,助力開發者利用GLM大模型的技術潛...

Falcon Mamba 7B

Falcon Mamba 7B是阿聯酋技術創新研究所(TII)推出的開源AI大模型,性能超越了Meta的Llama 3.1-8B等模型。Falcon Mamba 7B采用編碼器-解碼器結構和多頭注意...
閱讀原文

微博嘴替

微博嘴替是一個微博賬戶AI趣味分析應用,專為微博用戶設計。微博嘴替通過分析用戶的微博資料和內容,生成犀利、幽默風趣和個性化的吐槽。
閱讀原文

Glyph-ByT5

Glyph-ByT5-v2由微軟亞洲研究院、清華大學、北京大學和利物浦大學聯合開發的多語言視覺文本渲染項目。Glyph-ByT5-v2支持10種不同語言的準確視覺文本渲染,審...
閱讀原文
1789101113