<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        AIGC動態2年前 (2024)發布 機器之心
        532 0 0

        復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        AIGC動態歡迎閱讀

        原標題:復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持
        關鍵字:模型,語言,圖像,任務,文本
        文章來源:機器之心
        內容字數:4395字

        內容摘要:


        機器之心報道
        機器之心編輯部最近,OpenAI 的視頻生成模型 Sora 爆火,生成式 AI 模型在多模態方面的能力再次引起廣泛關注。
        現實世界本質上是多模態的,生物體通過不同的渠道感知和交換信息,包括視覺、語言、聲音和觸覺。開發多模態系統的一個有望方向是增強 LLM 的多模態感知能力,主要涉及多模態編碼器與語言模型的集成,從而使其能夠跨各種模態處理信息,并利用 LLM 的文本處理能力來產生連貫的響應。
        然而,該策略僅限于文本生成,不包含多模態輸出。一些開創性工作通過在語言模型中實現多模態理解和生成取得了重大進展,但這些模型僅包含單一的非文本模態,例如圖像或音頻。
        為了解決上述問題,復旦大學邱錫鵬團隊聯合 Multimodal Art Projection(MAP)、上海人工智能實驗室的研究者提出了一種名為 AnyGPT 的多模態語言模型,該模型能夠以任意的模態組合來理解和推理各種模態的內容。具體來說,AnyGPT 可以理解文本、語音、圖像、音樂等多種模態交織的指令,并能熟練地選擇合適的多模態組合進行響應。
        例如給出一段語音 prompt,AnyGPT 能夠生成語音、圖像、音樂形式的綜


        原文鏈接:復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 成全影视免费观看大全二| 久久久久久影院久久久久免费精品国产小说 | 亚洲午夜福利在线观看| 免费大片av手机看片高清| 国产亚洲精品免费| 午夜免费国产体验区免费的| 亚洲国产主播精品极品网红 | 亚洲中文字幕无码久久2017| 国产成人无码免费看片软件| 久久经典免费视频| 中文文字幕文字幕亚洲色| 91在线免费观看| 亚洲国产精品高清久久久| 久久青草精品38国产免费| 亚洲男人第一av网站| 一级毛片免费在线| 亚洲人成网站在线观看播放| 日韩国产欧美亚洲v片| 一本久久综合亚洲鲁鲁五月天| 777亚洲精品乱码久久久久久| 一级毛片免费毛片毛片| 午夜一级毛片免费视频| 美女黄频视频大全免费的| 黑人大战亚洲人精品一区| 蜜臀98精品国产免费观看| 亚洲另类自拍丝袜第五页| 亚洲国产成人VA在线观看| 久操免费在线观看| 中文字幕无码精品亚洲资源网久久| 日本一卡精品视频免费| 亚洲色婷婷一区二区三区| 99免费在线观看视频| 亚洲av无码一区二区三区在线播放| 国产成人精品久久免费动漫| 亚洲av无码一区二区三区四区| 国产妇乱子伦视频免费| 深夜A级毛片视频免费| 色婷婷六月亚洲婷婷丁香| 毛片在线播放免费观看| 在线aⅴ亚洲中文字幕| 亚洲真人无码永久在线|