<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        AIGC動態1年前 (2024)發布 機器之心
        522 0 0

        復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        AIGC動態歡迎閱讀

        原標題:復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持
        關鍵字:模型,語言,圖像,任務,文本
        文章來源:機器之心
        內容字數:4395字

        內容摘要:


        機器之心報道
        機器之心編輯部最近,OpenAI 的視頻生成模型 Sora 爆火,生成式 AI 模型在多模態方面的能力再次引起廣泛關注。
        現實世界本質上是多模態的,生物體通過不同的渠道感知和交換信息,包括視覺、語言、聲音和觸覺。開發多模態系統的一個有望方向是增強 LLM 的多模態感知能力,主要涉及多模態編碼器與語言模型的集成,從而使其能夠跨各種模態處理信息,并利用 LLM 的文本處理能力來產生連貫的響應。
        然而,該策略僅限于文本生成,不包含多模態輸出。一些開創性工作通過在語言模型中實現多模態理解和生成取得了重大進展,但這些模型僅包含單一的非文本模態,例如圖像或音頻。
        為了解決上述問題,復旦大學邱錫鵬團隊聯合 Multimodal Art Projection(MAP)、上海人工智能實驗室的研究者提出了一種名為 AnyGPT 的多模態語言模型,該模型能夠以任意的模態組合來理解和推理各種模態的內容。具體來說,AnyGPT 可以理解文本、語音、圖像、音樂等多種模態交織的指令,并能熟練地選擇合適的多模態組合進行響應。
        例如給出一段語音 prompt,AnyGPT 能夠生成語音、圖像、音樂形式的綜


        原文鏈接:復旦等發布AnyGPT:任意模態輸入輸出,圖像、音樂、文本、語音都支持

        聯系作者

        文章來源:機器之心
        作者微信:almosthuman2014
        作者簡介:專業的人工智能媒體和產業服務平臺

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 国产一区二区三区免费观看在线| 99在线在线视频免费视频观看| 亚洲色精品VR一区区三区| 久久久高清日本道免费观看| 亚洲爽爽一区二区三区| 日产久久强奸免费的看| 亚洲乱码中文字幕综合234| 女人体1963午夜免费视频| 伊人久久亚洲综合| a级毛片免费全部播放无码| 亚洲国产精品福利片在线观看| 亚洲国产午夜精品理论片| 国产h视频在线观看网站免费| 国产日产成人免费视频在线观看| 国产AV无码专区亚洲AWWW| 国产精品免费视频观看拍拍| 在线亚洲午夜理论AV大片| 免费一区二区无码东京热| 久久夜色精品国产噜噜噜亚洲AV| 久久久久亚洲精品日久生情| 日本免费网址大全在线观看 | 国产成人精品久久免费动漫| 亚洲高清美女一区二区三区| 91福利免费视频| 亚洲女女女同性video| 亚洲国产综合人成综合网站| 国产又黄又爽又大的免费视频| 国产男女猛烈无遮档免费视频网站| 亚洲国产精品久久久久久| 国产曰批免费视频播放免费s| 国产日产亚洲系列最新| 久久国产免费观看精品| 亚洲午夜在线一区| 免费A级毛片在线播放不收费| 亚洲国产日韩在线一区| 国产精品va无码免费麻豆| 99久久免费国产特黄| 亚洲一级毛片在线播放| 亚洲精品国自产拍在线观看| 午夜精品一区二区三区免费视频| 亚洲综合av永久无码精品一区二区 |