<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        CogView4

        AI工具6個月前發布 AI工具集
        1,454 0 0

        CogView4 – 智譜開源的AI文生圖模型,支持生成漢字

        CogView4 是智譜科技推出的一款開源文生圖模型,擁有 60 億個參數,具備原生中文輸入與中文文字生成的能力。該模型在 DPG-Bench 基準測試中表現優異,綜合評分位列第一,成為開源文生圖模型領域的最新標桿(SOTA)。

        CogView4是什么

        CogView4 是智譜科技推出的開源文生圖模型,具備 60 億參數,能夠支持原生中文輸入及文字生成。作為首個遵循 Apache 2.0 協議的圖像生成模型,CogView4 不僅支持任意分辨率的圖像生成,還能根據復雜的文本描述生成高質量的圖像。

        CogView4

        CogView4的主要功能

        • 支持中英雙語輸入:CogView4 是首個支持漢字生成的開源文生圖模型,可以根據中文或英文輸入生成高質量圖像。
        • 任意分辨率圖像生成:該模型能夠生成分辨率范圍從 512×512 到 2048×2048 的圖像,滿足多種創作需求。
        • 卓越的語義對齊能力:在 DPG-Bench 基準測試中,CogView4 綜合評分名列前茅,顯示出其在復雜語義對齊及指令遵循方面的出色表現。
        • 中文文字繪畫:CogView4 特別優化了漢字生成能力,能夠將漢字自然融入圖像,適合廣告、短視頻等創意應用。
        • 顯存優化與高效推理:通過模型 CPU 卸載和文本編碼器量化等技術,CogView4 顯著降低了顯存使用,提高了推理效率。

        CogView4的技術原理

        • 架構設計:CogView4 結合了擴散模型與 Transformer 的架構。擴散模型通過逐步去噪生成圖像,而 Transformer 則負責處理文本和圖像的聯合表示。該模型使用了 6B 參數配置,支持任意長度的文本輸入與任意分辨率的圖像生成。
        • 文本編碼器與 Tokenizer:CogView4 采用了雙語(中英文)的 GLM-4 編碼器,能夠處理復雜的語義對齊任務。文本通過 Tokenizer 轉化為嵌入向量,隨后與圖像的潛在表示結合。
        • 圖像編碼與解碼:圖像通過變分自編碼器(VAE)編碼成潛在空間的表示,隨后通過擴散模型逐步去噪生成最終圖像,從而高效處理圖像生成任務。
        • 擴散過程與去噪:擴散模型的核心是通過一系列去噪步驟逐步生成圖像。CogView4 利用 FlowMatch Euler Discrete Scheduler 控制去噪過程,用戶可以通過調整去噪步數(num_inference_steps)來平衡生成質量與速度。
        • 多階段訓練策略:CogView4 采用多階段訓練策略,包括基礎分辨率訓練、泛分辨率訓練、高質量數據微調和人類偏好對齊訓練,確保生成圖像的高質量與美感。
        • 優化與效率:為了提升訓練與推理效率,CogView4 采用了顯存優化技術,如模型 CPU 卸載和文本編碼器量化。該模型支持 Apache 2.0 協議,以便于開源社區的進一步開發。

        CogView4的項目地址

        CogView4的官方案例

        • 超長故事(四格漫畫):請生成一張包含四個場景的四格漫畫圖,采用動漫插畫風格的連環畫。主要角色包括:小明:勇敢的人類男孩,手持寶劍,身穿簡易戰士服;公主:美麗優雅的人類女性,身著華麗公主服飾,被囚禁在怪獸的巢穴;:威嚴而仁慈的人類男性,身穿華麗的王者服飾,坐在王國的寶座上;火焰龍:覆蓋火焰鱗片的怪獸,口吐火焰,體型龐大;黑暗魔王:巨大怪獸,籠罩在黑暗中,擁有強大的魔法力量。

        CogView4

        • CogView4 能將中英文字符自然地融入畫面,使海報和文案配圖的創作變得更加便捷。

        CogView4

        • 擅長理解和遵循中文提示詞,例如能夠描繪出古詩文中的意境。

        CogView4

        CogView4的應用場景

        • 廣告與創意設計:CogView4 能將中英文字符自然融入圖像,生成高質量的海報和文案配圖,滿足廣告及創意設計的需求。
        • 教育資源生成:該模型可以為教育領域生成教學插圖、科學插圖等,幫助學生更好地理解和吸收知識。
        • 兒童繪本創作:CogView4 能生成適合兒童繪本的插圖,激發兒童的想象力。
        • 電商與內容創作:生成高質量的產品圖片和廣告海報,幫助商家快速創建吸引人的視覺內容。
        • 個性化定制:根據用戶需求生成定制化的圖像內容,提升用戶體驗。
        閱讀原文
        ? 版權聲明
        蟬鏡AI數字人

        相關文章

        蟬鏡AI數字人

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲综合网美国十次| 亚洲国产精品嫩草影院久久 | 亚洲色大成网站www| 最刺激黄a大片免费网站| 久久国产精品亚洲综合| 亚洲色中文字幕无码AV| 免费国产污网站在线观看不要卡| 国产精品va无码免费麻豆| 亚洲AV电影天堂男人的天堂| 国产免费69成人精品视频| 国产大陆亚洲精品国产| 一本久久综合亚洲鲁鲁五月天| 国产成人亚洲综合在线| 亚洲成人高清在线| 中文字幕无码免费久久9一区9| 亚洲综合精品香蕉久久网| 精品国产一区二区三区免费| 久久精品国产亚洲一区二区| 99国产精品视频免费观看| 亚洲成?Ⅴ人在线观看无码| 特黄特色的大片观看免费视频| 久久影院亚洲一区| 免费A级毛片无码A∨| 亚洲中文字幕久久精品无码2021| 成年美女黄网站18禁免费| 羞羞漫画在线成人漫画阅读免费 | 国产视频精品免费| www免费插插视频| 久久久亚洲欧洲日产国码二区 | 香蕉成人免费看片视频app下载| 久久亚洲精品无码AV红樱桃| 色窝窝免费一区二区三区| 久久国产免费福利永久| 亚洲欧美熟妇综合久久久久| 亚洲?V无码乱码国产精品| 久久99精品免费视频| 亚洲熟妇AV一区二区三区宅男| 亚洲视频一区二区| 免费无码国产在线观国内自拍中文字幕 | 国产一卡2卡3卡4卡无卡免费视频| 亚洲欧美国产精品专区久久|