AnyText官網
多語言視覺文本生成和編輯工具,它基于擴散模型,能夠在圖片中生成或編輯文字
網站服務:AI開源項目,ai,AI編程,AI開源項目,ai。
AnyText簡介
Contribute to tyxsspa/AnyText development by creating an account on GitHub.
AnyText 是一個開源的多語言視覺文本生成和編輯工具,它基于擴散模型,能夠在圖片中生成或編輯文字。這個工具支持中文、英文、日文和韓文等多種語言,適用于電商海報、Logo 設計、創意涂鴉、表情包等多種場景。AnyText 包含兩個核心模塊:輔助潛在模塊(Auxiliary Latent Module)和文本嵌入模塊(Text Embedding Module)。輔助潛在模塊負責處理字形、文字位置和掩碼圖像等輔助信息,而文本嵌入模塊則將文字的語義信息與字形信息解耦合,以提高文字生成的精度和背景一致性。在訓練階段,除了使用擴散模型常用的噪聲預測損失,還增加了文本感知損失,以提升文字書寫的精度。
AnyText 的代碼和安裝說明可以在其 GitHub 頁面上找到。要在本地安裝和運行 AnyText,需要至少20GB的內存和高端顯卡。安裝過程包括克隆代碼庫、準備字體文件(推薦 Arial Unicode MS),創建新的環境并安裝所需的軟件包。AnyText 還提供了在線演示,用戶可以通過這個演示直接體驗其功能。
此外,AnyText 的訓練數據集為 AnyWord-3M,主要來源于互聯網開源數據集,包括 LAION-400M, Noah-Wukong 以及部分 OCR 數據集。這些數據集經過篩選,得到了300萬高質量的圖文對,涵蓋了多種語言和圖像類型。
AnyText官網入口網址
https://github.com/tyxsspa/AnyText
OpenI小編發現AnyText網站非常受用戶歡迎,請訪問AnyText網址入口試用。
數據評估
本站OpenI提供的AnyText都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2024年 1月 11日 上午6:09收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。