標簽:AI圖像生成

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

LongCat-Image

LongCat-Image 是美團開源的高性能圖像生成模型,僅用 6B 參數在文生圖和圖像編輯上達到開源頂尖水平。模型采用創新架構和訓練策略,支持高質量中文文字渲染...
閱讀原文

Z-Image

Z-Image 是阿里通義推出的圖像生成模型,具有6B參數。模型包含三個變體:Z-Image-Turbo、Z-Image-Base 和 Z-Image-Edit,分別擅長快速推理、基礎開發和圖像編...
閱讀原文

Firefly Image 5

Firefly Image 5 是 Adobe 發布的最新圖像生成模型。具備原生400萬像素輸出能力,能直接生成高分辨率圖像,細節表現力大幅提升。在人物渲染方面,新模型優化...
閱讀原文

UniPixel

UniPixel是香港理工大學和騰訊ARC Lab團隊開發的首個統一像素級多模態大模型,專注于圖像/視頻的精細理解與交互。能在單個模型中完成對象指代、像素級分割和...
閱讀原文

VLAC

VLAC是上海人工智能實驗室發布的具身獎勵大模型。以InternVL多模態大模型為基礎,融合互聯網視頻數據和機器人操作數據,為機器人在真實世界中的強化學習提供...
閱讀原文

圖像生成告別AI味!清華、港中大、騰訊混元聯手推出SRPO新方法,美觀、逼真、藝術感都有了

算泥社區是集 “AI 大模型開發服務 + 算法 + 算力” 于一體的開源生態社區,歡迎關注!文本到圖像生成技術近年來取得了令人矚目的進展。從DALL-E,Midjourney,...
閱讀原文

混元圖像2.1

混元圖像2.1(HunyuanImage 2.1)是騰訊推出的開源文生圖模型,支持原生2K分辨率,具備強大的復雜語義理解能力,能精準生成場景細節、人物表情和動作。
閱讀原文

HunyuanWorld-Voyager

HunyuanWorld-Voyager(簡稱混元Voyager)是騰訊推出的業界首個支持原生3D重建的超長漫游世界模型。是新穎的視頻擴散框架,能從單張圖片生成用戶定義相機路徑...
閱讀原文

Draw A Fish

Draw A Fish 是獨特的線上AI畫魚網站,用戶可以用鼠標隨意畫一條魚,點擊“放生”后,這條魚會進入一個全球共享的虛擬魚缸,與來自世界各地的魚一起游動。網站...
閱讀原文

吐司AI寫真

吐司AI寫真是吐司TusiArt平臺推出的AI寫真工具。吐司AI寫真基于AI繪畫大模型對用戶上傳的圖片進行風格化處理或重新生成,生成具有高逼真度、類似真實拍攝效果...
閱讀原文

擴散模型也能推理時Scaling,謝賽寧團隊重磅研究可能帶來文生圖新范式

scaling 推理將是改進擴散模型的一個非常有前途的方向。
閱讀原文

奧特曼公布OpenAI新年目標:AGI/Agent排前列,4o/Sora要更新,還有……

原標題:奧特曼公布OpenAI新年目標:AGI/Agent排前列,4o/Sora要更新,還有…… 文章來源:人工智能學家 內容字數:9043字OpenAI 2025新年目標及AGI展望 2024...
閱讀原文

解鎖 25 年新頭像,僅用一小時,用扣子給抖音做了個小程序

幾千塊的小程序外包開發,用扣子一小時就搞定了?
閱讀原文

字節整新活!照片+音頻讓蒙娜麗莎秒變播客主理人

既能說,又能聽!字節INFP交互式人像生成技術,向Visual Chat Agent邁進。
閱讀原文
12