標簽:智能圖像處理

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

稿定AI社區

稿定AI社區是在線AI創意靈感平臺,為用戶提供豐富的創意設計資源和工具。平臺涵蓋多種設計領域,包括形象照、電商設計、節日主題、3D插畫、頭像設計、小紅書...
閱讀原文

LightLab

LightLab是谷歌等機構推出的基于擴散模型的圖像光源控制模型,能對單張圖像中的光源進行細粒度的參數化控制。支持用戶調整光源的強度和顏色,插入虛擬光源,...
閱讀原文

ShotAdapter

ShotAdapter是Adobe聯合UIUC推出的用在文本到多鏡頭視頻生成的框架,基于微調預訓練的文本到視頻模型,引入過渡標記和局部注意力掩碼策略,實現對多鏡頭視頻...
閱讀原文

Picsman

Picsman是強大的在線AI圖片編輯工具,提供多種智能圖片處理功能,如一鍵摳圖換背景、消除筆、批量編輯、AI背景生成和圖片變高清等。工具操作簡單,適合電商、...
閱讀原文

MT-Color

MT-Color是上海交通大學聯合嗶哩嗶哩推出的基于擴散模型的可控圖像著色框架,基于用戶提供的實例感知文本和掩碼實現精確的實例級圖像著色。框架基于像素級掩...
閱讀原文

X-Fusion

X-Fusion 是加州大學洛杉磯分校、威斯康星大學麥迪遜分校和 Adobe Research 聯合提出的多模態融合框架,將預訓練的大型語言模型(LLMs)擴展到多模態任務中,...
閱讀原文

MCP萬能工具箱

MCP萬能工具箱是360納米AI搜索推出的基于MCP開放協議的AI工具集成平臺。平臺集成近百款免費工具,覆蓋辦公協作、金融分析、數據抓取等多元場景,支持一鍵調用...
閱讀原文

HaiSnap

HaiSnap是在線零代碼開發平臺,通過可視化操作和拖拽式界面,用戶無需編寫代碼可快速搭建應用,簡化了開發流程。平臺支持調用多種預訓練的AI模型,涵蓋文本生...
閱讀原文

SigLIP 2

SigLIP 2 是Google DeepMind 提出先進的多語言視覺-語言模型 ,是 SigLIP 的升級版本,提升圖像與文本之間的對齊能力。通過改進的訓練方法和架構,顯著增強了...
閱讀原文

MatAnyone

MatAnyone是南洋理工大學S-Lab實驗室和商湯科技推出的,針對復雜背景人像視頻摳圖的先進框架,專注于目標指定的視頻摳圖任務。MatAnyone基于一致的內存傳播模...
閱讀原文

PanoDreamer

PanoDreamer是能夠從單張圖像生成連貫的360° 3D場景的新方法。這種方法不同于現有技術,它將問題構建為單圖像全景和深度估計的兩個優化任務,并引入交替最小...
閱讀原文

DisPose

DisPose是北京大學、中國科學技術大學、清華大學和香港科技大學的研究團隊共同推出的,提高人物圖像動畫質量的控制技術,基于從骨骼姿態和參考圖像中提取有效...
閱讀原文

Luma Photon:創新圖像生成模型助力無限創意與高效創作

Luma Photon 是 Luma AI 推出的新一代圖像生成模型,用創新的架構提供超高圖像質量和低成本效率。Luma Photon支持個性化和創造性的圖像生成,能理解自然語言...
閱讀原文

CAT4D:基于單目視頻技術的創新4D場景生成方法解析

CAT4D是Google DeepMind、哥倫比亞大學和加州大學圣地亞哥分校共同推出的,能從單目視頻創建4D場景(動態3D)表示。CAT4D基于多視圖視頻擴散模型,能在任意指...
閱讀原文

IP-Adapter

IP-Adapter(Image Prompt Adapter)是一種專門為預訓練的文本到圖像擴散模型(如Stable Diffusion)設計的適配器,目的是讓文生圖模型能夠利用圖像提示來生...
閱讀原文
12