AI項目和框架
AnimaTensor
AnimaTensor是CagliostroLab團隊和TensorArt共同推出的二次元圖像生成模型?;趧?chuàng)新的V-Prediction技術(shù),用預測圖像生成過程中的“速度”優(yōu)化噪聲調(diào)度和采樣策...
Gemini Robotics On-Device
Gemini Robotics On-Device是谷歌DeepMind推出的首個可在機器人本地運行的視覺-語言-動作(VLA)模型。模型具備強大的離線操作能力,能遵循自然語言指令完成...
OmniAvatar
OmniAvatar是浙江大學和阿里巴巴集團共同推出的音頻驅(qū)動全身視頻生成模型。模型根據(jù)輸入的音頻和文本提示,生成自然、逼真的全身動畫視頻,人物動作與音頻完...
ImmerseGen
ImmerseGen是字節(jié)跳動的PICO團隊和浙江大學聯(lián)合推出的創(chuàng)新3D世界生成框架??蚣芨鶕?jù)用戶輸入的文字提示,基于Agent引導的資產(chǎn)設(shè)計和排列,生成帶有alpha紋理...
Hunyuan-GameCraft
Hunyuan-GameCraft 是騰訊 Hunyuan 團隊和華中科技大學共同推出的高動態(tài)交互式游戲視頻生成框架?;趯㈡I盤和鼠標輸入統(tǒng)一到共享的相機表示空間,實現(xiàn)精細的...
Confucius3-Math
Confucius3-Math是網(wǎng)易有道開源的“子曰3”系列大模型中的數(shù)學模型,是國內(nèi)首個專注于數(shù)學教育的開源推理模型。具有140億參數(shù),專為K-12數(shù)學教育場景優(yōu)化,可在...
PosterCraft
PosterCraft是香港科技大學(廣州)和美團等機構(gòu)推出的用在生成高質(zhì)量美學海報的統(tǒng)一框架??蚣苻饤壞K化設(shè)計流程和固定的預定義布局,支持模型自由探索連貫...
RAG-Anything
RAG-Anything是香港大學數(shù)據(jù)智能實驗室推出的開源多模態(tài)RAG系統(tǒng)。系統(tǒng)支持處理包含文本、圖像、表格和公式的復雜文檔,提供從文檔攝取到智能查詢的端到端解決...
元智醫(yī)療大模型
元智醫(yī)療大模型是聯(lián)影智能推出的面向醫(yī)療領(lǐng)域的多模態(tài)人工智能模型,通過融合文本、影像、視覺、語音等多種模態(tài)數(shù)據(jù),為醫(yī)療場景提供深度智能化解決方案。
粵公網(wǎng)安備 44011502001135號