AI項(xiàng)目和框架
WorldScore
WorldScore 是斯坦福大學(xué)提出的用于世界生成模型的統(tǒng)一評(píng)估基準(zhǔn)。將世界生成分解為一系列的下一個(gè)場景生成任務(wù),通過明確的基于相機(jī)軌跡的布局規(guī)范來實(shí)現(xiàn)不同...
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大學(xué)(廣州)聯(lián)合推出的多模態(tài)語言模型優(yōu)化框架。基于動(dòng)態(tài)調(diào)整Kullback-Leibler(KL)散度策略(GRPO-D)和獎(jiǎng)勵(lì)模型,提升...
EasyControl Ghibli
EasyControl Ghibli 是基于 EasyControl 框架開發(fā)的 AI 模型,已上線 Hugging Face 平臺(tái),專注于將普通圖像轉(zhuǎn)換為吉卜力風(fēng)格的圖像。僅用100張亞洲人臉照片及...
PaperBench
PaperBench是OpenAI開源的AI智能體評(píng)測基準(zhǔn),支持評(píng)估智能體復(fù)現(xiàn)頂級(jí)學(xué)術(shù)論文的能力。PaperBench要求智能體從理解論文內(nèi)容到編寫代碼、執(zhí)行實(shí)驗(yàn),全面展現(xiàn)從...
Amazon Nova Act
Amazon Nova Act是亞馬遜 AGI Labs推出的通用AI代理,用于在網(wǎng)頁瀏覽器中執(zhí)行任務(wù)。Amazon Nova Act支持開發(fā)者基于配套的 SDK 構(gòu)建智能體應(yīng)用原型,完成如提...
Runway Gen-4
Runway Gen-4 是 AI 初創(chuàng)公司 Runway推出的高保真AI視頻生成模型。支持在多個(gè)場景中保持人物、物體和環(huán)境的一致性,無需額外精調(diào)或訓(xùn)練。用戶提供一張參考圖...
GLM-Z1-Air
GLM-Z1-Air 是智譜公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在預(yù)訓(xùn)練階段引入更多推理類數(shù)據(jù),在對(duì)齊階段深度優(yōu)化通用能力,展現(xiàn)出強(qiáng)大的數(shù)...
AI-ClothingTryOn
AI-ClothingTryOn 是基于 Python 的桌面應(yīng)用程序,用 Google Gemini AI 技術(shù)實(shí)現(xiàn)虛擬試衣功能。AI-ClothingTryOn支持分別上傳人物照片和服裝照片,基于 AI 技...
GLM-4-Air-0414
GLM-4-Air-0414是智譜公司推出的擁有320億參數(shù)的基座模型,是AutoGLM沉思背后的模型。GLM-4-Air-0414在預(yù)訓(xùn)練階段加入更多代碼類、推理類數(shù)據(jù),針對(duì)智能體能...