AI項(xiàng)目和框架

WorldScore

WorldScore 是斯坦福大學(xué)提出的用于世界生成模型的統(tǒng)一評(píng)估基準(zhǔn)。將世界生成分解為一系列的下一個(gè)場景生成任務(wù),通過明確的基于相機(jī)軌跡的布局規(guī)范來實(shí)現(xiàn)不同...
閱讀原文

SWEET-RL

SWEET-RL是Meta推出的多輪強(qiáng)化學(xué)習(xí)框架,專門用在訓(xùn)練大型語言模型(LLM)代理進(jìn)行協(xié)作推理任務(wù)。SWEET-R基于訓(xùn)練時(shí)的額外信息(如參考解決方案)優(yōu)化“批評(píng)者...
閱讀原文

OThink-MR1

OThink-MR1是OPPO研究院和香港科技大學(xué)(廣州)聯(lián)合推出的多模態(tài)語言模型優(yōu)化框架。基于動(dòng)態(tài)調(diào)整Kullback-Leibler(KL)散度策略(GRPO-D)和獎(jiǎng)勵(lì)模型,提升...
閱讀原文

DeepSite

DeepSite 是基于 DeepSeek-V3 模型的在線開發(fā)工具,用戶無需配置環(huán)境或安裝軟件,在網(wǎng)頁上直接輸入需求,快速生成游戲、應(yīng)用或網(wǎng)頁的代碼,支持實(shí)時(shí)預(yù)覽效果。
閱讀原文

EasyControl Ghibli

EasyControl Ghibli 是基于 EasyControl 框架開發(fā)的 AI 模型,已上線 Hugging Face 平臺(tái),專注于將普通圖像轉(zhuǎn)換為吉卜力風(fēng)格的圖像。僅用100張亞洲人臉照片及...
閱讀原文

Dolphin

Dolphin是清華大學(xué)電子工程系語音與音頻技術(shù)實(shí)驗(yàn)室聯(lián)合海天瑞聲共同推出的面向東方語言的語音大模型。支持40個(gè)東方語種的語音識(shí)別,中文語種涵蓋22種方言(含...
閱讀原文

PaperBench

PaperBench是OpenAI開源的AI智能體評(píng)測基準(zhǔn),支持評(píng)估智能體復(fù)現(xiàn)頂級(jí)學(xué)術(shù)論文的能力。PaperBench要求智能體從理解論文內(nèi)容到編寫代碼、執(zhí)行實(shí)驗(yàn),全面展現(xiàn)從...

AutoAgent

AutoAgent 是香港大學(xué)推出的零代碼、自動(dòng)化 LLM 智能體框架。基于自然語言交互,讓用戶無需編程即可創(chuàng)建智能助手,適用于智能搜索、數(shù)據(jù)分析、報(bào)告生成等場景...
閱讀原文

Amodal3R

Amodal3R 是條件式 3D 生成模型,能從部分可見的 2D 物體圖像中推測并重建完整的 3D 形態(tài)和外觀。模型基于“基礎(chǔ)”3D 生成模型 TRELLIS 構(gòu)建,通過引入掩碼加權(quán)...
閱讀原文

Amazon Nova Act

Amazon Nova Act是亞馬遜 AGI Labs推出的通用AI代理,用于在網(wǎng)頁瀏覽器中執(zhí)行任務(wù)。Amazon Nova Act支持開發(fā)者基于配套的 SDK 構(gòu)建智能體應(yīng)用原型,完成如提...
閱讀原文

Runway Gen-4

Runway Gen-4 是 AI 初創(chuàng)公司 Runway推出的高保真AI視頻生成模型。支持在多個(gè)場景中保持人物、物體和環(huán)境的一致性,無需額外精調(diào)或訓(xùn)練。用戶提供一張參考圖...
閱讀原文

Neo-1

Neo-1 是 VantAI 推出的全球首個(gè)將從頭分子生成與原子級(jí)結(jié)構(gòu)預(yù)測統(tǒng)一的AI模型。能預(yù)測生物分子結(jié)構(gòu),生成全新的分子,在設(shè)計(jì)分子膠等新型治療藥物方面表現(xiàn)出...
閱讀原文

GLM-Z1-Air

GLM-Z1-Air 是智譜公司推出的基于 GLM-4-Air-0414 的深度思考模型。GLM-Z1-Air在預(yù)訓(xùn)練階段引入更多推理類數(shù)據(jù),在對(duì)齊階段深度優(yōu)化通用能力,展現(xiàn)出強(qiáng)大的數(shù)...
閱讀原文

AI-ClothingTryOn

AI-ClothingTryOn 是基于 Python 的桌面應(yīng)用程序,用 Google Gemini AI 技術(shù)實(shí)現(xiàn)虛擬試衣功能。AI-ClothingTryOn支持分別上傳人物照片和服裝照片,基于 AI 技...
閱讀原文

GLM-4-Air-0414

GLM-4-Air-0414是智譜公司推出的擁有320億參數(shù)的基座模型,是AutoGLM沉思背后的模型。GLM-4-Air-0414在預(yù)訓(xùn)練階段加入更多代碼類、推理類數(shù)據(jù),針對(duì)智能體能...
閱讀原文
14344454647146