標(biāo)簽:個(gè)性化推薦
OThink-MR1
OThink-MR1是OPPO研究院和香港科技大學(xué)(廣州)聯(lián)合推出的多模態(tài)語言模型優(yōu)化框架。基于動(dòng)態(tài)調(diào)整Kullback-Leibler(KL)散度策略(GRPO-D)和獎(jiǎng)勵(lì)模型,提升...
Actor Mode
Actor Mode 是 ElevenLabs 推出的AI語音生成工具,支持用戶通過自己的聲音指導(dǎo) AI 生成語音內(nèi)容。用戶只需錄制一段音頻或上傳已有音頻文件,AI 能分析其語調(diào)...
ima知識(shí)號(hào)
ima知識(shí)號(hào)是騰訊旗下ima推出的全新功能,為知識(shí)庫(kù)創(chuàng)作者提供集中發(fā)布和管理知識(shí)庫(kù)的平臺(tái)。ima知識(shí)號(hào)配備數(shù)據(jù)分析工具,創(chuàng)作者能直觀地查看知識(shí)庫(kù)的數(shù)量、參與...
Cosmos-Reason1
Cosmos-Reason1 是 NVIDIA 推出的一系列多模態(tài)大型語言模型,基于物理常識(shí)和具身推理理解物理世界。Cosmos-Reason1包括兩個(gè)模型:Cosmos-Reason1-8B 和 Cosmo...
Gemini 2.5 Pro
Gemini 2.5 Pro 是谷歌推出的最新 AI 模型,是一個(gè)“思考模型”,能在回應(yīng)前進(jìn)行推理,提升性能和準(zhǔn)確性。模型在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)卓越,在推理和代碼生成方面...
AndroidGen
AndroidGen 是智譜技術(shù)團(tuán)隊(duì)推出增強(qiáng)基于大語言模型(LLM)的 Agent 能力的框架,特別是在數(shù)據(jù)稀缺的情況下。框架通過收集人類任務(wù)軌跡基于這些軌跡訓(xùn)練語言模...
LHM
LHM(Large Animatable Human Reconstruction Model)是阿里巴巴通義實(shí)驗(yàn)室推出的從單張圖像重建可動(dòng)畫化3D人體模型。基于多模態(tài)Transformer架構(gòu),融合3D幾何...
Shining Yourself
Shining Yourself是商湯科技提出的高保真飾品虛擬試戴技術(shù)。基于擴(kuò)散模型,能實(shí)現(xiàn)高度逼真的飾品試戴效果,為用戶帶來沉浸式的虛擬體驗(yàn)。與傳統(tǒng)虛擬試戴方法...