O1-CODER:智能編碼助手O1版提升開發效率與代碼質量
O1-CODER是北京交通大學研究團隊推出的開源項目,旨在復制OpenAI的O1模型,專注于編碼任務。O1-CODER結合強化學習(RL)和蒙特卡洛樹搜索(MCTS)技術,提升...
南洋理工推出的VR端3D角色扮演AI系統
SOLAMI是創新的VR端3D角色扮演AI系統,是南洋理工大學研究團隊推出的。支持用戶用語音和肢體語言與虛擬角色進行沉浸式互動,基于社交視覺-語言-行為模型,提...
clone-voice:多語言聲音克隆工具支持16種語言,實現個性化語音合成
Clone-voice是開源的聲音克隆工具,基于深度學習技術分析和模擬人類聲音,實現聲音的高質量克隆。工具支持包括中文、英文、日語、韓語等在內的16種語言,能將...
AI文本到圖像生成框架,提升單步擴散模型的效率和性能
SNOOPI是創新的文本到圖像生成框架,基于增強單步擴散模型的指導提升模型性能和控制力。SNOOPI包括PG-SB(適當指導 - SwiftBrush)和NASA(負向遠離轉向注意...
音頻驅動的生成肖像說話視頻框架,保持身份一致性和表現力
MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大學和新加坡國立大學推出的音頻驅動肖像動畫框架,用在生成具有身份一致性和表現力的...
xAI為Grok AI助手推出的新圖像生成模型
Aurora是xAI為AI助手Grok新增的圖像生成模型。Aurora擅長創建逼真的圖像,擅長人物肖像。Aurora能生成包括公共和版權人物在內的圖像(如米老鼠)。Aurora 的...
One Shot, One Talk:中科大與香港理工攜手打造創新動態圖像生成技術,實現實時創作與智能化設計
One Shot, One Talk是先進的圖像生成技術,能從單張圖片中生成具有個性化細節的全身動態說話頭像,支持逼真的動畫效果,包括自然的表情變化和生動的身體動作...
辦公小浣熊2.0:智能協作新體驗,商湯AI辦公助手賦能創作空間
辦公小浣熊2.0是商湯科技推出的AI辦公助手,集成數據分析、文檔解析、智能規劃和內容創作等AI功能。工具基于一站式創作空間,讓用戶在平臺內完成所有工作任務...
智譜 AI 免費開放圖像理解大模型
GLM-4V-Flash是智譜AI推出的專注于圖像理解的AI模型,提供免費的API接口,支持用戶上傳圖片URL或Base64編碼圖片獲取詳細的圖像描述。模型簡化圖像分析流程,...
海螺AI Audio:智能語音合成助手打造自然流暢對話體驗
海螺AI Audio是MiniMax推出的AI語音合成工具,能創建逼真的多語言、多聲音和多情感的語音。用戶只需提供30秒的音頻素材,可以克隆特定人的聲音,支持12種語言...
Meta AI推出的純文本語言模型
Llama 3.3是Meta AI推出的70B 參數模型,大型多語言預訓練語言模型,性能與40B參數的Llama 3.1相當。模型專為多語言對話優化,支持英語、德語、法語、意大利...
面試通:全方位AI面試助手,提升算法能力與簡歷優化的智能工具
面試通是基于AI技術的面試輔助工具,專為求職者設計,提高面試成功率。面試通能實時識別面試官的問題,快速生成專業回答,讓求職者在面試中表現得更加自信和...
紫荊AI醫生:清華推出42位AI醫生覆蓋21個科室的智能醫療平臺
紫荊AI醫生是清華大學智能產業研究院孵化的紫荊智康推出的AI醫療平臺。系統基于Agent Hospital(也被稱為“清華AI醫院”),能模擬真實醫院環境和患者病例,讓A...
TensorOpera 開源的小語言模型系列
Fox-1是TensorOpera推出的一系列小型語言模型(SLMs),包括Fox-1-1.6B和Fox-1-1.6B-Instruct-v0.1。Fox-1模型在3萬億個網絡抓取的文檔數據上預訓練,在50億...
PaliGemma 2:DeepMind推出性視覺語言模型,實現跨媒體理解與生成
PaliGemma 2是Google DeepMind基于Gemma 2語言模型家族推出的新一代視覺語言模型(VLM),作為PaliGemma模型的升級版。結合SigLIP-So400m視覺編碼器和不同規...