AI項目和框架
MetaMorph:智能多模態產品提升用戶體驗與交互效率
MetaMorph是多模態大模型(MLLM),通過指令微調(Instruction Tuning)實現視覺理解和生成。它提出了一種名為Visual-Predictive Instruction Tuning(VPiT)...
StyleStudio
StyleStudio是西湖大學AI實驗室、復旦大學、南洋理工大學和香港科技大學(廣州)聯合推出的,文本驅動的風格遷移模型,能將參考圖像的風格與文本提示的內容融...
PromptWizard
PromptWizard是微軟推出的自動化提示優化框架,改進大型語言模型(LLMs)在特定任務中的表現。基于自我演變和自我適應機制,PromptWizard用反饋驅動的批評和...
ElevenLabs Flash
ElevenLabs Flash是ElevenLabs推出的低延遲語音合成模型,專為快速對話型AI設計。ElevenLabs Flash有兩個版本:Flash v2僅支持英語,Flash v2.5支持32種語言...
StyleStudio:融合參考圖像風格與文本提示的創新創作工具
StyleStudio是西湖大學AI實驗室、復旦大學、南洋理工大學和香港科技大學(廣州)聯合推出的,文本驅動的風格遷移模型,能將參考圖像的風格與文本提示的內容融...
PromptWizard:智能提示詞優化框架提升AI交互效率與精準度
PromptWizard是微軟推出的自動化提示優化框架,改進大型語言模型(LLMs)在特定任務中的表現。基于自我演變和自我適應機制,PromptWizard用反饋驅動的批評和...
INFP:基于音頻驅動的真實感面部表情與頭部姿態生成AI框架
INFP是音頻驅動的頭部生成框架,專為雙人對話交互設計。能自動在對話音頻引導下進行角色的轉換,無需手動分配角色和角色切換。INFP包括兩個階段:基于動作頭...
RWKV-7:RWKV系列大模型架構提升上下文學習能力的創新產品特性解析
RWKV-7是RWKV系列的最新大模型架構版本,超越了傳統的attention和linear attention范式,具有更靈活的狀態演化能力,能在相同算力消耗下解決attention無法解...
OpenAI o3:OpenAI推出超強推理模型,智能提升與創新思維的完美結合
OpenAI o3模型是繼o1之后的新一代推理模型,包括o3和o3-mini兩個版本。o3在某些條件下接近于通用人工智能(AGI),在ARC-AGI基準測試中得分高達87.5%,遠超人...
AniDoc:自動化草圖到彩色動畫轉化的創新視頻擴散模型
AniDoc是香港科技大學、螞蟻集團、南京大學、浙江大學和香港大學共同推出的簡化2D動畫上色AI模型,基于視頻擴散模型自動將草圖序列轉換成彩色動畫,遵循參考...
ElevenLabs Flash:創新低延遲語音合成模型提升語音交互體驗
ElevenLabs Flash是ElevenLabs推出的低延遲語音合成模型,專為快速對話型AI設計。ElevenLabs Flash有兩個版本:Flash v2僅支持英語,Flash v2.5支持32種語言...
粵公網安備 44011502001135號