AI項目和框架
MimicMotion
MimicMotion是騰訊的研究人員推出的一個高質量的人類動作視頻生成框架,利用置信度感知的姿態引導技術,確保視頻幀的高質量和時間上的平滑過渡。此外,MimicM...
FunAudioLLM
FunAudioLLM是阿里巴巴通義實驗室推出的開源語音大模型項目,包含SenseVoice和CosyVoice兩個模型。SenseVoice擅長多語言語音識別和情感辨識,支持超過50種語...
LivePortrait
LivePortrait是快手推出的開源人像動畫生成框架,專注于高效、可控地將驅動視頻的表情和姿態遷移至靜態或動態人像,創造出富有表現力的視頻。該技術通過隱式...
GPT-4o Long Output模型
GPT-4o Long Output模型是OpenAI最新推出的超長輸出AI模型,支持高達64k tokens的長文本輸出,相當于約200頁小說。相較于原GPT-4o模型,輸出能力提升16倍,但...
MindSearch
MindSearch是上海人工智能實驗室聯合研發團隊推出的開源AI搜索框架,結合了大規模信息搜集和整理能力。利用InternLM2.5 7B對話模型,MindSearch能在3分鐘內從...
Stable Fast 3D
Stable Fast 3D(SF3D)是Stability AI推出的一種創新3D網格重建技術,能在0.5秒內從單張圖片生成高質量的3D模型。Stable Fast 3D采用先進的Transformer網絡...