AI項(xiàng)目和框架

TimeSuite

TimeSuite是上海AI Lab推出的新型框架,能提升多模態(tài)大型語言模型(MLLMs)在長視頻理解任務(wù)中的表現(xiàn)。基于引入高效的長視頻處理框架、高質(zhì)量的視頻數(shù)據(jù)集Tim...
閱讀原文

EMMA

EMMA是Waymo基于Gemini模型推出的端到端自動駕駛多模態(tài)模型,能將原始相機(jī)傳感器數(shù)據(jù)直接映射到駕駛特定輸出,如規(guī)劃軌跡、感知對象和道路圖元素。EMMA將非傳...
閱讀原文

DreamVideo-2

DreamVideo-2是創(chuàng)新的零樣本視頻定制框架,是復(fù)旦大學(xué)和阿里巴巴集團(tuán)等機(jī)構(gòu)聯(lián)合推出。DreamVideo-2能根據(jù)單一圖像和界定框序列生成具有特定主題和精確運(yùn)動軌...
閱讀原文

NotebookMLX

NotebookMLX是開源版本的NotebookLM,集成NotebookLlama的功能,能將PDF文檔轉(zhuǎn)換成易于理解和分享的音頻播客形式。項(xiàng)目基于MLX技術(shù)實(shí)現(xiàn)自然語言處理功能,包...
閱讀原文

HOVER

HOVER是英偉達(dá)推出的1.5M小模型,全稱為“Humanoid Versatile Controller”,即人形機(jī)器人的多功能全身神經(jīng)通用控制器。模型用150萬參數(shù)實(shí)現(xiàn)對機(jī)器人復(fù)雜動作的...
閱讀原文

Voice Changer

Voice Changer是Cartesia推出的新模型,能將任何音頻剪輯的語音轉(zhuǎn)換成其他音色,且保留原始音頻的情感和表達(dá)。用戶從Cartesia提供的多種高質(zhì)量聲音庫中選擇,...
閱讀原文

Oasis

Oasis是世界上首款A(yù)I實(shí)時生成的游戲,由Decart和Etched聯(lián)合推出。游戲能以每秒20幀的速度實(shí)時渲染交互式視頻內(nèi)容,無需游戲引擎,通過AI模型直接生成。玩家可...
閱讀原文

夸克靈知大模型

夸克靈知是夸克公司全新推出的智能學(xué)習(xí)學(xué)習(xí)大模型,具備博士生級別的推理能力。基于AI技術(shù)為用戶提供分步驟題目講解,能隨時回答問題。在考研數(shù)學(xué)等題目的正...
閱讀原文

OSAID 1.0

OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)發(fā)布的官方標(biāo)準(zhǔn),用在明確AI系統(tǒng)成為開放源代碼的條件。參與制定OSAID 1....
閱讀原文

MobileLLM

MobileLLM是Meta為移動設(shè)備用例優(yōu)化設(shè)計(jì)的十億參數(shù)以下的大型語言模型,能解決云成本上升和延遲問題。MobileLLM基于深薄架構(gòu)、嵌入共享和分組查詢注意力機(jī)制...
閱讀原文

SmolLM2

SmolLLM2是Hugging Face推出用在設(shè)備端應(yīng)用的緊湊型大型語言模型,提供1.7B、360M、135M三個不同參數(shù)級別的模型,適應(yīng)不同的應(yīng)用場景和資源限制。模型在理解...
閱讀原文

Genmoai-smol

Genmoai-smol是開源視頻生成模型,是Genmoai的txt2video模型的工作進(jìn)展分支,專為單GPU設(shè)備優(yōu)化,減少顯存占用,在資源有限的設(shè)備上能進(jìn)行視頻創(chuàng)作。模型用高...
閱讀原文

VirSci

VirSci(Virtual Scientists)是上海人工智能實(shí)驗(yàn)室推出的多智能體AI科學(xué)研究工具,基于模擬科學(xué)家團(tuán)隊(duì)的合作過程加速科研創(chuàng)新。系統(tǒng)基于大型語言模型(LLMs...
閱讀原文

Self-Lengthen

Self-Lengthen是阿里巴巴千問團(tuán)隊(duì)推出的創(chuàng)新的迭代訓(xùn)練框架,能提升大型語言模型(LLMs)生成長文本的能力。框架基于兩個角色,生成器和擴(kuò)展器協(xié)同工作,生成...
閱讀原文

Amphion

Amphion是開源的音頻、音樂和語音生成工具包,是香港中文大學(xué)(深圳)副教授武執(zhí)政團(tuán)隊(duì)聯(lián)合上海人工智能實(shí)驗(yàn)室和深圳市大數(shù)據(jù)研究院共同推出的。工具包支持可...
閱讀原文