AI項目和框架

流暢閱讀

流暢閱讀(FluentRead)是開源的瀏覽器翻譯插件,致力于為用戶提供類似母語的閱讀體驗。流暢閱讀基于先進(jìn)的AI技術(shù),支持多種翻譯引擎,包括傳統(tǒng)機器翻譯和AI...
閱讀原文

ToddlerBot

ToddlerBot是斯坦福大學(xué)開源的用在運動操作的開源機器學(xué)習(xí)與人形機器人平臺,為高效收集大規(guī)模、高質(zhì)量的訓(xùn)練數(shù)據(jù)設(shè)計。ToddlerBot具備30個主動自由度,用Dyn...
閱讀原文

Aider

Aider 是開源的AI輔助編程工具,基于終端與大型語言模型(LLM)配合,實現(xiàn)高效代碼編輯和開發(fā)。Aider支持多種編程語言,如 Python、JavaScript、TypeScript ...
閱讀原文

LLaDA

LLaDA(Large Language Diffusion with mAsking)是中國人民大學(xué)高瓴AI學(xué)院李崇軒、文繼榮教授團隊和螞蟻集團共同推出的新型大型語言模型,基于擴散模型框架...
閱讀原文

Agentic Reasoning

Agentic Reasoning是牛津大學(xué)推出的增強大型語言模型(LLM)推理能力的框架。基于整合外部工具(如網(wǎng)絡(luò)搜索、代碼執(zhí)行和結(jié)構(gòu)化記憶)解決復(fù)雜的多步驟推理問...
閱讀原文

瑞智病理大模型

瑞智病理大模型(RuiPath)是上海交通大學(xué)醫(yī)學(xué)院附屬瑞金醫(yī)院與華為共同推出的臨床級國產(chǎn)多模態(tài)互動式病理大模型。模型覆蓋了中國每年全癌種發(fā)病人數(shù)90%的常...
閱讀原文

Step-Audio-TTS-3B

Step-Audio-TTS-3B 是 Stepfun-AI 團隊推出的高性能文本到語音(TTS)模型,具有強大的語音合成能力?;诤A亢铣蓴?shù)據(jù)訓(xùn)練,參數(shù)量達(dá)到30億,能生成自然流暢...
閱讀原文

SWE-Lancer

SWE-Lancer 是 OpenAI 推出的大模型基準(zhǔn)測試,評估前沿語言模型(LLMs)在自由職業(yè)軟件工程任務(wù)中的表現(xiàn)。包含來自 Upwork 的 1400 多個任務(wù),總價值達(dá) 100 ...
閱讀原文

DynamicCity

DynamicCity 是上海AI Lab推出的大規(guī)模動態(tài)場景生成的4D生成框架。DynamicCity 專注于生成具有語義信息的動態(tài) LiDAR 場景,能處理大規(guī)模空間(80×80×6.4 m3)...
閱讀原文

MoBA

MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力機制,提高大型語言模型(LLMs)處理長上下文任務(wù)的效率。通過將上下文劃分為多個塊(bl...
閱讀原文

RSIDiff

RSIDiff 是用于提升文本到圖像擴散模型性能的遞歸自訓(xùn)練(RSI)框架。通過迭代優(yōu)化模型,基于模型自身生成的數(shù)據(jù)進(jìn)行訓(xùn)練,解決傳統(tǒng)自訓(xùn)練中常見的訓(xùn)練崩潰問...
閱讀原文

Kimi Latest

Kimi Latest是月之暗面Kimi推出的實時更新AI模型,為用戶提供同步對標(biāo)Kimi智能助手的模型體驗。支持128k上下文長度,可根據(jù)輸入自動選擇8k、32k或128k模型進(jìn)...
閱讀原文

Omnitool

Omnitool是開源的AI桌面環(huán)境,為用戶提供統(tǒng)一的交互界面,能快速接入和使用多種AI模型。Omnitool支持本地運行,能在Mac、Windows或Linux設(shè)備上安裝,數(shù)據(jù)存儲...
閱讀原文

Qihoo-T2X

Qihoo-T2X 是360 AI 研究院和中山大學(xué)推出的基于代理標(biāo)記化擴散 Transformer(PT-DiT)的高效多模態(tài)生成模型,Qihoo-T2X引入稀疏代理標(biāo)記注意力機制,顯著降...
閱讀原文

Grok-3

Grok-3是埃隆·馬斯克旗下xAI公司推出的最新一代人工智能模型,模型被馬斯克稱為“地球上最聰明的人工智能”,推理能力在多項基準(zhǔn)測試中超越了包括ChatGPT和Deep...
閱讀原文
17172737475155