AI項目和框架

IterComp

IterComp是一個由清華大學(xué)、北京大學(xué)、LibAI Lab、中國科學(xué)技術(shù)大學(xué)、牛津大學(xué)和普林斯頓大學(xué)的研究人員聯(lián)合推出的文本到圖像生成框架。基于迭代反饋學(xué)習(xí)機制...
閱讀原文

LayerSkip

LayerSkip是一種用在加速大型語言模型(LLMs)推理過程的技術(shù)。基于在訓(xùn)練階段應(yīng)用層dropout和早期退出損失,讓模型在推理時從早期層開始更準確地退出,不需...
閱讀原文

Spirit LM

Spirit LM是由Meta AI團隊推出的一種多模態(tài)語言模型,能無縫地混合文本和語音數(shù)據(jù)。Spirit LM基于一個預(yù)訓(xùn)練的文本語言模型,用持續(xù)在文本和語音單元上的訓(xùn)練...
閱讀原文

Story-Adapter

Story-Adapter 是一種新型的長篇故事可視化框架,能在保持語義一致性的同時,生成高質(zhì)量且具有細膩交互的故事圖像序列。通過迭代方式,基于全局參考交叉注意...
閱讀原文

LOKI

LOKI是由中山大學(xué)和上海AI Lab聯(lián)合提出的合成數(shù)據(jù)檢測基準,旨在全面評估大型多模態(tài)模型(LMMs)在識別視頻、圖像、3D、文本和音頻等多種模態(tài)合成數(shù)據(jù)的能力...
閱讀原文

NotesGPT

NotesGPT是一款開源的AI驅(qū)動語音筆記工具,能將用戶的語音筆記快速轉(zhuǎn)錄成文本,自動生成行動項。工具基于包括Convex數(shù)據(jù)庫、Next.js框架、Together推理模型、...
閱讀原文

MEXMA

MEXMA是由Meta AI推出的一種新型的預(yù)訓(xùn)練跨語言句子編碼器。基于結(jié)合句子級和詞語級的目標提升句子表示的質(zhì)量。在訓(xùn)練過程中,MEXMA用一種語言的句子表示預(yù)測...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個輕量級且獨立的代碼庫,旨在助力大規(guī)模訓(xùn)練語言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構(gòu)、損失函數(shù)和...
閱讀原文

VideoAgent

VideoAgent是一種自改進的視頻生成系統(tǒng),由斯坦福大學(xué)、滑鐵盧大學(xué)、DeepMind等機構(gòu)的研究人員共同推出。根據(jù)圖像觀察和語言指令生成視頻計劃,轉(zhuǎn)換為機器人...
閱讀原文

Llama Tutor

Llama Tutor 是一個基于AI的個性化學(xué)習(xí)平臺,由 Llama 3.1 和 Together AI 技術(shù)驅(qū)動,是一個完全開源的項目。支持用戶輸入想要學(xué)習(xí)的主題和教育水平,生成一...
閱讀原文

ComfyGen

ComfyGen是由NVIDIA和特拉維夫大學(xué)研究人員推出的一種文本到圖像生成系統(tǒng),基于大型語言模型(LLM)自動創(chuàng)建與用戶文本提示相匹配的工作流,提升圖像生成的質(zhì)...
閱讀原文

restorePhotos.io

restorePhotos.io 是一個開源的AI項目,專注于修復(fù)老舊和模糊的人臉照片。用GFPGAN機器學(xué)習(xí)模型,基于Next.js API路由處理上傳的照片,再返回修復(fù)后的照片。...
閱讀原文

PDFtoChat

PDFtoChat 是一個開源的創(chuàng)新AI項目,支持用戶基于自然語言對話的方式與 PDF 文件互動。工具基于最新的 AI 技術(shù),包括 Together AI 和 Mixtral,理解用戶的查...
閱讀原文

Self-Taught Evaluators

Self-Taught Evaluators是一種新型的模型評估方法,基于自我訓(xùn)練的方式提高大型語言模型(LLM)的評估能力,無需人工標注數(shù)據(jù)。從未經(jīng)標記的指令開始,用迭代...
閱讀原文

TurboSeek

TurboSeek是一個開源的AI搜索引擎,由Together.ai提供技術(shù)支持。基于現(xiàn)代化的技術(shù)棧,包括Next.js、Tailwind、Bing搜索API及先進的語言模型Mixtral 8x7B和Lla...
閱讀原文