AI工具

Remaker

Remake AI 是一款革命性的AI圖像編輯工具,基于先進(jìn)的AI技術(shù)簡(jiǎn)化圖像處理流程。用戶能輕松去除圖片中的水印和背景,無(wú)需手動(dòng)操作,大大節(jié)省時(shí)間。Remake 的核...
閱讀原文

IterComp

IterComp是一個(gè)由清華大學(xué)、北京大學(xué)、LibAI Lab、中國(guó)科學(xué)技術(shù)大學(xué)、牛津大學(xué)和普林斯頓大學(xué)的研究人員聯(lián)合推出的文本到圖像生成框架。基于迭代反饋學(xué)習(xí)機(jī)制...
閱讀原文

陌生人鬧鐘

陌生人鬧鐘是一款創(chuàng)新的鬧鐘應(yīng)用,通過(guò)AI技術(shù)連接全球用戶,讓用戶每天早晨被隨機(jī)陌生人的語(yǔ)音喚醒。這款應(yīng)用的特點(diǎn)包括AI內(nèi)容過(guò)濾、自定義鬧鐘設(shè)置、聲音收...
閱讀原文

SoulGen

SoulGen是一個(gè)基于AI的藝術(shù)生成平臺(tái),支持用戶基于文本提示創(chuàng)造獨(dú)特的圖像。工具基于深度學(xué)習(xí)技術(shù),根據(jù)用戶提供的描述生成高質(zhì)量的藝術(shù)作品,支持多種風(fēng)格,...
閱讀原文

LayerSkip

LayerSkip是一種用在加速大型語(yǔ)言模型(LLMs)推理過(guò)程的技術(shù)。基于在訓(xùn)練階段應(yīng)用層dropout和早期退出損失,讓模型在推理時(shí)從早期層開(kāi)始更準(zhǔn)確地退出,不需...
閱讀原文

Spirit LM

Spirit LM是由Meta AI團(tuán)隊(duì)推出的一種多模態(tài)語(yǔ)言模型,能無(wú)縫地混合文本和語(yǔ)音數(shù)據(jù)。Spirit LM基于一個(gè)預(yù)訓(xùn)練的文本語(yǔ)言模型,用持續(xù)在文本和語(yǔ)音單元上的訓(xùn)練...
閱讀原文

Story-Adapter

Story-Adapter 是一種新型的長(zhǎng)篇故事可視化框架,能在保持語(yǔ)義一致性的同時(shí),生成高質(zhì)量且具有細(xì)膩交互的故事圖像序列。通過(guò)迭代方式,基于全局參考交叉注意...
閱讀原文

LOKI

LOKI是由中山大學(xué)和上海AI Lab聯(lián)合提出的合成數(shù)據(jù)檢測(cè)基準(zhǔn),旨在全面評(píng)估大型多模態(tài)模型(LMMs)在識(shí)別視頻、圖像、3D、文本和音頻等多種模態(tài)合成數(shù)據(jù)的能力...
閱讀原文

NotesGPT

NotesGPT是一款開(kāi)源的AI驅(qū)動(dòng)語(yǔ)音筆記工具,能將用戶的語(yǔ)音筆記快速轉(zhuǎn)錄成文本,自動(dòng)生成行動(dòng)項(xiàng)。工具基于包括Convex數(shù)據(jù)庫(kù)、Next.js框架、Together推理模型、...
閱讀原文

Browse AI

Browse AI是一款革命性的無(wú)代碼網(wǎng)頁(yè)數(shù)據(jù)提取工具,運(yùn)用人工智能技術(shù),讓用戶能夠快速?gòu)娜魏尉W(wǎng)站上抓取和監(jiān)控?cái)?shù)據(jù),無(wú)需編寫(xiě)代碼。用戶通過(guò)簡(jiǎn)單的點(diǎn)擊操作即可...
閱讀原文

MEXMA

MEXMA是由Meta AI推出的一種新型的預(yù)訓(xùn)練跨語(yǔ)言句子編碼器。基于結(jié)合句子級(jí)和詞語(yǔ)級(jí)的目標(biāo)提升句子表示的質(zhì)量。在訓(xùn)練過(guò)程中,MEXMA用一種語(yǔ)言的句子表示預(yù)測(cè)...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個(gè)輕量級(jí)且獨(dú)立的代碼庫(kù),旨在助力大規(guī)模訓(xùn)練語(yǔ)言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構(gòu)、損失函數(shù)和...
閱讀原文

VideoAgent

VideoAgent是一種自改進(jìn)的視頻生成系統(tǒng),由斯坦福大學(xué)、滑鐵盧大學(xué)、DeepMind等機(jī)構(gòu)的研究人員共同推出。根據(jù)圖像觀察和語(yǔ)言指令生成視頻計(jì)劃,轉(zhuǎn)換為機(jī)器人...
閱讀原文

Llama Tutor

Llama Tutor 是一個(gè)基于AI的個(gè)性化學(xué)習(xí)平臺(tái),由 Llama 3.1 和 Together AI 技術(shù)驅(qū)動(dòng),是一個(gè)完全開(kāi)源的項(xiàng)目。支持用戶輸入想要學(xué)習(xí)的主題和教育水平,生成一...
閱讀原文

ComfyGen

ComfyGen是由NVIDIA和特拉維夫大學(xué)研究人員推出的一種文本到圖像生成系統(tǒng),基于大型語(yǔ)言模型(LLM)自動(dòng)創(chuàng)建與用戶文本提示相匹配的工作流,提升圖像生成的質(zhì)...
閱讀原文