AI項目和框架

AddressCLIP

AddressCLIP 是基于 CLIP 技術構建的端到端圖像地理定位模型,由中科院自動化所和阿里云聯合開發。模型能通過一張照片實現街道級精度的定位,直接預測圖像拍...
閱讀原文

TradingAgents

TradingAgents是加利福尼亞大學洛杉磯分校和麻省理工學院推出的多代理LLM金融交易框架,能模擬現實世界的交易公司環境。TradingAgents整合多個具有不同角色和...
閱讀原文

CreatiLayout

CreatiLayout 是復旦大學和字節跳動聯合提出的創新的布局到圖像生成(Layout-to-Image, L2I)技術。通過構建大規模的布局數據集 LayoutSAM,包含 270 萬圖像-...
閱讀原文

RealisHuman

RealisHuman 是創新的后處理框架,旨在細化生成圖像中的人體部位,如手和臉等。框架通過兩階段的方法來實現這一目標。首先,使用原始的畸形部位作為參考,生...
閱讀原文

Cosmos

Cosmos是英偉達推出的生成式世界基礎模型平臺,旨在加速物理人工智能(AI)系統的發展,特別是在自動駕駛和機器人領域。Cosmos能接受文本、圖像或視頻的提示...
閱讀原文

優云智算

優云智算是UCloud優刻得旗下的GPU算力租賃平臺,專注于為AI應用提供高效、靈活的算力資源。支持按需租賃,滿足不同項目需求。平臺擁有豐富的鏡像社區,提供多...
閱讀原文

KAG

KAG(Knowledge Augmented Generation)是螞蟻集團推出的專業領域知識服務框架,基于知識增強提升大型語言模型(LLMs)在特定領域的問答性能,為垂直領域的知...
閱讀原文

Gemini Coder

Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 應用。Gemini Coder基于簡單的描述,結合 Sandpack 實現實時...
閱讀原文

AIOpsLab

AIOpsLab是微軟公司、加州大學伯克利分校、伊利諾伊大學香檳分校、微軟研究院等機構推出的,用在構建、評估和改進云服務運營管理AIOps代理的原型框架。AIOpsL...
閱讀原文

VideoRefer

VideoRefer是浙江大學和阿里達摩學院聯合推出的,專門用在視頻中對象的感知和推理。基于增強視頻大型語言模型(Video LLMs)的空間-時間理解能力,讓模型能在...
閱讀原文

JoyCaption

JoyCaption 是開源的圖像提示詞生成工具,用于訓練擴散模型。JoyCaption 涵蓋廣泛的圖像風格、內容、種族、性別和取向,最小化過濾理解世界的各個方面,但不...
閱讀原文

麥橘超然

麥橘超然(MajicFlus)是由麥橘推出的基于Flux.1架構的AI模型,專注于生成高質量的人像圖像,擅長表現亞洲女性的細膩與美感。模型融合多種技術,能生成逼真的...
閱讀原文

CHRONOS

CHRONOS是上海交通大學計算機科學與工程系、阿里巴巴集團通義實驗室等機構聯合推出的,用在新聞時間線摘要生成的新型框架,基于迭代自問自答的方式,用大型語...
閱讀原文

Edicho

Edicho 是香港科技大學、螞蟻集團、斯坦福大學和香港中文大學推出的,基于擴散模型的圖像編輯方法,能在多圖像間實現一致性編輯。Edicho用免訓練的方法,無需...
閱讀原文

Mobile-Agent

Mobile-Agent 是具有移動性的智能代理軟件實體,能在網絡的各個節點之間移動,代表用戶或其他代理進行工作。能根據具體情況中斷當前執行,移動至另一設備上恢...
閱讀原文
18384858687155