AI項目和框架
AddressCLIP
AddressCLIP 是基于 CLIP 技術構建的端到端圖像地理定位模型,由中科院自動化所和阿里云聯合開發。模型能通過一張照片實現街道級精度的定位,直接預測圖像拍...
TradingAgents
TradingAgents是加利福尼亞大學洛杉磯分校和麻省理工學院推出的多代理LLM金融交易框架,能模擬現實世界的交易公司環境。TradingAgents整合多個具有不同角色和...
CreatiLayout
CreatiLayout 是復旦大學和字節跳動聯合提出的創新的布局到圖像生成(Layout-to-Image, L2I)技術。通過構建大規模的布局數據集 LayoutSAM,包含 270 萬圖像-...
Gemini Coder
Gemini Coder 是基于 Google 的 Gemini API、Next.js 和 Tailwind CSS 的工具,用在快速生成 app 應用。Gemini Coder基于簡單的描述,結合 Sandpack 實現實時...
VideoRefer
VideoRefer是浙江大學和阿里達摩學院聯合推出的,專門用在視頻中對象的感知和推理。基于增強視頻大型語言模型(Video LLMs)的空間-時間理解能力,讓模型能在...
JoyCaption
JoyCaption 是開源的圖像提示詞生成工具,用于訓練擴散模型。JoyCaption 涵蓋廣泛的圖像風格、內容、種族、性別和取向,最小化過濾理解世界的各個方面,但不...
Mobile-Agent
Mobile-Agent 是具有移動性的智能代理軟件實體,能在網絡的各個節點之間移動,代表用戶或其他代理進行工作。能根據具體情況中斷當前執行,移動至另一設備上恢...
粵公網安備 44011502001135號