AI項目和框架

星火人設

星火人設是科大訊飛推出的專為情感交互而設計的獨立模型(角色模擬API),具備人物設定、劇情演繹與語言風格等控制選項,支持模型精調。在規模C端用戶的雙盲...
閱讀原文

萬相2.1

萬相2.1是阿里推出的通義萬相升級版本。基于自研的高效VAE和DiT架構,增強時空上下文建模能力,支持無限長1080P視頻的高效編解碼,首次實現中文文字視頻生成...
閱讀原文

星火紀要

星火紀要是科大訊飛推出的集轉錄、總結、翻譯、分析為一體的音視頻處理平臺,廣泛應用于通用會議、訪談、銷售、培訓等場景。能幫助個人高效總結會議重點內容...
閱讀原文

AutoDroid-V2

AutoDroid-V2是清華大學人工智能產業研究院推出的基于小型語言模型(SLM)的移動端GUI自動化腳本代理,能基于代碼生成技術提升設備上的GUI代理性能。AutoDroi...
閱讀原文

EnerVerse

EnerVerse 是智元機器人團隊開發的首個機器人4D世界模型,旨在通過生成未來具身空間來指導機器人完成復雜任務。模型采用自回歸擴散模型,結合稀疏記憶機制(S...
閱讀原文

PsycoLLM

PsycoLLM是合肥工業大學計算機科學與信息工程學院推出的中文心理大型語言模型,基于高質量的心理數據集訓練,提升對心理健康問題的理解和評估能力。模型的數...
閱讀原文

Casevo

Casevo(Cognitive Agents and Social Evolution Simulator)是中國傳媒大學數據科學與智能媒體傳播學院、中國傳媒大學媒體融合與傳播國家重點實驗室聯合推出...
閱讀原文

NMT

NMT(No More Tuning)是UC Berkeley和阿里巴巴集團聯合推出的多任務學習框架,能解決多任務學習中不同任務優先級優化的問題。NMT將多任務學習問題轉化為約束...
閱讀原文

MiniPerplx

MiniPerplx 是開源的 AI 搜索引擎,基于 Grok 2.0 模型進行搜索。MiniPerplx提供了免費的替代方案,用在搜索網頁、推特帖子、研究論文和 YouTube 視頻等內容...
閱讀原文

AddressCLIP

AddressCLIP 是基于 CLIP 技術構建的端到端圖像地理定位模型,由中科院自動化所和阿里云聯合開發。模型能通過一張照片實現街道級精度的定位,直接預測圖像拍...
閱讀原文

TradingAgents

TradingAgents是加利福尼亞大學洛杉磯分校和麻省理工學院推出的多代理LLM金融交易框架,能模擬現實世界的交易公司環境。TradingAgents整合多個具有不同角色和...
閱讀原文

CreatiLayout

CreatiLayout 是復旦大學和字節跳動聯合提出的創新的布局到圖像生成(Layout-to-Image, L2I)技術。通過構建大規模的布局數據集 LayoutSAM,包含 270 萬圖像-...
閱讀原文

RealisHuman

RealisHuman 是創新的后處理框架,旨在細化生成圖像中的人體部位,如手和臉等。框架通過兩階段的方法來實現這一目標。首先,使用原始的畸形部位作為參考,生...
閱讀原文

Cosmos

Cosmos是英偉達推出的生成式世界基礎模型平臺,旨在加速物理人工智能(AI)系統的發展,特別是在自動駕駛和機器人領域。Cosmos能接受文本、圖像或視頻的提示...
閱讀原文

優云智算

優云智算是UCloud優刻得旗下的GPU算力租賃平臺,專注于為AI應用提供高效、靈活的算力資源。支持按需租賃,滿足不同項目需求。平臺擁有豐富的鏡像社區,提供多...
閱讀原文
17374757677146