AI項目和框架

eSearch

eSearch是一款開源的跨平臺AI桌面應用,集成了截屏、OCR識別、搜索翻譯、貼圖、以圖搜圖和屏幕錄制等功能。eSearch基于Electron框架開發,適用于Linux、Windo...
閱讀原文

Sapiens

Sapiens是Meta實驗室推出的AI視覺模型,專為理解圖片和視頻中的人類動作設計。支持二維姿勢預估、身體部位分割、深度估計和表面法線預測等任務,采用視覺轉換...
閱讀原文

TrackGo

TrackGo是先進的可控AI視頻生成技術,通過用自由形狀的遮罩和箭頭,為用戶提供了一種靈活而精確的機制來控制視頻中對象的運動。技術的核心是TrackAdapter,一...
閱讀原文

GPT Pilot

GPT Pilot 是一款AI編程工具,通過模仿人類開發者的工作流程,幫助從零開始構建應用程序。能編寫代碼、調試程序、與用戶討論問題,并請求代碼審查,是真正的 ...
閱讀原文

GaussianEditor

GaussianEditor 是一種基于高斯飛濺(Gaussian Splatting)的3D編輯算法,支持用戶快速而精確地修改3D場景。通過高斯語義跟蹤和分層高斯飛濺,提供了高度的編...
閱讀原文

mPLUG-Owl3

mPLUG-Owl3是阿里巴巴推出的先進通用多模態大模型,專為理解和處理多圖及長視頻設計。在保持準確性的同時,顯著提升了推理效率,能在4秒內分析完2小時電影。
閱讀原文

Lingo

Lingo 是西湖心辰推出的國內首個端到端語音大模型,在技術上具備實時打斷、實時指令控制、超級擬人、能說會唱等能力,擁有比 GPT-4o 更出色的中文語音效果。
閱讀原文

山海大模型

山海大模型是云知聲推出的多模態AI大模型,具備豐富的知識儲備和多模態交互能力。山海大模型能通過文本、音頻、圖像等多種形式與用戶進行實時互動,提供信息...
閱讀原文

AIEditor

AIEditor是面向 AI 的下一代富文本編輯器,AIEditor基于 Web Component 開發,支持 Layui、Vue、React、Angular、Svelte 等幾乎任何前端框架。AIEditor適配了...
閱讀原文

Omages

Omages是一個開源的3D模型生成項目,基于圖像擴散技術將3D形狀的幾何和紋理信息編碼進64x64像素的2D圖像中,從而簡化3D建模流程。
閱讀原文

GLM-4-Flash

GLM-4-Flash是智譜AI推出的首個免費大模型API,GLM-4-Flash不僅支持多輪對話和多語言處理,還具備網頁瀏覽、代碼執行等高級功能。開發者和企業可以在智譜AI開...
閱讀原文

AgentGen

AgentGen是香港大學與微軟聯合推出的AI項目框架,通過自動生成多樣化環境和任務,顯著提升了大語言模型(LLM)的規劃能力。AgentGen利用BI-EVOL方法,創建難...
閱讀原文

MotionGen

MotionGen是元象科技推出的3D動作生成模型,結合了大模型、物理仿真和強化學習算法,支持用戶僅通過簡單文本指令即可快速生成逼真且流暢的3D動作。MotionGen...
閱讀原文

GameNGen

GameNGen是谷歌推出的首個AI游戲引擎,能以每秒20幀的速度實時生成逼真的DOOM游戲畫面,甚至讓60%的玩家無法區分真假。GameNGen預示著游戲開發可能不再需要傳...
閱讀原文

GLM-4-Plus

GLM-4-Plus是智譜AI最新推出的高智能旗艦大模型,在語言理解和長文本處理上取得突破,采用創新技術如PPO,顯著提升推理和指令遵循能力。GLM-4-Plus在多個關鍵...
閱讀原文