AI項目和框架

Imagine Yourself

Imagine Yourself 是Meta公司推出的個性化AI圖像生成模型，突破了傳統方法的局限，無需對每個用戶進行單獨調整，通過單一模式即可滿足不同用戶需求。模型采用...

閱讀原文

AI工具

1年前 (2024)

Bark

Bark是Suno AI 推出的開源文本到音頻模型，能生成逼真的多語言語音和多種音頻類型，包括音樂、背景噪音等，同時支持非語言交流如笑聲和哭泣。Bark提供預訓練...

閱讀原文

AI工具

1年前 (2024)

eSearch

eSearch是一款開源的跨平臺AI桌面應用，集成了截屏、OCR識別、搜索翻譯、貼圖、以圖搜圖和屏幕錄制等功能。eSearch基于Electron框架開發，適用于Linux、Windo...

閱讀原文

AI工具

1年前 (2024)

Sapiens

Sapiens是Meta實驗室推出的AI視覺模型，專為理解圖片和視頻中的人類動作設計。支持二維姿勢預估、身體部位分割、深度估計和表面法線預測等任務，采用視覺轉換...

閱讀原文

AI工具

1年前 (2024)

TrackGo

TrackGo是先進的可控AI視頻生成技術，通過用自由形狀的遮罩和箭頭，為用戶提供了一種靈活而精確的機制來控制視頻中對象的運動。技術的核心是TrackAdapter，一...

閱讀原文

AI工具

1年前 (2024)

GPT Pilot

GPT Pilot 是一款AI編程工具，通過模仿人類開發者的工作流程，幫助從零開始構建應用程序。能編寫代碼、調試程序、與用戶討論問題，并請求代碼審查，是真正的 ...

閱讀原文

AI工具

1年前 (2024)

GaussianEditor

GaussianEditor 是一種基于高斯飛濺（Gaussian Splatting）的3D編輯算法，支持用戶快速而精確地修改3D場景。通過高斯語義跟蹤和分層高斯飛濺，提供了高度的編...

閱讀原文

AI項目和框架

1年前 (2024)

mPLUG-Owl3

mPLUG-Owl3是阿里巴巴推出的先進通用多模態大模型，專為理解和處理多圖及長視頻設計。在保持準確性的同時，顯著提升了推理效率，能在4秒內分析完2小時電影。

閱讀原文

AI工具

1年前 (2024)

Lingo

Lingo 是西湖心辰推出的國內首個端到端語音大模型，在技術上具備實時打斷、實時指令控制、超級擬人、能說會唱等能力，擁有比 GPT-4o 更出色的中文語音效果。

閱讀原文

AI工具

1年前 (2024)

山海大模型

山海大模型是云知聲推出的多模態AI大模型，具備豐富的知識儲備和多模態交互能力。山海大模型能通過文本、音頻、圖像等多種形式與用戶進行實時互動，提供信息...

閱讀原文

AI工具

1年前 (2024)

AIEditor

AIEditor是面向 AI 的下一代富文本編輯器，AIEditor基于 Web Component 開發，支持 Layui、Vue、React、Angular、Svelte 等幾乎任何前端框架。AIEditor適配了...

閱讀原文

AI工具

1年前 (2024)

Omages

Omages是一個開源的3D模型生成項目，基于圖像擴散技術將3D形狀的幾何和紋理信息編碼進64x64像素的2D圖像中，從而簡化3D建模流程。

閱讀原文

AI工具

1年前 (2024)

GLM-4-Flash

GLM-4-Flash是智譜AI推出的首個免費大模型API，GLM-4-Flash不僅支持多輪對話和多語言處理，還具備網頁瀏覽、代碼執行等高級功能。開發者和企業可以在智譜AI開...

閱讀原文

AI工具

1年前 (2024)

AgentGen

AgentGen是香港大學與微軟聯合推出的AI項目框架，通過自動生成多樣化環境和任務，顯著提升了大語言模型（LLM）的規劃能力。AgentGen利用BI-EVOL方法，創建難...

閱讀原文

AI工具

1年前 (2024)

MotionGen

MotionGen是元象科技推出的3D動作生成模型，結合了大模型、物理仿真和強化學習算法，支持用戶僅通過簡單文本指令即可快速生成逼真且流暢的3D動作。MotionGen...

閱讀原文

AI工具

1年前 (2024)

1…127 128129130 131…155