AI項目和框架

Free Video-LLM：高效視頻語言模型實現無需訓練的智能內容生成

Free Video-LLM是創新的無需訓練的高效視頻語言模型，基于提示引導的視覺感知技術，實現對視頻內容的高效理解。模型用預訓練的圖像LLMs，無需額外訓練即可適...

閱讀原文

AI工具

1年前 (2024)

LogoCreator：快速生成專業定制商標的開源AI Logo設計工具

LogoCreator是開源的logo生成器，基于Together AI提供的Flux Pro 1.1技術快速創建專業風格的logo。項目用Next.js和TypeScript構建應用框架，Shadcn和Tailwind...

閱讀原文

AI工具

1年前 (2024)

法信法律基座大模型：法律行業新紀元的千億參數智能大模型發布

法信法律基座大模型是基于清華大學與面壁智能科研成果轉化的千億參數通用大模型，由最高人民法院發布，定位為國家級法律AI基礎設施。提供生成式AI底層能力，...

閱讀原文

AI工具

1年前 (2024)

Audio Decomposition：輕松轉換音樂為五線譜的開源工具

Audio Decomposition是音頻處理技術，基于傅里葉變換和信封匹配將音樂中的各個音符和樂器分離，實現音樂到樂譜的轉換。Audio Decomposition開源項目是Matthew...

閱讀原文

AI工具

1年前 (2024)

Florence-2：多功能視覺語言模型提升跨模態理解與應用能力

Florence-2 是微軟 Azure AI 團隊推出的多功能視覺模型，能執行圖像描述、目標檢測、視覺定位和圖像分割等多種計算機視覺任務。Florence-2 基于 Transformer ...

閱讀原文

AI工具

1年前 (2024)

k0-math：月之暗面Kimi的創新數學推理模型引領高效決策新潮流

k0-math是月之暗面推出的最新數學推理模型，主打深入思考能力。在MATH、中考、高考、考研等數學基準測試中，k0-math的成績超過OpenAI的o1系列模型。模型基于...

閱讀原文

AI工具

1年前 (2024)

MagicQuill：智能圖像編輯助手助你輕松創作與分享

MagicQuill是香港科技大學、螞蟻集團、浙江大學和香港大學共同推出的開源AI互動式圖像編輯工具。基于用戶友好的界面和AI支持的智能建議，實現精確的局部圖像...

閱讀原文

AI工具

1年前 (2024)

ai-chatbot：構建高性能應用的開源AI機器人解決方案

ai-chatbot是Vercel推出的開源項目，基于Next.js框架和Vercel AI SDK構建。ai-chatbot提供一個功能完備、易于定制的AI聊天機器人模板，幫助開發者快速構建高...

閱讀原文

AI工具

1年前 (2024)

LLaMA-Mesh：清華與英偉達攜手打造智能自然語言驅動的3D模型生成系統

LLaMA-Mesh是清華大學和NVIDIA共同推出的項目，基于將3D網格生成與大型語言模型（LLMs）結合，實現用文本提示直接生成3D模型的功能。項目用OBJ文件格式將3D網...

閱讀原文

AI工具

1年前 (2024)

iAgents：多智能體協作創新框架推動人工智能高效協同與任務優化

iAgents是清華大學推出的多AI智能體協作框架，基于為每個用戶配備個人AI智能體促進協作和完成日常任務。智能體能理解用戶的文件、命令，從協作中學習，實現自...

閱讀原文

AI工具

1年前 (2024)

DanceFusion：音頻驅動的舞蹈動作重建與生成開源框架助力創意舞蹈表達

DanceFusion是清華大學推出的開源框架，專注于音頻驅動的舞蹈動作重建與生成。DanceFusion結合分層時空Transformer-VAE和擴散模型，能處理社交媒體上的不完整...

閱讀原文

AI工具

1年前 (2024)

Symphony Creative Studio：TikTok推出智能AI廣告創意視頻生成工具，輕松打造個性化廣告內容

Symphony Creative Studio是TikTok推出的AI視頻創作工具，幫助廣告主和內容創作者簡化視頻制作流程。Symphony Creative Studio集成視頻生成、轉換和擴展功能...

閱讀原文

AI工具

1年前 (2024)

Skywork o1：天工大模型4.0 O1版：智能生成與多模態交互的革新體驗

Skywork o1是昆侖萬維推出的天工大模型4.0 o1版，是國內首款具備中文邏輯推理能力的o1模型。Skywork o1在模型輸出中內生了思考、計劃、反思等能力，顯著提升...

閱讀原文

AI工具

1年前 (2024)

Voyage Multimodal-3：多模態嵌入模型引領AI創新實現更智能的跨領域理解與應用

Voyage Multimodal-3 是 Voyage AI 推出的先進的多模態嵌入模型，能處理交錯的文本和圖像，并從 PDF、幻燈片、表格等截圖中捕捉關鍵視覺特征，無需復雜文檔解...

閱讀原文

AI工具

1年前 (2024)

Hali：多模態智能體協作解決方案提升團隊效率與創新能力

Hali是特斯聯聯合國際輕奢品牌Buttons推出的多模態多智能體協作AI Agent。Hali具備類人思考、長記憶、物理世界感知和多智能體協作四大特點，語義理解準確率超...

閱讀原文

AI工具

1年前 (2024)

1…109 110111112 113…155