LowCodeEngine
LowCodeEngine是阿里巴巴開源的低代碼開發框架,基于提供拖拽、配置等簡單操作,讓開發者快速構建復雜的系統頁面。框架以強大的定制能力、優雅的開發體驗、豐...
Qwen-Agent
Qwen-Agent是基于通義千問模型(Qwen)的開源Agent開發框架,支持開發者用Qwen模型的指令遵循、工具使用、規劃和記憶能力構建智能代理應用。Qwen-Agent支持函...
Mind GPT-3o
Mind GPT-3o是理想汽車推出的多模態端到端大模型,融合語音、視覺和語言理解技術,實現高效實時交互。Mind GPT-3o具備記憶、規劃、工具使用和表達能力,能提...
DynamicControl
DynamicControl是騰訊優圖聯合南洋理工、浙大等研究機構推出的集成多模態大語言模型(MLLM)推理能力的文本生成圖像(T2I)任務新框架。DynamicControl通過自...
video-analyzer
video-analyzer是開源的視頻分析工具,結合Llama的11B視覺模型和OpenAI的Whisper模型來提取視頻關鍵幀、轉錄音頻內容,并生成視頻的詳細描述。工具支持完全本...
Vision Parse
Vision Parse是開源的PDF文檔轉換工具,基于視覺語言模型(Vision LLMs)將PDF文件轉換成Markdown格式。Vision Parse能智能識別和提取PDF中的文本和表格,且...
The Language of Motion
The Language of Motion是斯坦福大學李飛飛團隊推出的多模態語言模型,能整合人類動作中的言語和非言語語言。模型能處理文本、語音和動作數據,生成對應的目...
Mathtutor on Groq
Mathtutor on Groq 是基于 Groq 架構的AI數學輔導工具,基于語音識別功能,支持用戶用語音形式提出數學問題。工具內置強大的數學引擎,能實時計算并用 LaTeX ...