輕量級LLM應用開發框架,通過一行代碼切換不同LLM
Promptic是輕量級的LLM應用開發框架,提供高效且符合Python風格的開發方式?;贚iteLLM,Promptic支持開發者能輕松切換不同的LLM服務提供商,只需更改一行代...
星流AI:全新一站式AI圖像生成平臺助力創意無限探索
星流AI是LiblibAI推出的一站式AI圖像生成平臺,基于自研的Star-3通用圖像生成模型,結合全球最大的LoRA增強模型庫和先進的AI圖像控制技術。為設計師、攝影師...
Ultravox:智能多模態助手實現文本與語音的無縫理解
Ultravox是新型的多模態大型語言模型(LLM),能直接理解文本和人類語音,無需依賴單獨的自動語音識別(ASR)階段?;诙嗄B投影器技術將音頻數據轉換為高...
谷歌推出的瀏覽網站智能體,能幫用戶操作表格、在線購物
Project Mariner 是谷歌 DeepMind 推出的瀏覽器助手。Project Mariner基于 Gemini 2.0 技術,用 Chrome 擴展程序實現瀏覽器自動化,理解和執行網頁任務。Proj...
Midjourney 推出的多人協作 AI 虛擬世界構建工具
Patchwork 是 Midjourney 推出的創新性多人協作世界構建工具,支持用戶在一個無限的畫布上共同創作和構建虛擬世界。結合了AI圖像生成技術和實時協作功能,支...
開源的實時多模態 AI 代理框架
TEN Agent是集成OpenAI Realtime API和RTC技術的開源實時多模態AI代理框架。TEN Agent能實現語音、文本、圖像的多模態交互,支持高性能的實時通信,具備低延...
FLOAT:音頻驅動的流匹配技術實現動態說話人頭像生成
FLOAT是DeepBrain AI 和韓國先進科技研究院推出的音頻驅動說話人頭像生成模型,基于流匹配生成模型,學習運動潛在空間實現高效的時間一致性運動設計。模型基...
AI繪畫工具,支持多種場景多種繪畫風格和技巧
AISEO Art是AI驅動的藝術生成平臺,基于先進的AI技術,支持用戶用文本提示創作出獨特的視覺藝術作品。平臺提供廣告產品制作、圖像變化、AI頭像和濾鏡選擇等功...
MMAudio:高質量AI音頻合成的多模態聯合訓練技術創新
MMAudio是先進視頻到音頻合成技術,基于多模態聯合訓練,讓模型能在廣泛的視聽和音頻文本數據集上進行訓練。技術的核心是同步模塊,確保生成的音頻與視頻幀精...
LiblibAI 推出的一站式 AI 圖像生成平臺
星流AI是LiblibAI平臺推出的一站式AI生圖平臺,基于自研的Star-3通用圖像生成模型,結合全球最大的LoRA增強模型庫和先進的AI圖像控制技術。為設計師、攝影師...
AI英語學習應用,與AI實時互動模擬真實口語對話場景
Speak APP是基于AI技術的英語學習應用,主打口語練習功能。Speak APP模擬真實對話場景,讓用戶與AI進行互動,實時獲得發音、語法和詞匯的反饋。Speak結合Open...
谷歌推出的原生多模態輸入輸出 + Agent 為核心的AI模型
Gemini 2.0是谷歌最新推出的原生多模態輸入輸出的AI模型。Gemini 2.0 Flash是2.0家族第一個模型,以多模態輸入輸出和Agent技術為核心,速度比 1.5 Pro快兩倍...
書生·萬象InternVL 2.5:創新驅動的多模態大語言模型提升智能交互體驗
書生·萬象InternVL 2.5是上海AI實驗室的OpenGVLab團隊推出的開源多模態大型語言模型(MLLM)系列。該系列模型在InternVL 2.0的基礎上進行顯著增強,特別是在...
開源文本轉語音工具,ChatTTS擴展版支持語音克隆
ChatTTSPlus是ChatTTS的擴展版本,基于集成TensorRT加速、語音克隆和移動模型部署等先進技術,提升語音合成的性能和靈活性。在Windows平臺上,能實現超過3倍...
AI建筑可視化平臺,快速將草圖或概念圖轉化成可視化圖像
Gendo是AI驅動的建筑可視化平臺,基于生成式AI技術,如GANs和Diffusion模型,快速創建高度逼真的建筑概念圖。平臺能集成到設計工作流程中,支持設計師在項目...