豆包推出視覺理解模型,具備識別和推理能力
豆包視覺理解模型是豆包推出的先進AI大模型,具備視覺識別和理解推理能力。豆包視覺理解模型能識別圖像中物體的類別、形狀、紋理等,還能理解物體間的關系和...
豆包推出3D生成模型,自然語言交互實時生成3D場景圖
豆包3D生成模型是豆包推出的3D生成模型,屬于豆包大模型家族。模型基于3D-DiT 架構,能生成高質量 3D 模塊。與火山引擎數字孿生平臺 veOmniverse 結合使用,...
MV-Adapter:多視圖一致圖像生成模型的創新應用與技術優勢
MV-Adapter是多視圖一致圖像生成模型,是北京航空航天大學、VAST和上海交通大學的研究團隊推出的。MV-Adapter能將預訓練的文本到圖像擴散模型轉化為多視圖圖...
谷歌推出的評估大模型能力的基準測試
FACTS Grounding是谷歌DeepMind推出的評估大型語言模型(LLMs)能力的基準測試,衡量模型根據給定上下文生成事實準確且無捏造信息的文本的能力。FACTS Ground...
Databricks SQL:智能數據倉庫助力企業高效數據處理與分析
Databricks SQL 是 Databricks 推出的智能數據倉庫服務,基于 DatabricksIQ(Data Intelligence Engine)理解用戶數據的獨特性,為技術與業務用戶提供易用的...
開源漫畫圖片文字翻譯工具,多語言翻譯無縫嵌入原圖
Manga Image Translator是開源的漫畫圖片文字翻譯工具,能一鍵翻譯漫畫和圖片中的文字。Manga Image Translator基于OCR技術識別文本,結合機器翻譯將文字轉換...
AI試卷識別處理軟件,具備高清掃描、手寫擦除、試卷還原等功能
拍試卷是為學生和教師設計的試卷掃描和處理軟件。拍試卷基于OCR(光學字符識別)技術,從圖片中提取文字變得快速和準確,保持原有的排版格式。拍試卷具備高清...
AI Safeguard聯合卡內基梅隆和斯坦福開源的輕量級多模態模型
Ivy-VL是AI Safeguard聯合卡內基梅隆大學和斯坦福大學推出的輕量級多模態AI模型,專為移動端和邊緣設備設計。模型擁有3B參數量,相較于其他多模態大模型,顯...
清華和騰訊共同推出的圖像序列著色模型
ColorFlow是清華大學和騰訊ARC實驗室共同推出的圖像序列著色模型,能精細化地保持圖像序列中個體身份的同時進行著色。基于檢索增強、上下文學習和超分辨率技...
集成多種社交媒體和通訊渠道的 AI 自動化客戶管理工具
Superchat是企業級全渠道消息服務平臺,幫助企業整合WhatsApp、Instagram、Facebook Messenger 等渠道建立忠實的客戶關系、自動化發送新聞通訊、銷售產品并回...
AI全棧開發平臺,自然對話快速構建網站和Web應用
Lovable 是AI全棧工程師工具,基于自然語言處理技術,讓用戶能用對話快速構建網站和Web應用程序。Lovable 平臺支持與Supabase集成,實現數據庫連接和用戶認證...
AI工作流可視化構建器,拖放節點設計復雜工作流
NodeTool是開源的AI工作流可視化構建器。NodeTool集成廣泛的AI工具和模型,基于簡單、可視化的界面,讓用戶無需編碼即可快速原型設計和測試。NodeTool支持在...
中科院聯合多所高校機構推出增強多模態音樂生成的框架
VMB(Visuals Music Bridge)是中國科學院信息工程研究所、中國科學院大學網絡空間安全學院、上海人工智能實驗室、上海交通大學等機構推出的多模態音樂生成框...
AI營銷平臺,分析數據快速生成個性化的營銷活動
ZEPIC是AI驅動自動化營銷平臺。基于統一數據和渠道,幫助營銷人員建立更深層次的客戶聯系。平臺的核心是AI引擎Zenie,提供從數據管理到活動交付的端到端營銷...