標簽:多語言支持
什么是光學字符識別(Optical Character Recognition, OCR)
光學字符識別(Optical Character Recognition,OCR)是一種將文本圖像轉換為機器可讀格式的技術。通過自動數據提取,能快速識別掃描文檔、相機圖像和圖像PDF...
Midscene.js
Midscene.js是基于AI技術的自動化SDK,通過用大型語言模型(LLM)簡化UI自動化測試中的命令。用戶用自然語言描述交互步驟或預期數據格式,Midscene.js將執行...
OmniAudio-2.6B
OmniAudio-2.6B是Nexa AI推出的音頻語言模型,專為邊緣部署設計,能實現快速且高效的音頻文本處理。OmniAudio-2.6B是具有2.6億參數的多模態模型融合Gemma-2-2...
Leya:多國法律支持的智能法律服務平臺助力律師高效審查、搜索與起草文件
Leya 是專為法律專業人士設計的AI法律服務平臺,基于集成AI工具優化法律工作流程。Leya能自動化重復性任務,聚合信息,并提供對法律資源及用戶數據的一站式訪...
MisoraAI:智能AI搜索引擎提升信息獲取效率與創意生成能力
Misora AI是先進的人工智能搜索引擎,提供快速且準確的搜索結果。通過深度學習和自然語言處理技術,能理解用戶的查詢意圖,從其數據庫中檢索相關信息。Misora...
ArkoAI:高效生成高質量建筑渲染圖的AI工具兼容建模軟件
ArkoAI是基于AI技術的渲染平臺,能與Rhino3D、Revit和SketchUp等多種建模軟件兼容。用戶只需輸入設計概念詞匯,ArkoAI能快速生成高品質的效果圖,極大地簡化...
LeviTor:創新3D目標軌跡控制視頻合成技術提升視覺效果與交互體驗
LeviTor是南京大學、螞蟻集團、浙江大學等機構推出的圖像到視頻合成技術,結合深度信息和K-means聚類點控制視頻中3D物體的軌跡,無需顯式的3D軌跡跟蹤。LeviT...
No more copyright:智能圖像生成平臺助力創意無限
No more copyright是在線平臺,基于AI技術幫助用戶將上傳的圖片轉換成獨特且無版權問題的版本,專為創意探索和靈感激發而設計。用戶上傳圖像,平臺生成新的、...
AI Chinese
AI Chinese是嗨你好教育推出的AI雙語教學中文學習平臺,基于AI技術為外國人提供在線中文學習解決方案。平臺模擬中國真人老師在線授課,在TikTok用短視頻和直...
VisionFM:少樣本多疾病診斷的智能眼科AI模型
VisionFM(伏羲慧眼)是多模態多任務的視覺基礎模型,專為通用眼科人工智能而設計。通過預訓練3.4百萬張來自560,457個個體的眼科圖像,覆蓋廣泛的眼科疾病、...
Bamba-9B:Mamba2架構驅動的高效解碼語言模型展現卓越性能與靈活應用
Bamba-9B是IBM、普林斯頓大學、卡內基梅隆大學和伊利諾伊大學香檳分校聯合推出的,基于Mamba2架構的僅解碼語言模型模型。模型在完全開放的數據集上訓練,能提...
ERA-42:星動紀元全新端到端原生機器人大模型實現智能化交互與高效任務執行
ERA-42是北京星動紀元推出的端到端原生機器人大模型,與自研的五指靈巧手星動XHAND1結合,能完成100多種復雜靈巧操作任務。ERA-42無需預編程,具備快速學習新...