標簽:自然語言處理

FunASR

FunASR是由阿里巴巴達摩院開源的語音識別工具包,提供包括語音識別(ASR)、語音活動檢測(VAD)、標點恢復、語言模型、說話人驗證、說話人分離及多說話人ASR...
閱讀原文

CleanS2S

CleanS2S是一個流式語音到語音(S2S)交互智能體原型,提供高質量、實時的語音交互體驗。CleanS2S項目基于單文件實現,簡化配置和理解過程,便于用戶和研究人...
閱讀原文

Hallo2

Hallo2是復旦大學、百度公司和南京大學共同推出的音頻驅動視頻生成模型。能將單張參考圖片和持續幾分鐘的音頻輸入結合起來,基于可選的文本提示調節肖像表情...
閱讀原文

Ministral 3B/8B

Ministral 3B和8B是由Mistral AI推出的兩款新型AI小模型,專為設備端計算和邊緣使用場景設計。在知識、常識、推理、功能調用和效率方面為10億參數以下的類別...
閱讀原文

Any Summary

Any Summary是一款基于人工智能技術的文檔總結工具,能快速分析和總結長文本、音頻或視頻文件。用戶可以上傳文件或提供鏈接,Any Summary將用AI技術提取關鍵...
閱讀原文

Sana

SANA是由NVIDIA、麻省理工學院和清華大學共同推出的文本到圖像生成框架,能高效地生成高達4096×4096分辨率的高清晰度圖像。SANA基于深度壓縮自編碼器、線性擴...
閱讀原文

通義仁心

通義仁心是阿里巴巴集團旗下的一個面向醫療健康領域的人工智能服務平臺?;谙冗M的AI技術,提供專業、精準、有效的醫療健康信息解答服務。平臺通過自然語言...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個輕量級且獨立的代碼庫,旨在助力大規模訓練語言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構、損失函數和...
閱讀原文

PDFtoChat

PDFtoChat 是一個開源的創新AI項目,支持用戶基于自然語言對話的方式與 PDF 文件互動。工具基于最新的 AI 技術,包括 Together AI 和 Mixtral,理解用戶的查...
閱讀原文

Napkins.dev

Napkins.dev是一個創新的開源項目,基于AI技術將用戶的截圖或線框圖快速轉換成可運行的網頁應用程序。該、項目背后依托于Meta的Llama 3.1 405B大型語言模型和...
閱讀原文

Flair.ai

Flair.ai 是一款基于AI技術幫助用戶創建高質量產品攝影圖的在線設計工具。支持用戶與團隊成員實時協作,用拖放功能添加產品、道具和3D資產,調整光線和相機角...
閱讀原文

有掛

有掛是一款創新的瀏覽器AI插件,基于自然語言處理技術,使用戶用簡單的命令或對話修改網頁內容,無需任何編程知識。插件支持Chrome、Edge和Arc瀏覽器,具備個...
閱讀原文

Glarity

Glarity是一款基于ChatGPT技術的瀏覽器擴展工具,它能夠為YouTube視頻和Google搜索結果等網頁內容提供自動摘要和多語言翻譯。這款工具支持多種網站,包括新聞...
閱讀原文

麥芽島

麥芽島是由科大訊飛推出的一款AI虛擬角色互動聊天應用。用戶可以創建和自定義虛擬角色,與之進行沉浸式對話,模擬情感陪伴和劇情互動。用戶可以設定角色的外...
閱讀原文

Fluid

Fluid是由Google DeepMind和MIT共同推出的文本到圖像的自回歸生成模型,基于連續標記和隨機生成順序的方法,在視覺質量和評估性能上取得突破性進展。模型在擴...
閱讀原文
1585960616268