標簽:智能對話系統

Marco

Marco是阿里國際最新推出的大規模商用翻譯大模型,支持15種全球主流語種,包括中、英、日、韓、西、法等。在BLEU評測指標上超越Google翻譯、DeepL、GPT-4等競...
閱讀原文

Lingua

Lingua 是 Meta AI推出的一個輕量級且獨立的代碼庫,旨在助力大規模訓練語言模型。基于易于修改的 PyTorch 組件,便于研究人員嘗試新的模型架構、損失函數和...
閱讀原文

ComfyGen

ComfyGen是由NVIDIA和特拉維夫大學研究人員推出的一種文本到圖像生成系統,基于大型語言模型(LLM)自動創建與用戶文本提示相匹配的工作流,提升圖像生成的質...
閱讀原文

Kanana

Kanana是韓國即時通訊巨頭Kakao推出的一款生成式AI助理,定位為用戶的“AI伴侶”。能記住對話中的關鍵信息,根據上下文提供智能回應。Kanana分為兩部分:Kana作...
閱讀原文

語鯨

語鯨(LingoWhale)是基于深言科技大模型能力的一款AI閱讀工具,通過智能總結、問答、思維導圖等功能,幫助用戶快速把握文章核心內容和結構。工具支持多端同...
閱讀原文

Moonshine

Moonshine是專為資源受限設備優化的語音識別模型,提供快速且準確的實時語音轉文本服務。適于需要即時響應的應用場景,例如現場轉錄和語音命令識別。Moonshin...
閱讀原文

CogAgent

CogAgent是清華大學與智譜AI聯合推出的多模態視覺大模型,專注于圖形用戶界面(GUI)的理解和導航。通過視覺模態對GUI界面進行感知,非傳統的文本模態,更符...
閱讀原文

創音島

創音島是集錄音轉文字、配音和AI寫歌于一體的音樂創作平臺。支持將音頻快速轉換為文字,便于用戶在會議、演講等場合快速記錄信息。創音島提供多種音色和參數...
閱讀原文

Voice Design

Voice Design是ElevenLabs推出的AI語音生成工具,用戶只需描述所需聲音的年齡、口音、性別、語調或音高,甚至是虛構角色如精靈、食人魔等,工具能快速生成獨...
閱讀原文

GLM-4-Voice

GLM-4-Voice是智譜AI推出的端到端情感語音模型,能直接理解和生成中英文語音,支持實時語音對話,能根據用戶指令靈活調整語音的情感、語調、語速和方言等特征...
閱讀原文

OSAID 1.0

OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)發布的官方標準,用在明確AI系統成為開放源代碼的條件。參與制定OSAID 1....
閱讀原文

Infinity AI

Infinity AI是人工智能工具,專注視頻內容創作,通過深度學習技術,結合人類的故事講述能力,用戶輸入劇本或對話內容,一鍵生成視頻。Infinity AI提供數字人...
閱讀原文

PromptPort

PromptPort是為ChatGPT用戶設計的平臺,專注于提示詞的創作、優化和分享。PromptPort提供豐富的提示詞庫,用戶直接用或根據需求進行創作和優化。平臺支持網頁...
閱讀原文

HK-O1aw

HK-O1aw是香港生成式AI研發中心(HKGAI)旗下AI for Reasoning團隊(HKAIR)與北京大學對齊團隊(PKU-Alignment Team)合作推出的全球首個慢思考范式法律推理大模型...
閱讀原文

GENIE

GENIE是Luma AI推出的文本生成3D內容的工具,能將簡單的文本描述轉化為生動的三維場景和對象。 用戶只需輸入文本描述,GENIE能根據描述生成3D模型,支持將生...
閱讀原文
1456