標簽:自然語言處理

JoyGen

JoyGen是京東科技和香港大學推出的,音頻驅動的3D說話人臉視頻生成框架,專注于實現精確的唇部與音頻同步及高質量的視覺效果。JoyGen結合音頻特征和面部深度...
閱讀原文

Seede.ai

Seede.ai是 AI 圖像設計工具,專為簡化設計流程,使沒有設計經驗的用戶能在短時間內創建出專業級的設計作品。提供一句話生成設計,用戶只需輸入簡單描述,AI...
閱讀原文

LIMO

LIMO(Less Is More for Reasoning)是上海交通大學研究團隊提出的高效推理方法,通過極少量高質量的訓練樣本激活大語言模型(LLM)的復雜推理能力。核心假設...
閱讀原文

SynCD

SynCD(Synthetic Customization Dataset)是卡內基梅隆大學和Meta推出的高質量合成訓練數據集,用在提升文本到圖像模型的定制化能力。SynCD包含多個相同對象...
閱讀原文

DeepRAG

DeepRAG 是中科院、中科大和騰訊微信AI部聯合推出的新型檢索增強生成(RAG)框架,提升大型語言模型(LLMs)在推理和檢索任務中的性能。通過將檢索增強推理建...
閱讀原文

qeen.ai

qeen.ai 是谷歌和 DeepMind 前員工為電子商務企業提供自主 AI Agent平臺,幫助商家優化內容創作、營銷和對話銷售。 AI Agent 基于專有的 RL-UI 技術,實時從...
閱讀原文

北京郵電大學AI入門課《AI在大前》

親愛的同學們,你們好!在進入大學之前,這個課程將讓你對人工智能有全新的認知和理解。你將學習到人工智能的核心概念,學習數學和物理學的相關基礎知識,了解...
閱讀原文

Granola

Granola是專為頻繁參加會議的人設計的AI會議助手工具。能實時轉錄會議內容,自動識別發言者并標注時間戳,支持用戶在會議中實時添加筆記和標記重點。會議結束...
閱讀原文

BitsAI-CR

BitsAI-CR是字節跳動團隊推出的基于大型語言模型(LLM)的自動化代碼審查工具,通過兩階段處理流程實現高效代碼審查:RuleChecker 負責基于 219 條規則檢測潛...
閱讀原文

Deep Research

Deep Research是OpenAI推出的新型AI深度搜索研究工具,專為需要深度、復雜研究的用戶設計。能在短時間內(5到30分鐘)完成人類專家需要數小時甚至數天才能完...
閱讀原文

Pipecat

Pipecat是開源的Python框架,專注于構建語音和多模態對話代理。基于內置的語音識別、文本轉語音(TTS)和對話處理功能,簡化AI服務的復雜協調、網絡傳輸、音...
閱讀原文

Loora

Loora 是先進的 AI 英語輔導應用,能幫助用戶提高英語口語能力。基于模擬各種真實場景的對話,讓用戶在商務、面試、日常交流等情境中練習英語。Loora 能實時...
閱讀原文

Step R-mini

Step R-mini(全稱Step Reasoner mini)是階躍星辰推出的推理模型, 是 Step 系列模型家族的首個推理模型,擅長主動規劃、嘗試和反思,基于慢思考和反復驗證...
閱讀原文

GLM-Realtime

GLM-Realtime是智譜推出的全新端到端多模態模型,具備低延遲的視頻理解與語音交互能力,特別融入清唱功能,讓大模型在對話中能展現歌唱才能。模型支持長達2分...
閱讀原文

Aibiye

Aibiye是AI論文寫作輔助平臺,基于Multimodal+Global Thought Chain語言模型,為用戶提供從開題報告到完整論文的生成服務。用戶只需輸入關鍵詞、選擇專業和字...
閱讀原文
1212223242568