標簽:內容創作輔助

ModelEngine

ModelEngine 是華為開源的全流程 AI 開發工具鏈,圍繞數據使能、模型使能和應用使能三大核心功能展開,解決 AI 行業化落地過程中數據工程耗時長、模型訓練和...
閱讀原文

NextGenAI

NextGenAI是OpenAI推出的全球性聯盟,基于AI技術推動教育和研究的進步。NextGenAI聯合包括哈佛大學、麻省理工學院、牛津大學等在內的15所頂尖大學和機構,Ope...
閱讀原文

ARTalk

ARTalk是東京大學和日本理化學研究所推出的新型語音驅動3D頭部動畫生成框架,基于自回歸模型實現實時、高同步性的唇部動作和自然的面部表情及頭部姿勢生成。A...
閱讀原文

Pipecat

Pipecat是開源的Python框架,專注于構建語音和多模態對話代理。基于內置的語音識別、文本轉語音(TTS)和對話處理功能,簡化AI服務的復雜協調、網絡傳輸、音...
閱讀原文

PersonaMagic

PersonaMagic 是創新的高保真人臉定制技術,通過階段調節的文本條件策略實現個性化圖像生成。基于簡單多層感知機(MLP)網絡學習一系列動態嵌入,在特定時間...
閱讀原文

HuatuoGPT-o1

HuatuoGPT-o1是香港中文大學(深圳)和深圳大數據研究院聯合推出的,針對醫學領域開發的復雜推理模型,基于復雜的推理能力提高解決醫學問題的性能。模型用兩...
閱讀原文

星火標翼

星火標翼是科大訊飛推出的智能投標輔助工具,集標書知識構建、標書編寫檢查于一體的智能投標輔助應用。依托星火大模型解析投標所需資質、業績、方案等內容,...
閱讀原文

CogAgent-9B

CogAgent-9B是基于 GLM-4V-9B 訓練的專用Agent任務模型,僅依賴屏幕截圖作為輸入,無需HTML等文本表征。CogAgent-9B支持高分辨率圖像處理,具備雙語(中英文...
閱讀原文

MetaMorph:智能多模態產品提升用戶體驗與交互效率

MetaMorph是多模態大模型(MLLM),通過指令微調(Instruction Tuning)實現視覺理解和生成。它提出了一種名為Visual-Predictive Instruction Tuning(VPiT)...
閱讀原文

Liner:智能推薦與信息管理的全能助手

Liner是專為學生和研究人員打造的AI搜索引擎,致力于提升研究效率。Liner提供可信來源、自動引用生成、事實核查和篩選功能,幫助用戶快速、準確地獲取信息。L...
閱讀原文

LongLLaVA:多模態上下文混合架構大語言模型的創新應用與特點解析

LongLLaVA是多模態大型語言模型(MLLM),基于混合架構結合Mamba和Transformer模塊,能高效處理大量圖像,特別擅長視頻理解和高分辨率圖像分析。LongLLaVA在...
閱讀原文

代悟:智能搜索引擎助力開發者高效獲取精準信息

代悟是專為開發者打造的AI搜索引擎。基于深度學習技術和知識圖譜,幫助開發者快速、精準地獲取技術信息和解決方案。基于整合海量的開發文檔、代碼庫和社區問...
閱讀原文

Promptim:智能優化庫助力自動迭代配置生成與性能提升

Promptim是實驗性的AI提示優化庫,基于自動化流程提升AI系統在特定任務上的提示效果。用戶提供初始提示、數據集和自定義評估器,Promptim能自動運行優化循環...
閱讀原文

Void:開源AI編碼工具的智能補全與建議功能

Void 是基于 Visual Studio Code 構建的開源文本編輯器,集成AI技術增強編程體驗。Void支持代碼自動補全、內聯編輯、AI 驅動的代碼搜索,直接與大型語言模型...
閱讀原文

Grok-1

Grok-1 是由馬斯克旗下的人工智能初創公司 xAI 開發的一款大型語言模型,是一個混合專家(MoE)模型,擁有 3140 億參數,使其成為目前參數量最大的開源大語言...
閱讀原文
123