標簽:對話生成

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Skywork-SWE-32B

Skywork-SWE-32B是昆侖萬維開源的32B規模的軟件工程(SWE)自主代碼智能體基座模型。模型專注于軟件工程任務,特別是倉庫級代碼修復能力,能在多輪交互和長文...
閱讀原文

ChatUI

ChatUI 是阿里團隊推出的開源智能對話式 UI 組件庫,能幫助開發者快速構建高質量的聊天應用,提供響應式設計、國際化、主題定制等功能。ChatUI 基于阿里巴巴 ...
閱讀原文

破殼AI口語

破殼AI口語是AI英語口語學習應用,基于AI技術為用戶提供個性化口語練習體驗。破殼AI口語涵蓋生活、校園、旅游、職場等多場景對話,幫助用戶提升流利度、語法...
閱讀原文

ACTalker

ACTalker 是用于生成逼真說話人頭部視頻的端到端視頻擴散框架。支持單信號或多信號控制,如音頻、表情等。核心架構包括并行 Mamba 結構,通過多個分支利用不...
閱讀原文

WorldScore

WorldScore 是斯坦福大學提出的用于世界生成模型的統一評估基準。將世界生成分解為一系列的下一個場景生成任務,通過明確的基于相機軌跡的布局規范來實現不同...
閱讀原文

MM-StoryAgent

MM-StoryAgent 是上海交通大學X-LANCE實驗室和阿里巴巴集團聯合推出的開源、多模態、多智能體框架,用在生成沉浸式的有聲故事繪本視頻。基于結合大型語言模型...
閱讀原文

We0

We0是開源的AI代碼編輯器,專為開發人員和產品經理設計。類似于bolt.new,支持在瀏覽器中運行調試代碼,提供高保真設計還原功能,能將設計稿還原度提升至90%...
閱讀原文

Emotion-LLaMA

Emotion-LLaMA是多模態情緒識別與推理模型,融合了音頻、視覺和文本輸入,通過特定情緒編碼器整合信息。模型基于修改版LLaMA,經指令調整以提升情感識別能力...
閱讀原文

SocraticLM

SocraticLM 是通過蘇格拉底式的教學法來教授數學的創新人工智能模型,模型由中科大和科大訊飛共同開發,采用了“Thought-Provoking”教學范式,通過提問引導學...
閱讀原文

Wavy:智能圖像處理應用,輕松實現圖像增強與藝術風格轉換

Wavy是AI驅動的照片編輯應用,基于先進的AI技術,將用戶的照片轉換成具有藝術感的杰作。Wavy主要功能包括AI藝術生成器、視覺放大、即時藝術創作、照片提升和...
閱讀原文

小冰島:智能克隆人互動平臺打造虛擬島嶼社交新體驗

小冰島是AI社交平臺,用戶在虛擬島嶼上創造克隆人,與之互動生活。平臺提供島嶼建設、派對游戲、職業扮演、關系養成和時尚穿搭等功能,支持與克隆人進行多樣...
閱讀原文

Talker-Reasoner:雙思維AI代理架構:智能決策與自我學習的完美結合

Talker-Reasoner是谷歌DeepMind推出的AI代理架構,借鑒人類的認知理論,將代理分為兩個模塊:Talker和Reasoner。Talker模擬人類的快速直覺思維(System 1),...
閱讀原文

ChatPlayground AI

ChatPlayground AI是創新的多AI聊天機器人平臺,通過集成多種行業領先的AI模型,為用戶提供更豐富、更準確的對話體驗。核心優勢在于能讓用戶在一個統一的界面...
閱讀原文

AniTalker

AniTalker是由來自上海交大X-LANCE實驗室和思必馳AISpeech的研究人員推出的一個對口型說話視頻生成框架,能夠將單張靜態人像和輸入的音頻轉換成栩栩如生的動...
閱讀原文

Glyph-ByT5

Glyph-ByT5-v2由微軟亞洲研究院、清華大學、北京大學和利物浦大學聯合開發的多語言視覺文本渲染項目。Glyph-ByT5-v2支持10種不同語言的準確視覺文本渲染,審...
閱讀原文
12