標簽:模塊
南洋理工發布多模態金融交易Agent,平均利潤提高36%!
夕小瑤科技說 原創作者 | 芒果 引言:金融市場的新挑戰與新機遇金融市場是經濟穩定的基石,它不僅促進了資本的分配,還提供了風險管理的機制。隨著市場的不斷...
遷移學習幫大忙!成都理工大學搭建 SCDUNet++ 模型進行滑坡測繪
作者:加零 編輯:李寶珠、三羊 成都理工大學的研究人員提出了一個名為 SCDUNet++ 的語義分割模型,結合卷積神經網絡和 Transformer 的優勢,有效開展滑坡測...
匿名論文提出奇招!增強大模型長文本能力居然還能這么做
豐色 發自 凹非寺量子位 | 公眾號 QbitAI一提到提高大模型長文本能力,就想到長度外推或者上下文窗口擴展? 不行,這些都太費硬件資源了。 來看一個奇妙新解...
詳解面向大模型的檢索增強生成(RAG)
RAG最近有一篇廣受關注的綜述,最近是花了不少時間給啃了個大概,里面提及的挺多文章其實都挺精彩的,甚至是讓人興奮的。我先把鏈接放上。 論文:Retrieval-A...
小米新一代Kaldi團隊論文解讀:新型自動語音識別 (ASR) 模型Zipformer誕生之路|ICLR 2024 Oral
機器之心專欄 作者:新一代 Kaldi 團隊近日,小米集團新一代 Kaldi 團隊關于語音識別聲學模型的論文《Zipformer: A faster and better encoder for automatic...
買個機器人端茶倒水有希望了?Meta、紐約大學造了一個OK-Robot
機器之心報道 編輯:張倩、陳萍如果有個這樣的機器人,你幾點回家?「xx,去把電視柜上的遙控器幫我拿過來?!乖谝粋€家庭環境中,很多家庭成員都不免被支使干...
大模型學會聽音樂了!風格樂器精準分析,還能剪輯合成
騰訊PCG ARC實驗室 投稿量子位 | 公眾號 QbitAI能處理音樂的多模態大模型,終于出現了! 只見它準確分析出音樂的旋律、節奏,還有使用的樂器,甚至其中的意境...
今日Arxiv最熱NLP大模型論文:LLM化身符號邏輯大師,智能體文本游戲新紀元
夕小瑤科技說 原創作者 | 賽博馬良本期論文解讀非人類撰寫,全文由賽博馬良「AI論文解讀達人」智能體自主完成,經人工審核后發布。智能體傳送門: https://ww...
字節最新文生視頻模型,引發圍觀!狐貍跳舞超絲滑,效果超Gen-2
夕小瑤科技說 原創作者 | 謝年年、python擴散模型帶動了文生視頻領域的發展。Runway、Pika 1.0、Morph、Moon Valley和Stable Video Diffusion model等模型在...
效果超越Gen-2!字節最新視頻生成模型,一句話讓綠巨人戴上VR眼鏡
白交 發自 凹非寺量子位 | 公眾號 QbitAI一句話,就讓綠巨人戴上VR眼鏡。 4K畫質那種。 熊貓的奇幻漂流~ 這是字節最新的AI視頻生成模型MagicVideo-V2,各種奇...
騰訊 PCG ARC Lab、新加坡國立大合發布 M2UGen:基于 LLM 的多模態音樂理解與生成
在過去的一年里,基于大語言模型LLM的音樂AIGC技術蓬勃發展,為LLM的下游應用注入了新的活力。 本研究成果M2UGen致力于將LLM和音樂理解與音樂生成技術相結合...
「喚醒」NPC,這家融資過億的國內創企在做一種很新的游戲
機器之心報道 編輯:張倩、陳萍每次進入游戲,NPC 都說著不一樣的臺詞,這將是一個怎樣的世界?在眾多游戲類型中,開放世界游戲是非常受歡迎的一種,因為它允...
《我的世界》化身AI小鎮,NPC居民角色扮演如同真人
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI注意看,這個方塊人正在快速思考面前幾位“不速之客”的身份。 原來她是遇到了危險,意識到這一點之后,她馬上開始在...
AI繪圖模型不會寫字的難題,被阿里了
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI能準確寫漢字的AI繪圖工具,終于登場了! 包括中文在內一共支持四種語言,而且還能文字的位置還能任意指定。 從此...
4分鐘成功復現諾獎!CMU開發GPT-4化學家,自主編碼操控機器人顛覆化學研究登Nature
新智元報道編輯:桃子 潤 【新智元導讀】AI顛覆化學研究再次登上Nature!由CMU和Emerald Cloud Lab團隊開發的GPT-4加持的AI工具,在不到4分鐘的時間成功復現2...