標簽:方法

人民大學:揭示大語言模型事實召回的關鍵機制

夕小瑤科技說 原創來源 | 芒果 引言:大語言模型事實召回機制探索該論文深入研究了基于Transformer的語言模型在零射擊和少射擊場景下的事實記憶任務機制。模...
閱讀原文

“抄襲”原來才是最快的寫論文方法?

有些研究生,即使告訴他方法,也發不了頂會頂刊! 因為能發頂會或者高區位會議的文章,idea必須有創新性。而一個科研新人幾乎不具備獨立提煉idea的能力。 很...
閱讀原文

谷歌更新Transformer架構,更節省計算資源!50%性能提升

明敏 發自 凹非寺量子位 | 公眾號 QbitAI谷歌終于更新了Transformer架構。 最新發布的Mixture-of-Depths(MoD),改變了以往Transformer計算模式。 它通過動...
閱讀原文

今日arXiv最熱大模型論文:從Twitter動態預測論文學術不端,人大發布

夕小瑤科技說 原創作者 | 松果 引言:社交媒體在科研誠信中的潛在作用在科研領域,確保研究成果的真實性和可靠性是至關重要的。然而,不論是由于研究不端行為...
閱讀原文

CVPR 2024滿分論文,英偉達開源BOP排行榜6D物體姿態第一名方法

機器之心專欄 機器之心編輯部物體姿態估計對于各種應用至關重要,例如機器人操縱和混合現實。實例級方法通常需要紋理 CAD 模型來生成訓練數據,并且不能應用...
閱讀原文

CVPR 2024 | 更高效、更準確的拖拽編輯 Drag Your Noise

新加坡管理大學何盛烽團隊聯合華南師范大學在CVPR 2024上發表了工作《Drag Your Noise: Interactive Point-based Editing via Diffusion Semantic Propagatio...
閱讀原文

CVPR 2024|生成不了光線極強的圖片?微信視覺團隊有效解決擴散模型奇點問題

機器之心專欄 機器之心編輯部擴散模型憑借其在圖像生成方面的出色表現,開啟了生成式模型的新紀元。諸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如...
閱讀原文

貝葉斯數學與人工智能相結合 可使太陽能更智能

GETTY IMAGES 來源:IEEE電氣電子工程師學會 隨著對可再生能源的需求激增,材料研究人員正在尋找制造更高效太陽能電池的方法。如今商業生產的標準晶體太陽能...
閱讀原文

今日arXiv最熱NLP大模型論文:微軟:用大模型分析用戶滿意度,讓智能系統更善解人意

夕小瑤科技說 原創作者 | 芒果引言:關于大模型分析用戶滿意度的探索該研究強調了用戶滿意度估計(USE)的準確性和可解釋性在改善對話系統中的重要性?,F有的...
閱讀原文

兩分鐘1200幀的長視頻生成器StreamingT2V來了,代碼將開源

機器之心報道 編輯:Panda廣闊的戰場,風暴兵在奔跑…… prompt:Wide shot of battlefield, stormtroopers running... 這段長達 1200 幀的 2 分鐘視頻來自一個...
閱讀原文

老藥新用,中南大學團隊發布 AdaDR,基于自適應圖卷積網絡進行藥物重定位

作者:梅菜 編輯:李寶珠,三羊 中南大學研究團隊提出了一種名為 AdaDR 的自適應 GCN 方法,通過深度集成節點特征和拓撲結構來進行藥物重定位?,F代社會,人...
閱讀原文

清華微軟開源全新提示詞壓縮工具,長度驟降80%!GitHub怒砍3.1K星

新智元報道編輯:潤 好困 【新智元導讀】最近,清華和微軟的研究人員提出了一種全新的方法,能在保證輸出質量不變的前提下,將提示詞壓縮到原始長度的20%!在...
閱讀原文

模型合并就進化,直接拿下SOTA!Transformer作者創業新成果火了

豐色 發自 凹非寺量子位 | 公眾號 QbitAI把Huggingface上的現成模型拿來“攢一攢”—— 直接就能組合出新的強大模型?! 日本大模型公司sakana.ai腦洞大開(正是“...
閱讀原文

離職谷歌的Transformer作者創業,3個模型(附技術報告)

機器之心報道 編輯:陳萍、小舟去年 8 月,兩位著名的前谷歌研究人員 David Ha、Llion Jones 宣布創立一家人工智能公司 Sakana AI,總部位于日本東京。其中,...
閱讀原文

用大語言模型控制交通信號燈,有效緩解擁堵!

夕小瑤科技說 原創作者 | 松果 引言:城市交通擁堵的挑戰與智能交通信號控制的進展城市交通擁堵是一個全球性的問題,在眾多緩解交通擁堵的策略中,提高路口交...
閱讀原文
191011121321