標簽:模型
分解大模型的神經元!Claude團隊最新研究火了,網友:打開黑盒
豐色 發自 凹非寺量子位 | 公眾號 QbitAI神經網絡的不可解釋性,一直是AI領域的“老大難”問題。但現在,我們似乎取得了一絲進展——ChatGPT最強競對Claude背后的...
開源論文神器DocsGPT登頂GitHub熱榜!多類型文檔查詢,支持中文可本地部署 | 狂攬8000+星
白交 發自 凹非寺量子位 | 公眾號 QbitAI開源論文神器來了,結果直接登頂GitHub熱榜,狂攬8000+星!只需跟DocsGPT聊聊天,就可以查找各種文檔中的信息。目前...
致敬TempleOS,有開發者創建了啟動Llama 2的操作系統,網友:8G內存老電腦就能跑
機器之心報道編輯:杜偉不得不說,Llama 2 的「二創」項目越來越硬核、有趣了。自 Meta 發布開源大模型 Llama 2 以來,圍繞著該模型的「二創」項目便多了起來...
OpenAI計劃研發自己的AI芯片,已有收購目標
機器之心報道編輯:小舟天下苦英偉達久矣。微軟和 OpenAI 這對合作伙伴,將在人工智能芯片賽道上成為競爭對手。據路透社報道,OpenAI 正在考慮構建自己的人工...
基于牛頓求根法,新算法實現并行訓練和評估RNN,帶來超10倍增速
機器之心報道編輯:Panda W人們普遍認為 RNN 是無法并行化的,因為其本質上的序列特性:其狀態依賴于前一狀態。這使得人們難以用長序列來訓練 RNN。近日,一...
76頁綜述+300余篇參考文獻,天大團隊全面介紹大語言模型對齊技術
機器之心專欄作者:熊德意教授團隊天大自然語言處理團隊從更廣泛的 AI 對齊視角,審視大語言模型對齊技術,并從多個角度進行深入討論。近日,天津大學熊德意...
7.7億參數,超越5400億PaLM!UW谷歌提出「分步蒸餾」,只需80%訓練數據|ACL 2023
新智元報道編輯:LRS【新智元導讀】LLM不實用,小模型蒸餾才是「現實」的大模型應用路線,全面領先微調技術!土豪請無視。。。大型語言模型雖然性能優異,可...
30分鐘教會機器人做家務!CMU提出全新結構化世界模型SWIM
大數據文摘授權轉載自將門創投作者:seven_教會機器人在現實環境中解決各種復雜任務,一直是機器人控制領域的關鍵研究課題。近來隨著具身智能的快速發展,機...
人工智能會放長假嗎?
對看到這篇推文的各位來說,2023 年最后的假期結束了。對 2023 年一路狂飆的 AI 而言,并不存在這個概念。人工智能不會休息。持續沖刺,持續顛覆一切。大模型...
OpenAI 勁敵 Anthropic 身價飆升,亞馬遜注資 40 億美元,大模型站在“分叉口”
大數據文摘受權轉載自AI科技評論作者 | 西西編輯 | 陳彩嫻9 月 25 日,昨日,亞馬遜官宣其向 AI 初創公司 Anthropic 注資 40 億美元的消息,引起了海內外人工...
CMU華人打破大模型黑盒,Llama 2撒謊被一眼看穿!腦電波慘遭曝光,LLM矩陣全
新智元報道編輯:編輯部【新智元導讀】大語言模型黑盒,居然被CMU等機構的學者打破了?他們發現,LLM內部有可解釋的表征,如果撒謊,還能被測謊儀檢測出來!...
LLM成功不可或缺的基石:RLHF及其替代技術
機器之心編譯編輯:Panda關于訓練大模型常用的 RLHF 技術,這篇文章幫你逐步解讀了其工作過程,還總結了一些其他替代方法。在討論 LLM 時,我們總是會涉及一...
自動駕駛獨角獸如此造假,LeCun都服了
明敏 發自 凹非寺量子位 | 公眾號 QbitAI你以為這是個平平無奇的自動駕駛視頻????NO、NO、NO……這其實是完全由AI從頭生成的。沒有一幀是“真的”。?????不同路...
MIT驚人證明:大語言模型就是「世界模型」?吳恩達觀點再被證實,LLM竟能理解空間和時間
新智元報道編輯:編輯部【新智元導讀】MIT的兩位學者發文力證:大語言模型能夠理解世界!他們的工作表明,LLM不僅僅學習了表面的統計數據,還學習了包括空間...
ICCV2023獎項出爐!斯坦福ControlNet和多倫多大學分別獲得最佳論文!Segment Anything最佳提名
新智元報道作者:專知【新智元導讀】ICCV 2023全部獎項已經公布,有兩篇獲得最佳論文,一篇來自斯坦福大學的研究者的ControlNet獲得ICCV 2023馬爾獎(最佳論...
粵公網安備 44011502001135號