AIGC動態歡迎閱讀
原標題:「LLM」這個名字不好,Karpathy認為不準確、馬斯克怒批太愚蠢
關鍵字:語言,模型,問題,名字,領域
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
編輯:陳陳LLM 應該改名嗎?你怎么看。在 AI 領域,幾乎每個人都在談論大型語言模型,其英文全稱為 Large Language Models,簡寫為 LLM。
因為 LLM 中有「Language」一詞,因此,大家默認這種技術和語言密切相關。
然而,知名 AI 大牛 Andrej Karpathy 卻對此有著獨特的見解:「大型語言模型(LLM)名字雖然帶有語言二字,但它們其實與語言關系不大,這只是歷史問題,更確切的名字應該是自回歸 Transformer 或者其他。
LLM 更多是一種統計建模的通用技術,它們主要通過自回歸 Transformer 來模擬 token 流,而這些 token 可以代表文本、圖片、音頻、動作選擇、甚至是分子等任何東西。因此,只要能將問題轉化為模擬一系列離散 token 的流程,理論上都可以應用 LLM 來解決。實際上,隨著大型語言模型技術棧的日益成熟,我們可能會看到越來越多的問題被納入這種建模范式。也就是說,問題固定在使用 LLM 進行『下一個 token 的預測』,只是每個領域中 token 的用途和含義有所不同。
如果核心問題真的變成
原文鏈接:「LLM」這個名字不好,Karpathy認為不準確、馬斯克怒批太愚蠢
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...