李沐重返母校上海交大,從LLM聊到個(gè)人生涯,這里是演講全文
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:李沐重返母校上海交大,從LLM聊到個(gè)人生涯,這里是演講全文
關(guān)鍵字:模型,數(shù)據(jù),問(wèn)題,技術(shù),動(dòng)機(jī)
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
機(jī)器之心報(bào)道
機(jī)器之心編輯部昨天,李沐回到了母校上海交大,做了一場(chǎng)關(guān)于 LLM 和個(gè)人生涯的分享。本文是機(jī)器之心梳理的李沐演講內(nèi)容(根據(jù) B 站用戶@考拉klkl上傳的視頻整理,感謝這位同學(xué)的錄制,視頻鏈接見(jiàn)文后。)圖源:上海交通大學(xué)特聘教授俞勇朋友圈。
Hi!大家好,說(shuō)我是計(jì)算機(jī)杰出校友有點(diǎn)不敢當(dāng)。很多年沒(méi)有回來(lái),這次回國(guó)想見(jiàn)一見(jiàn)本科導(dǎo)師。我的 AI 啟蒙導(dǎo)師李老師說(shuō),來(lái)都來(lái)了,要不做個(gè)報(bào)告吧。
本來(lái)我想講一些關(guān)于語(yǔ)言模型的知識(shí),但聽(tīng)講座的各位不一定都是這個(gè)方向,所以我加了一些這些年轉(zhuǎn)了很多地方、做出的不同選擇的感想。
第一部分我會(huì)講得稍微技術(shù)一點(diǎn),是有關(guān)整個(gè)語(yǔ)言模型的現(xiàn)在,以及未來(lái)情況的預(yù)測(cè)。
語(yǔ)言模型可以分為三塊:算力、數(shù)據(jù)和算法。所以語(yǔ)言模型也好,整個(gè)機(jī)器學(xué)習(xí)模型也好,本質(zhì)上就是把數(shù)據(jù)通過(guò)算力和算法壓進(jìn)中間那個(gè)模型里面,使得模型有一定的能力,在面對(duì)一個(gè)新的數(shù)據(jù)時(shí),它能夠在原數(shù)據(jù)里面找到相似的東西,然后做一定的修改,輸出你要的東西。打個(gè)比方,很多年前深度學(xué)習(xí)剛出來(lái)的時(shí)候,我說(shuō)機(jī)器學(xué)習(xí)像是老中醫(yī),深度學(xué)習(xí)可能跟玄幻小說(shuō)的煉丹有點(diǎn)像。所以你看現(xiàn)在的語(yǔ)言模型就很像煉丹,你要把一些材料放
原文鏈接:李沐重返母校上海交大,從LLM聊到個(gè)人生涯,這里是演講全文
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介: