用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型,真的科學(xué)嗎?

AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型,真的科學(xué)嗎?
關(guān)鍵字:人類,測(cè)試,智能,模型,計(jì)算機(jī)
文章來源:機(jī)器之心
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
選自Communications of the ACM
作者:Neil Savage
機(jī)器之心編譯
機(jī)器之心編輯部當(dāng)前的大型語言模型似乎能夠通過一些公開的圖靈測(cè)試。我們?cè)撊绾魏饬克鼈兪欠裣袢艘粯勇斆髂兀吭诎l(fā)布后的近兩年時(shí)間里,ChatGPT 表現(xiàn)出了一些非常類似人類的行為,比如通過律師資格考試。這讓一些人懷疑,計(jì)算機(jī)的智力水平是否正在接近人類。大多數(shù)計(jì)算機(jī)科學(xué)家認(rèn)為,機(jī)器的智力水平還不能與人類相提并論,但他們還沒有就如何衡量智力或具體衡量什么達(dá)成。
檢驗(yàn)機(jī)器智能的經(jīng)典實(shí)驗(yàn)是圖靈測(cè)試,由艾倫?圖靈在其 1950 年發(fā)表的論文《Computing Machinery and Intelligence》中提出。圖靈認(rèn)為,如果計(jì)算機(jī)能讓與之進(jìn)行打字對(duì)話的人相信它是人類,這可能就是智能的標(biāo)志。大型語言模型(LLM),如 GPT,擅長(zhǎng)像人一樣說話,但尚未令人信服地通過圖靈測(cè)試。2023 年,加州大學(xué)圣迭戈分校(UCSD)的研究人員公開進(jìn)行了一次圖靈測(cè)試,目的是比較最新的 LLM 與 20 世紀(jì) 60 年代開發(fā)的機(jī)器人 Eliza 的表現(xiàn)。在律師資格考試中獲得高分的 GPT-4 表現(xiàn)相當(dāng)出色
原文鏈接:用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型,真的科學(xué)嗎?
聯(lián)系作者
文章來源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:

粵公網(wǎng)安備 44011502001135號(hào)