用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型，真的科學(xué)嗎？

AIGC動(dòng)態(tài)1年前 (2024)發(fā)布機(jī)器之心

AIGC動(dòng)態(tài)歡迎閱讀

原標(biāo)題：用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型，真的科學(xué)嗎？
關(guān)鍵字：人類,測(cè)試,智能,模型,計(jì)算機(jī)
文章來源：機(jī)器之心
內(nèi)容字?jǐn)?shù)：0字

內(nèi)容摘要：

選自Communications of the ACM
作者：Neil Savage
機(jī)器之心編譯
機(jī)器之心編輯部當(dāng)前的大型語言模型似乎能夠通過一些公開的圖靈測(cè)試。我們?cè)撊绾魏饬克鼈兪欠裣袢艘粯勇斆髂兀吭诎l(fā)布后的近兩年時(shí)間里，ChatGPT 表現(xiàn)出了一些非常類似人類的行為，比如通過律師資格考試。這讓一些人懷疑，計(jì)算機(jī)的智力水平是否正在接近人類。大多數(shù)計(jì)算機(jī)科學(xué)家認(rèn)為，機(jī)器的智力水平還不能與人類相提并論，但他們還沒有就如何衡量智力或具體衡量什么達(dá)成。
檢驗(yàn)機(jī)器智能的經(jīng)典實(shí)驗(yàn)是圖靈測(cè)試，由艾倫?圖靈在其 1950 年發(fā)表的論文《Computing Machinery and Intelligence》中提出。圖靈認(rèn)為，如果計(jì)算機(jī)能讓與之進(jìn)行打字對(duì)話的人相信它是人類，這可能就是智能的標(biāo)志。大型語言模型（LLM），如 GPT，擅長(zhǎng)像人一樣說話，但尚未令人信服地通過圖靈測(cè)試。2023 年，加州大學(xué)圣迭戈分校（UCSD）的研究人員公開進(jìn)行了一次圖靈測(cè)試，目的是比較最新的 LLM 與 20 世紀(jì) 60 年代開發(fā)的機(jī)器人 Eliza 的表現(xiàn)。在律師資格考試中獲得高分的 GPT-4 表現(xiàn)相當(dāng)出色

原文鏈接：用「圖靈測(cè)試」檢驗(yàn)AI尤其是大語言模型，真的科學(xué)嗎？