AIGC動態歡迎閱讀
原標題:李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%
關鍵字:代碼,模型,任務,研究人員,語義
文章來源:新智元
內容字數:6117字
內容摘要:
新智元報道編輯:桃子
【新智元導讀】激發大模型解決復雜問題的重要技術之一CoT,如今要被顛覆了?谷歌DeepMind斯坦福UC伯克利共同提出了「代碼鏈」(CoC),讓LLM在代碼中學會了思考。思維鏈(CoT),最具開拓性和影響力的提示工程技術之一,能增強LLM在推理決策中的表現。
那么,如果大模型可以在代碼中「思考」,會如何呢?
最近,谷歌DeepMind、斯坦福、UC伯克利團隊聯手提出了全新技術——「代碼鏈」(CoC)。
論文地址:https://arxiv.org/pdf/2312.04474.pdf
「代碼鏈」是一種將編碼邏輯與自然語言理解相結合,簡單卻非常有效的創新方法,能夠提升LLM基于代碼的推理能力,讓其更智能、更通用。
再通俗點講,CoC允許LLM生成「偽代碼」來分解難題,通過LMulator執行有效代碼,模擬無效代碼。
研究結果顯示,在BIG-Bench Hard基準上,CoC實現了84%的準確率,比CoT提高了12%。
另外,在BIG-Bench Hard的23項任務中,CoC在18項任務中超過了人類的平均表現。
看得出,「代碼鏈」將CoT向前推進了一步,并將生成用
原文鏈接:李飛飛DeepMind全新「代碼鏈」碾壓CoT!大模型用Python代碼推理,性能暴漲12%
聯系作者
文章來源:新智元
作者微信:AI_era
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...