AIGC動態歡迎閱讀
原標題:米開朗基羅怎么說?谷歌DeepMind推出長上下文評估新框架
關鍵字:上下文,模型,企鵝,長度,長上
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:alan
【新智元導讀】近日,來自谷歌DeepMind的研究人員提出了Michelangelo,「用米開朗基羅的觀點」來測量任意上下文長度的基礎模型性能。米開朗基羅,文藝復興時期著名的雕塑家。
曾有人問他是如何創作出如此偉大的作品,他回答說:
「The sculpture is already complete within the marble block, before I start my work. It is already there, I just have to chisel away the superfluous material.」
「在我開始工作之前,雕塑已經在大理石塊中完成了。它已經在那里了,我只需要鑿掉多余的材料?!?br />(小編PS:在我寫稿之前,稿子已經在字典里完成了……)
這種寫意的表述可以類比到許多工作,比如大語言模型從上下文中理解信息。
LLM可能面對著很長的語境(大理石),需要「鑿掉」其中不相關的信息,才能理解有效的內部結構(雕塑)
所以,對于LLM來說,米開朗基羅的能力就可以是長上下文的能力。
然而,無論是用戶還是研究者都不
原文鏈接:米開朗基羅怎么說?谷歌DeepMind推出長上下文評估新框架
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章

暫無評論...