AIGC動態歡迎閱讀
原標題:清華唐杰團隊新作:一口氣生成2萬字,大模型開卷長輸出
關鍵字:模型,長度,數據,文本,研究人員
文章來源:量子位
內容字數:0字
內容摘要:
明敏 發自 凹非寺量子位 | 公眾號 QbitAI一口氣生成2萬字,大模型輸出也卷起來了!
清華&智譜AI最新研究,成功讓GLM-4、Llama-3.1輸出長度都暴增。
相同問題下,輸出結果直接從1800字增加到7800字,翻4倍。
要知道,目前大模型的生成長度普遍在2k以下。這對于內容創作、問題回答等都存在影響,可能導致模型回答問題不全面、創造性降低等。
該研究由智譜AI創始人、清華大學教授李涓子和唐杰共同領銜。
論文及代碼都已放在GitHub上開源。
有網友已經搶先體驗。LongWriter-llama3.1-8b可生成萬字長文《羅馬帝國衰落史》,在MacBook Pro 2018(32GB)上就能運行。
輸出內容很準確,可以得A++。
9B模型搞定萬字輸出本項研究主要包括3方面工作。
分析文本生成長度限制因素
提出AgentWrite
擴展LLM輸出窗口大小
首先,研究人員構建了一個測試工具LongWrite-Ruler。通過測試多個大模型,他們發現所有模型在生成超過2000字的文本時都遇到了困難。
進一步分析用戶和大模型的交互日志,研究人員發現只有超過1%的用戶請求明確提到要生
原文鏈接:清華唐杰團隊新作:一口氣生成2萬字,大模型開卷長輸出
聯系作者
文章來源:量子位
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...