突破萬字長文輸出瓶頸!清華大學(xué)開源 LongWriter-6k 數(shù)據(jù)集;7 個 CCF A 類頂會即將截稿

AIGC動態(tài)歡迎閱讀
原標(biāo)題:突破萬字長文輸出瓶頸!清華大學(xué)開源 LongWriter-6k 數(shù)據(jù)集;7 個 CCF A 類頂會即將截稿
關(guān)鍵字:解讀,數(shù)據(jù),報告,圖像,模型
文章來源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
當(dāng)前的長上下文大模型雖能處理海量文本的輸入,但由于長輸出示例的匱乏,使其在生成長篇內(nèi)容時卻力不從心。為解決這個問題,清華大學(xué)的研究團(tuán)隊構(gòu)建了 LongWriter-6k 數(shù)據(jù)集,能夠?qū)⒋竽P偷淖畲筝敵龃翱诖笮U(kuò)展至 10,000+ 字!
借助 LongWriter-6k 訓(xùn)練的模型,不僅在小說創(chuàng)作中可以生成情節(jié)跌宕起伏、篇幅超長的精彩小說,讓讀者沉浸在一個宏大的文學(xué)世界中;在學(xué)術(shù)研究方面,它還能夠生成詳盡的研究報告和論文綜述,為科研人員提供豐富的參考資料。
hyper.ai 官網(wǎng)現(xiàn)已上線「LongWriter-6k 長上下文輸出數(shù)據(jù)集」,還支持在線使用,下拉文章獲取鏈接~
8 月 19 日-8 月 23 日,hyper.ai 官網(wǎng)更新速覽:
*優(yōu)質(zhì)公共數(shù)據(jù)集:10 個
* 優(yōu)質(zhì)教程精選:2 個
* 社區(qū)文章精選:2 篇
* 熱門百科詞條:5 條
* 9 月截稿頂會:7 個
訪問官網(wǎng):hyper.ai公共數(shù)據(jù)集精選1.LongWriter-6k 長上下文輸出數(shù)據(jù)集
該數(shù)據(jù)集包含 6k 篇 SFT 數(shù)據(jù),輸出長度為 2k-32k 字(包括英文和中文),可支持訓(xùn)練 LLM,將其最大輸出窗口大
原文鏈接:突破萬字長文輸出瓶頸!清華大學(xué)開源 LongWriter-6k 數(shù)據(jù)集;7 個 CCF A 類頂會即將截稿
聯(lián)系作者
文章來源:HyperAI超神經(jīng)
作者微信:
作者簡介:

粵公網(wǎng)安備 44011502001135號