突破萬(wàn)字長(zhǎng)文輸出瓶頸!清華大學(xué)開(kāi)源 LongWriter-6k 數(shù)據(jù)集;7 個(gè) CCF A 類(lèi)頂會(huì)即將截稿
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:突破萬(wàn)字長(zhǎng)文輸出瓶頸!清華大學(xué)開(kāi)源 LongWriter-6k 數(shù)據(jù)集;7 個(gè) CCF A 類(lèi)頂會(huì)即將截稿
關(guān)鍵字:解讀,數(shù)據(jù),報(bào)告,圖像,模型
文章來(lái)源:HyperAI超神經(jīng)
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
當(dāng)前的長(zhǎng)上下文大模型雖能處理海量文本的輸入,但由于長(zhǎng)輸出示例的匱乏,使其在生成長(zhǎng)篇內(nèi)容時(shí)卻力不從心。為解決這個(gè)問(wèn)題,清華大學(xué)的研究團(tuán)隊(duì)構(gòu)建了 LongWriter-6k 數(shù)據(jù)集,能夠?qū)⒋竽P偷淖畲筝敵龃翱诖笮U(kuò)展至 10,000+ 字!
借助 LongWriter-6k 訓(xùn)練的模型,不僅在小說(shuō)創(chuàng)作中可以生成情節(jié)跌宕起伏、篇幅超長(zhǎng)的精彩小說(shuō),讓讀者沉浸在一個(gè)宏大的文學(xué)世界中;在學(xué)術(shù)研究方面,它還能夠生成詳盡的研究報(bào)告和論文綜述,為科研人員提供豐富的參考資料。
hyper.ai 官網(wǎng)現(xiàn)已上線(xiàn)「LongWriter-6k 長(zhǎng)上下文輸出數(shù)據(jù)集」,還支持在線(xiàn)使用,下拉文章獲取鏈接~
8 月 19 日-8 月 23 日,hyper.ai 官網(wǎng)更新速覽:
*優(yōu)質(zhì)公共數(shù)據(jù)集:10 個(gè)
* 優(yōu)質(zhì)教程精選:2 個(gè)
* 社區(qū)文章精選:2 篇
* 熱門(mén)百科詞條:5 條
* 9 月截稿頂會(huì):7 個(gè)
訪(fǎng)問(wèn)官網(wǎng):hyper.ai公共數(shù)據(jù)集精選1.LongWriter-6k 長(zhǎng)上下文輸出數(shù)據(jù)集
該數(shù)據(jù)集包含 6k 篇 SFT 數(shù)據(jù),輸出長(zhǎng)度為 2k-32k 字(包括英文和中文),可支持訓(xùn)練 LLM,將其最大輸出窗口大
原文鏈接:突破萬(wàn)字長(zhǎng)文輸出瓶頸!清華大學(xué)開(kāi)源 LongWriter-6k 數(shù)據(jù)集;7 個(gè) CCF A 類(lèi)頂會(huì)即將截稿
聯(lián)系作者
文章來(lái)源:HyperAI超神經(jīng)
作者微信:
作者簡(jiǎn)介: