思路打開!騰訊造了10億個角色,驅(qū)動數(shù)據(jù)合成!7B模型效果打爆了
AIGC動態(tài)歡迎閱讀
原標(biāo)題:思路打開!騰訊造了10億個角色,驅(qū)動數(shù)據(jù)合成!7B模型效果打爆了
關(guān)鍵字:角色,數(shù)據(jù),騰訊,問題,文本
文章來源:夕小瑤科技說
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
夕小瑤科技說 原創(chuàng)作者 | 謝年年世界由形形的角色構(gòu)成,每個角色都擁有獨(dú)特的知識、經(jīng)驗(yàn)、興趣、個性和職業(yè),他們共同制造了豐富多元的知識與文化。
所謂術(shù)業(yè)有專攻,比如AI科學(xué)家專注于構(gòu)建LLMs,醫(yī)務(wù)工作者們共建龐大的醫(yī)學(xué)知識庫,數(shù)學(xué)家們則偏愛數(shù)學(xué)公式與定理推導(dǎo)。
LLMs中也是如此,不同的知識是由不同的人類角色創(chuàng)建或者使用。因此在提示中加入角色描述如“你是一個xxx的計(jì)算機(jī)科學(xué)家”會極大提高模型響應(yīng)準(zhǔn)確度。
這一思路也可以用于構(gòu)建合成數(shù)據(jù)。騰訊AI lab提出了一種新穎的(基于角色驅(qū)動的數(shù)據(jù)合成方法。即只需在數(shù)據(jù)合成提示中添加角色描述,就能引導(dǎo)LLM朝著相應(yīng)的視角生成獨(dú)特的合成數(shù)據(jù)。
由于幾乎任何LLM的應(yīng)用場景都可以關(guān)聯(lián)到特定的人格,只要構(gòu)建一個全面的角色集合,就能實(shí)現(xiàn)大規(guī)模的全方位合成數(shù)據(jù)生成。為此作者構(gòu)建了10億個角色,創(chuàng)建了Persona Hub(角色倉庫),里面包含“搬家公司的司機(jī)”、“化學(xué)動力學(xué)研究員”、“對音頻處理感興趣的音樂家”等多樣化的角色。并在大規(guī)模數(shù)學(xué)和邏輯推理問題生成、指令生成、知識豐富的文本生成、游戲NPC以及工具(功能)開發(fā)等場景中創(chuàng)建豐富且多樣化的合成
原文鏈接:思路打開!騰訊造了10億個角色,驅(qū)動數(shù)據(jù)合成!7B模型效果打爆了
聯(lián)系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業(yè)、有趣、深度價(jià)值導(dǎo)向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內(nèi)外機(jī)構(gòu)投資人,互聯(lián)網(wǎng)大廠中高管和AI公司創(chuàng)始人。一線作者來自清北、國內(nèi)外頂級AI實(shí)驗(yàn)室和大廠,兼?zhèn)涿翡J的行業(yè)嗅覺和洞察深度。商務(wù)合作:zym5189