金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強? Deepmoney金融大模型魔改方案分享&在線實測
AIGC動態(tài)歡迎閱讀
原標題:金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強? Deepmoney金融大模型魔改方案分享&在線實測
關(guān)鍵字:模型,報告,數(shù)據(jù),金融,領(lǐng)域
文章來源:機器之心
內(nèi)容字數(shù):3014字
內(nèi)容摘要:
在微調(diào)大型模型的過程中,一個常用的策略是“知識蒸餾”,這意味著借助高性能模型,如GPT-4,來優(yōu)化性能較低的開源模型。這種方法背后隱含的哲學(xué)理念與logos中心論相似,把GPT-4等模型視為更接近唯一的邏輯或真理的存在。
雖然這種方法在許多領(lǐng)域已經(jīng)證明了其成功(例如Alpaca/Orca等研究),但其在特定的專業(yè)領(lǐng)域中效果有限,比如金融學(xué)。這是因為通過知識蒸餾得到的模型性能難以超越其原始模型。而像GPT-4這樣的模型,其訓(xùn)練和性能與人類反饋緊密相關(guān)。在一些尖端領(lǐng)域,如金融學(xué)中的有效市場理論與行為金融學(xué)的辯論、古典主義與貨幣主義的爭論等,并不存在所謂的“唯一邏輯”,這限制了模型在這些領(lǐng)域的應(yīng)用。
為了更好地幫助研究人員和投資者作出理性判斷,一個理想的金融領(lǐng)域大模型應(yīng)能理解新聞或數(shù)據(jù),并能夠即時地從主觀和量化兩個角度對進行評估。
制作這樣一個模型是Deepmoney項目研究的目標。
在金融投資領(lǐng)域,研報數(shù)據(jù)在分析和決策過程中起著關(guān)鍵作用。這些報告提供了深入的市場分析、行業(yè)趨勢、公司財務(wù)狀況及投資建議,對金融專業(yè)人士至關(guān)重要。在訓(xùn)練金融模型時,這些數(shù)據(jù)的深度和廣度使其成為理想的訓(xùn)練材
原文鏈接:金融研報數(shù)據(jù)魔改Yi-34B & DeepSeek 67B 誰更強? Deepmoney金融大模型魔改方案分享&在線實測
聯(lián)系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺