AIGC動態歡迎閱讀
內容摘要:
昆侖萬維 投稿量子位 | 公眾號 QbitAIQ*項目公開發布,可讓小模型達到參數量比其大數十倍、甚至上百倍模型的推理能力。
自去年11月伴隨著OpenAI內訌,其神秘Q*項目被爆出后,業內對OpenAI Q*的討論和猜測就沒停過,而OpenAI這邊一直避而不談。
在當時,一些人就從名字猜測Q*可能與Q-Learning有關,例如Meta科學家田淵棟提出Q*可能是Q-learning和A*的結合:
而現在,一項名為Q*的項目突然公開發布,而且真的和Q-Learning、A*有關。
不過,研究團隊并非OpenAI,更不是DeepMind(相傳,OpenAI的Q*項目前身是GPT-Zero,由Ilya Sutskever發起,名字致敬了DeepMind的Alpha-Zero)。
而是來自國內昆侖萬維顏水成團隊與新加坡南洋理工大學的一項新工作。
團隊表示,希望Q*算法能夠打破OpenAI的,提升現有開源模型的推理能力。實驗中,Q*算法的表現也很給力:
在GSM8K數據集上,Q*幫助Llama-2-7b提升至80.8%的準確率,超越了ChatGPT;
在MATH數據集上,Q*幫助DeepS
聯系作者
文章來源:量子位
作者微信:QbitAI
作者簡介:追蹤人工智能新趨勢,關注科技行業新突破
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...