三個(gè)大模型組隊(duì)挑戰(zhàn)o1,實(shí)測(cè)360多模型協(xié)作干掉提示詞工程
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:三個(gè)大模型組隊(duì)挑戰(zhàn)o1,實(shí)測(cè)360多模型協(xié)作干掉提示詞工程
關(guān)鍵字:模型,騰訊,報(bào)告,架構(gòu),系統(tǒng)
文章來源:量子位
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
克雷西 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAIOpenAI o1的橫空出世,開啟了大模型演化的新范式——Inference law(推理定律)。
正如英偉達(dá)AI科學(xué)家Jim Fan所說,o1的出現(xiàn)標(biāo)志著大模型研發(fā)者開始把集中在訓(xùn)練階段的投入,開始轉(zhuǎn)移到了推理過程。
Jim還引用了機(jī)器學(xué)習(xí)先驅(qū)Rich Sutton的經(jīng)典文章《苦澀的教訓(xùn)》中的話說,只有兩種技術(shù)可以讓(AI)計(jì)算的潛能無限擴(kuò)展——學(xué)習(xí)和搜索。
而現(xiàn)在,是時(shí)候把目光聚焦在后者了。
在推理側(cè)投入更多資源,模型也就有了更完備的思考過程,投入的增加換來的是質(zhì)的提升。
在國內(nèi),360創(chuàng)始人周鴻祎的理念與之不謀而合,而且360更早就提出了“慢思考”的理念,并在技術(shù)架構(gòu)和產(chǎn)品中都付諸了應(yīng)用。
同時(shí),360還在其AI產(chǎn)品中強(qiáng)調(diào)多模合作,讓來自不同廠商的大模型“抱團(tuán)取暖”,為國內(nèi)模型追趕OpenAI,找到了一條可行的道路。
從o1看大模型“慢思考”雖然o1的具體思考過程始終是OpenAI的至高機(jī)密,但可以肯定的是,思維鏈(Chain of Thought, CoT)在其中扮演了重要角色。
OpenAI在關(guān)于o1的報(bào)告中表示,思維鏈能讓
原文鏈接:三個(gè)大模型組隊(duì)挑戰(zhàn)o1,實(shí)測(cè)360多模型協(xié)作干掉提示詞工程
聯(lián)系作者
文章來源:量子位
作者微信:
作者簡(jiǎn)介: