不要自回歸!擴(kuò)散模型作者創(chuàng)業(yè),首個(gè)商業(yè)級(jí)擴(kuò)散LLM來(lái)了,編程秒出結(jié)果
趕緊用起來(lái)吧。

原標(biāo)題:不要自回歸!擴(kuò)散模型作者創(chuàng)業(yè),首個(gè)商業(yè)級(jí)擴(kuò)散LLM來(lái)了,編程秒出結(jié)果
文章來(lái)源:機(jī)器之心
內(nèi)容字?jǐn)?shù):5171字
Inception Labs發(fā)布首個(gè)商業(yè)級(jí)擴(kuò)散大型語(yǔ)言模型Mercury
本文總結(jié)了機(jī)器之心報(bào)道的Inception Labs發(fā)布的商業(yè)級(jí)擴(kuò)散大型語(yǔ)言模型Mercury (dLLM) 的主要信息。該模型在速度和性能上均展現(xiàn)出顯著優(yōu)勢(shì),有望革新大型語(yǔ)言模型的應(yīng)用范式。
1. Mercury:速度與性能兼?zhèn)涞膁LLM
當(dāng)前,Transformer和擴(kuò)散模型是AI領(lǐng)域最熱門(mén)的模型架構(gòu)。Inception Labs推出的Mercury,是首個(gè)商業(yè)級(jí)擴(kuò)散大型語(yǔ)言模型,它結(jié)合了兩種架構(gòu)的優(yōu)勢(shì),在NVIDIA H100上實(shí)現(xiàn)了每秒超過(guò)1000 token的處理速度,性能與現(xiàn)有經(jīng)過(guò)速度優(yōu)化的LLM相當(dāng)甚至超越。這比一些前沿模型的速度快了20倍以上,以往只有專(zhuān)用硬件才能達(dá)到如此高的吞吐量。
2. 擴(kuò)散模型的優(yōu)勢(shì)與突破
不同于傳統(tǒng)的自回歸LLM從左到右逐個(gè)生成token,擴(kuò)散模型一次性預(yù)測(cè)所有方向,從噪聲開(kāi)始逐步去噪生成token流。雖然過(guò)去研究認(rèn)為自回歸更適合文本,但Mercury證明了擴(kuò)散模型在文本模態(tài)上的巨大潛力。其“從粗到細(xì)”的生成方式,使其在推理、結(jié)構(gòu)化響應(yīng)、糾錯(cuò)和減少幻覺(jué)方面表現(xiàn)更好。
3. Mercury Coder:代碼生成領(lǐng)域的佼佼者
Mercury Coder是Inception Labs發(fā)布的第一個(gè)面向公眾的dLLM。在標(biāo)準(zhǔn)編碼基準(zhǔn)測(cè)試中,它超越了GPT-4o Mini和Claude 3.5 Haiku等為速度優(yōu)化的自回歸模型,速度提升高達(dá)10倍。在Copilot Arena的基準(zhǔn)測(cè)試中,Mercury Coder Mini的性能甚至超過(guò)了GPT-4o等更大的模型,并且速度是GPT-4o Mini的4倍。
4. 高效的并行生成機(jī)制
Mercury利用GPU的并行生成機(jī)制,顯著提高了效率,降低了推理成本(高達(dá)10倍)。這意味著在相同的硬件上,可以為更多用戶(hù)提供服務(wù),降低了運(yùn)營(yíng)成本。
5. 廣泛的應(yīng)用前景
Mercury Coder支持多種用例,包括RAG(檢索增強(qiáng)生成)、工具使用和智能體工作流。目前已上線(xiàn)公開(kāi)試用,Inception Labs也為企業(yè)用戶(hù)提供API和內(nèi)部部署服務(wù)。
6. 行業(yè)影響與未來(lái)展望
著名AI研究科學(xué)家Andrej Karpathy高度評(píng)價(jià)了Mercury的意義,認(rèn)為它進(jìn)一步證明了擴(kuò)散模型在文本模態(tài)上的潛力。Inception Labs的成功,標(biāo)志著擴(kuò)散模型在大型語(yǔ)言模型領(lǐng)域的重大突破,為下一代LLM的發(fā)展指明了方向。
總而言之,Mercury的出現(xiàn)標(biāo)志著擴(kuò)散模型在大型語(yǔ)言模型領(lǐng)域的重大突破,其卓越的速度和性能優(yōu)勢(shì),為L(zhǎng)LM的應(yīng)用帶來(lái)了新的可能性,也預(yù)示著未來(lái)LLM發(fā)展的新方向。
聯(lián)系作者
文章來(lái)源:機(jī)器之心
作者微信:
作者簡(jiǎn)介:專(zhuān)業(yè)的人工智能媒體和產(chǎn)業(yè)服務(wù)平臺(tái)

粵公網(wǎng)安備 44011502001135號(hào)