Yi-Lightning 是零一萬(wàn)物公司最新推出的旗艦人工智能模型,憑借出色的性能在國(guó)際權(quán)威盲測(cè)榜單 LMSYS 上取得了顯著成績(jī),打破了硅谷 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet 的壟斷,獲得世界第六、中國(guó)第一的佳績(jī)。這一突破昭示著中國(guó)在人工智能領(lǐng)域的實(shí)力與進(jìn)步,標(biāo)志著大模型技術(shù)的新高度。
Yi-Lightning是什么
Yi-Lightning 是零一萬(wàn)物公司最新發(fā)布的旗艦?zāi)P停瑧{借其卓越的性能在國(guó)際權(quán)威盲測(cè)榜單 LMSYS 上取得了顯著的成績(jī),超越了知名的 OpenAI GPT-4o 和 Anthropic Claude 3.5 Sonnet,躋身世界第六、中國(guó)首位。這一成就不僅展示了中國(guó)在人工智能領(lǐng)域的技術(shù)突破,同時(shí)也彰顯了國(guó)內(nèi)大模型實(shí)力的崛起。
在多個(gè)分類榜單中,Yi-Lightning 也展現(xiàn)了不俗的表現(xiàn)。在中文分榜上,該模型成功超越了其他國(guó)內(nèi)外優(yōu)秀模型,與 o1-mini 等并列排名世界第二。在多輪對(duì)話、數(shù)學(xué)和代碼分榜上,Yi-Lightning 分別位列第三和第四,顯示出其在各類任務(wù)中的綜合能力。
在推理速度和成本方面,Yi-Lightning 也實(shí)現(xiàn)了性的進(jìn)步。與前代旗艦?zāi)P?Yi-Large 相比,其最高生成速度提升了近40%,首包時(shí)間縮短至一半。推理成本方面,每百萬(wàn) token 的費(fèi)用僅為0.99元,接近行業(yè)最低水平。
Yi-Lightning的主要功能
- 推理速度與成本優(yōu)化:Yi-Lightning 相較于前代模型 Yi-Large 在推理速度上有顯著提升,最高生成速度提高近40%。推理成本也大幅降低,每百萬(wàn) token 的費(fèi)用僅為0.99元。
- AI 2.0 數(shù)字人解決方案:基于 Yi-Lightning 模型,零一萬(wàn)物推出了 AI 2.0 數(shù)字人解決方案,專注于零售與電商場(chǎng)景。該方案包括角色大模型、直播語(yǔ)音大模型及電商話術(shù)大模型,具備動(dòng)作訓(xùn)練、表情生成、多語(yǔ)言及情感表達(dá)、智能對(duì)話等多項(xiàng)功能。某酒旅企業(yè)接入后,GMV 較之前上漲了170%。
- 全行業(yè)解決方案:Yi-Lightning 模型已在零一萬(wàn)物的全行業(yè)解決方案中得到應(yīng)用,結(jié)合 RAG、Function Calling 等實(shí)用工具,廣泛應(yīng)用于零售、醫(yī)療、教育及物流等領(lǐng)域,涵蓋 AI 搜索、AI 生產(chǎn)力工具、AI 智能巡檢等多種場(chǎng)景。
- 創(chuàng)新模型架構(gòu):Yi-Lightning 采用 Mixture of Experts(MoE)混合專家模型架構(gòu),引入混合注意力機(jī)制與動(dòng)態(tài) Top-P 路由機(jī)制,使得模型訓(xùn)練更加高效、快速、低成本。
- 極速推理能力:借助動(dòng)態(tài) Top-P 路由機(jī)制,Yi-Lightning 能夠根據(jù)任務(wù)難度自動(dòng)選擇最優(yōu)的專家網(wǎng)絡(luò)組合,實(shí)現(xiàn)高效推理。
- 多階段訓(xùn)練模式:Yi-Lightning 的訓(xùn)練采用多階段模式,前期專注于數(shù)據(jù)多樣性,后期則側(cè)重于知識(shí)的深度與廣度,確保訓(xùn)練速度與穩(wěn)定性。
Yi-Lightning的技術(shù)原理
- MoE混合專家模型架構(gòu):Yi-Lightning 采用 Mixture of Experts(MoE)架構(gòu),通過(guò)多個(gè)專家網(wǎng)絡(luò)處理不同任務(wù),能夠根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)選擇激活的專家,從而在推理和性能之間實(shí)現(xiàn)平衡。
- 混合注意力機(jī)制:優(yōu)化后的混合注意力機(jī)制在部分層中將全注意力替換為滑動(dòng)窗口注意力,降低計(jì)算成本,同時(shí)保持對(duì)長(zhǎng)序列數(shù)據(jù)的高效處理能力。
- 跨層注意力機(jī)制(CLA):引入的跨層注意力機(jī)制支持模型在不同層級(jí)之間共享鍵(Key)和值(Value)頭,減少存儲(chǔ)需求,提高推理效率。
- 動(dòng)態(tài) Top-P 路由機(jī)制:Yi-Lightning 能夠根據(jù)任務(wù)難度自動(dòng)選擇最適合的專家網(wǎng)絡(luò)組合,無(wú)需人工干預(yù),從而實(shí)現(xiàn)快速反應(yīng)。
Yi-Lightning的項(xiàng)目地址
- 項(xiàng)目官網(wǎng):platform.lingyiwanwu.com
Yi-Lightning的應(yīng)用場(chǎng)景
- 翻譯領(lǐng)域:Yi-Lightning 在翻譯領(lǐng)域表現(xiàn)優(yōu)異,能夠處理語(yǔ)言理解、生成與跨語(yǔ)言能力,提供高質(zhì)量的翻譯服務(wù),且用詞精準(zhǔn),具有文學(xué)色彩。
- 零售電商直播:基于 Yi-Lightning 的 AI 2.0 數(shù)字人方案在零售和電商直播中實(shí)現(xiàn)了彈幕互動(dòng)、商品信息提取和實(shí)時(shí)話術(shù)生成,提升了數(shù)字人的互動(dòng)效果與流暢度。
- 企業(yè)解決方案:Yi-Lightning 被應(yīng)用于零一萬(wàn)物的企業(yè)級(jí)解決方案中,為企業(yè)提供定制化的 AI 服務(wù),助力效率和營(yíng)收提升。
- 多語(yǔ)言處理:在中文分榜中,Yi-Lightning 顯示出強(qiáng)大的中文處理能力,毫不遜色于國(guó)際頂尖模型。
- 數(shù)學(xué)與代碼生成:在數(shù)學(xué)和代碼的分榜上,Yi-Lightning 分別獲得第三、第四名,展現(xiàn)了其在這些領(lǐng)域的強(qiáng)大能力。
- 處理復(fù)雜問(wèn)題:Yi-Lightning 在長(zhǎng)提問(wèn)和復(fù)雜問(wèn)題的處理上表現(xiàn)出色,均取得世界第四的優(yōu)異成績(jī),證明了其解決復(fù)雜問(wèn)題的能力。