GLM-4.7 – 智譜推出的旗艦AI模型,Coding能力再提升
智譜AI最新推出的開源模型GLM-4.7,以其在編碼、推理及工具協(xié)同方面的卓越表現(xiàn),為開發(fā)者帶來了前所未有的高效智能編程體驗(yàn)。這款模型不僅在多語言編程和復(fù)雜任務(wù)規(guī)劃領(lǐng)域大放異彩,更在前端設(shè)計(jì)的視覺美學(xué)上實(shí)現(xiàn)了突破,同時(shí)兼容多種主流編程框架,如Claude Code等,展現(xiàn)出強(qiáng)大的通用性。
GLM-4.7:一款革新性的開源模型
GLM-4.7是智譜AI精心打造的一款開源模型,其核心優(yōu)勢(shì)在于全面提升了模型的編碼能力、邏輯推理能力以及與各類工具協(xié)同工作的效能。在實(shí)際應(yīng)用中,GLM-4.7在多語言編程、精細(xì)化任務(wù)規(guī)劃以及前端界面設(shè)計(jì)的美學(xué)感知等方面均有突出表現(xiàn)。值得一提的是,該模型能夠無縫支持諸如Claude Code在內(nèi)的廣泛編程框架。經(jīng)過一系列嚴(yán)苛的基準(zhǔn)測試,GLM-4.7在代碼生成方面的能力已達(dá)到開源模型中的領(lǐng)先水平,其推理能力更是得到了顯著的強(qiáng)化。為了應(yīng)對(duì)復(fù)雜任務(wù)的挑戰(zhàn),GLM-4.7引入了創(chuàng)新的交錯(cuò)式、保留式以及輪級(jí)思考模式,從而確保了復(fù)雜任務(wù)的執(zhí)行過程更加穩(wěn)定且易于掌控。目前,用戶可以通過BigModel提供的API服務(wù)便捷地調(diào)用GLM-4.7,同時(shí),該模型已集成至z.ai的全棧開發(fā)模式中的Skills模塊,為廣大開發(fā)者提供了高效、智能的編程利器。
GLM-4.7的核心能力亮點(diǎn)
- 精湛的編碼技藝:GLM-4.7在處理多語言編程及終端操作任務(wù)時(shí)展現(xiàn)出非凡的實(shí)力,其“先思考,后行動(dòng)”的策略極大提升了復(fù)雜任務(wù)的穩(wěn)定性和產(chǎn)出代碼的質(zhì)量。
- 優(yōu)化前端設(shè)計(jì)體驗(yàn):該模型能夠生成更具現(xiàn)代感和視覺吸引力的網(wǎng)頁及演示文稿,顯著提升用戶界面設(shè)計(jì)的品質(zhì),并大幅縮減開發(fā)者在樣式調(diào)優(yōu)上耗費(fèi)的時(shí)間。
- 卓越的工具調(diào)用能力:在涉及工具調(diào)用和網(wǎng)頁瀏覽的任務(wù)中,GLM-4.7表現(xiàn)優(yōu)異,例如在τ2-Bench測試中斬獲87.4%的高分,在BrowseComp測試中獲得67.5分,其效率和準(zhǔn)確性均有質(zhì)的飛躍。
- 強(qiáng)大的復(fù)雜推理能力:GLM-4.7在數(shù)算和邏輯推理方面的能力得到顯著增強(qiáng)。在HLE基準(zhǔn)測試中,得分達(dá)到42.8%,較前代模型提升了12.4個(gè)百分點(diǎn),能夠從容應(yīng)對(duì)復(fù)雜的邏輯推演和數(shù)學(xué)難題。
- 精進(jìn)的思考模式:通過引入交錯(cuò)式、保留式和輪級(jí)思考模式,GLM-4.7極大地增強(qiáng)了復(fù)雜任務(wù)執(zhí)行的穩(wěn)定性和可控性,尤其適合處理需要深度思考的長程任務(wù)和多輪交互場景。
- 多模態(tài)融合與全棧開發(fā)支持:GLM-4.7具備處理多模態(tài)任務(wù)協(xié)同的能力,并積極支持全棧開發(fā)。集成Skills模塊,助力開發(fā)者構(gòu)建功能豐富、用戶體驗(yàn)流暢的應(yīng)用。
GLM-4.7的性能飛躍一覽
- 編碼實(shí)力(Core Coding):
- SWE-bench Verified:得分73.8%,相較于GLM-4.6,提升了5.8個(gè)百分點(diǎn),已達(dá)到開源模型中的頂尖水平(SOTA)。
- SWE-bench Multilingual:得分66.7%,較GLM-4.6大幅躍升12.9個(gè)百分點(diǎn),多語言編程能力顯著增強(qiáng)。
- Terminal Bench 2.0:得分41%,較GLM-4.6大幅提升16.5個(gè)百分點(diǎn),終端操作任務(wù)性能表現(xiàn)優(yōu)異。
- 工具調(diào)用表現(xiàn)(Tool Using):
- τ2-Bench:得分87.4%,相較于GLM-4.6,提升了12.2個(gè)百分點(diǎn),交互式工具調(diào)用能力已躋身開源SOTA行列。
- BrowseComp(網(wǎng)頁瀏覽):得分52.0%,較GLM-4.6提升6.9個(gè)百分點(diǎn)。在啟用了上下文管理功能的BrowseComp測試中,得分高達(dá)67.5%,較GLM-4.6提升10.0個(gè)百分點(diǎn),充分展現(xiàn)了其在網(wǎng)頁瀏覽和工具鏈管理方面的卓越表現(xiàn)。
- 復(fù)雜推理能力(Complex Reasoning):
- HLE(人類最后的考試):得分42.8%,相較于GLM-4.6,提升了12.4個(gè)百分點(diǎn),數(shù)學(xué)與邏輯推理能力得到顯著加強(qiáng)。
- MMLU-Pro:得分84.3%,較GLM-4.6略有提升1.1個(gè)百分點(diǎn),在多領(lǐng)域推理方面保持了穩(wěn)定的高水平。
- GPQA-Diamond:得分85.7%,較GLM-4.6提升4.7個(gè)百分點(diǎn),推理的準(zhǔn)確性進(jìn)一步得到鞏固和提升。
GLM-4.7的探索之路
- 項(xiàng)目官網(wǎng):https://z.ai/blog/glm-4.7
- GitHub倉庫:https://github.com/zai-org/GLM-4.5
- HuggingFace模型庫:https://huggingface.co/zai-org/GLM-4.7
GLM-4.7的廣闊應(yīng)用前景
- 軟件開發(fā)與編程領(lǐng)域:GLM-4.7能夠生成高質(zhì)量的多語言代碼,作為智能編程助手,極大地提升開發(fā)人員的工作效率。
- 前端設(shè)計(jì)與用戶體驗(yàn)優(yōu)化:在網(wǎng)頁設(shè)計(jì)和UI/UX領(lǐng)域,GLM-4.7能夠迅速產(chǎn)出符合現(xiàn)代審美趨勢(shì)的布局和色彩方案,顯著減輕前端開發(fā)者和設(shè)計(jì)師在樣式調(diào)整上的壓力。
- 復(fù)雜任務(wù)的規(guī)劃與執(zhí)行:憑借其先進(jìn)的保留式思考和輪級(jí)思考模式,GLM-4.7能夠勝任多步驟的復(fù)雜任務(wù),確保長程任務(wù)的精準(zhǔn)度和穩(wěn)定性。
- 教育與知識(shí)傳播:GLM-4.7可以為編程教學(xué)提供豐富的代碼范例和練習(xí),同時(shí)通過其在數(shù)學(xué)和邏輯問題上的訓(xùn)練能力,幫助學(xué)生鍛煉思維能力。
- 辦公自動(dòng)化革新:GLM-4.7能夠自動(dòng)化文檔撰寫、報(bào)告生成以及數(shù)據(jù)分析代碼的編寫,從而減少人工操作和排版的時(shí)間,全面提升辦公效率。

粵公網(wǎng)安備 44011502001135號(hào)