GPT-4.1 – OpenAI 推出新一代語言模型,支持百萬 token 上下文
GPT-4.1 是 OpenAI 最新發布的一款先進語言模型,分為 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三個版本。這些模型在編碼能力、指令遵循和長文本處理等方面都有顯著提升,具備高達 100 萬個 token 的上下文窗口,能夠更高效地處理復雜的文本和代碼。
GPT-4.1是什么
GPT-4.1 是 OpenAI 推出的新一代語言模型,包含三個版本:GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。該系列模型在編碼能力、遵循指令和處理長文本方面表現出色,支持高達 100 萬個 token 的上下文窗口。在多項基準測試中,GPT-4.1 的表現尤為突出,例如,在 SWE-bench Verified 測試中,得分達到了 54.6%,比前一版本 GPT-4o 提高了 21.4 個百分點。此外,GPT-4.1 系列模型的運行成本較低,成為當前速度最快且性價比最高的選擇。該系列模型現已通過 API 向所有開發者開放。
主要功能
- 長上下文處理能力:支持高達 100 萬個 token 的上下文,使得模型能夠處理更為龐大的文本,如整本書籍或大型代碼庫。
- 多模態處理:采用了優化的視覺和文本編碼器,具有交叉注意力機制,能更有效地處理圖文混合內容。
- 代碼生成與優化:在編程任務上展現出色,準確率達到 54.6%,比 GPT-4o 提高了 21.4 個百分點,能夠高效地探索代碼庫并生成測試用例。
- 多語言支持:在多語言編碼能力測試中,性能提升一倍,處理多語言編程任務時更為高效。
- 工具調用效率:在實際應用中,如 Windsurf 的內部編碼基準測試,得分較 GPT-4o 提高了 60%,工具調用效率提升了 30%。
- 復雜指令處理:在指令遵循方面表現卓越,得分較 GPT-4o 提高了 10.5 個百分點。
- 多輪對話能力:在多輪對話中,能夠更好地跟蹤上下文,確保對話的連貫性。
- 超大上下文窗口:支持高達 100 萬個 token 的上下文處理能力,是 GPT-4o 的 8 倍,能處理超長文本。
- 長文本理解:能夠準確定位和提取關鍵信息,在長達 100 萬個 token 的上下文中表現突出。
- 圖像理解:在圖像理解方面,GPT-4.1 mini 的表現常常超越 GPT-4o。
- 視頻內容理解:在 Video-MME 測試中,能理解 30 到 60 分鐘無字幕的視頻,并取得 72% 的成績,達到了當前最佳水平。
- 高性價比:在性能上升的同時,成本更低,GPT-4.1 的中等規模查詢成本比 GPT-4o 低 26%。
- 低延遲與高效率:GPT-4.1 mini 的延遲減少了近一半,成本降低了 83%,適合低延遲任務。
產品官網
應用場景
- 法律領域:在法律文檔審核中,GPT-4.1 的多文檔審查準確率比 GPT-4o 提高了 17%,高效處理復雜法律文件。
- 金融分析:在金融數據分析中,能夠從大型文檔中更準確地提取關鍵信息,為分析師提供全面的數據支持。
- 前端開發:在前端編程方面,能夠生成功能更強大且美觀的網頁應用,生成的網站在 80% 的情況下更受人類評審員青睞。
常見問題
- GPT-4.1的定價是多少?
GPT-4.1 的定價為每百萬輸入標記 2 美元,每百萬輸出標記 8 美元;GPT-4.1 mini 每百萬輸入標記 0.4 美元,每百萬輸出標記 1.6 美元;GPT-4.1 nano 每百萬輸入標記 0.1 美元,每百萬輸出標記 0.4 美元。 - GPT-4.1支持哪些語言?
GPT-4.1 支持多種語言,尤其在多語言編碼能力上表現優異。 - 如何使用GPT-4.1?
開發者可以通過 API 接口訪問 GPT-4.1 系列模型,進行各種應用開發。
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...