永遠可以對OpenAI保持失望。
原標題:GPT4.5發布,價格是DeepSeek的280倍,他們是真沒活了。
文章來源:大數據文摘
內容字數:3852字
OpenAI GPT-4.5發布:高價低能,令人失望?
本文總結了大數據文摘轉載自數字生命卡茲克的文章,對OpenAI最新發布的GPT-4.5模型進行了評價,指出其在價格、性能以及與競爭對手相比的不足之處。
1. 發布會及參數:低調發布,數據存疑
與GPT-4發布時的驚艷不同,GPT-4.5的發布會低調而簡樸,缺乏令人印象深刻的演示。文章列出了GPT-4.5、GPT-4o以及o3-mini(high)在AIME 2024基準測試中的得分,并指出GPT-4o的得分與之前公布的數據存在差異,引發了作者的質疑。
2. 性能表現:世界知識準確度提升,但其他方面表現
在世界知識方面,GPT-4.5的準確度和降低幻覺率有所提升,尤其在處理“人類第一種語言是什么”這類問題時,表現出更謹慎的態度。然而,在代碼能力方面,GPT-4.5并未展現出顯著優勢,與Claude 3.7等模型相比仍有差距。在一些邏輯推理問題上,GPT-4.5的表現甚至不如GPT-4o。
3. 價格昂貴:性價比極低,遠超競爭對手
GPT-4.5最令人詬病的是其高昂的價格。百萬輸入75美元,百萬輸出150美元,遠高于Claude 3.7以及DeepSeek v3等競爭對手,性價比極低。作者對此表示難以理解。
4. 功能及體驗:部分功能缺失,存在BUG
GPT-4.5雖然支持識圖、搜索和畫布等功能,但缺少GPT-4o的語音、視頻和共享屏幕等功能。此外,文章還指出,GPT-4.5存在一些BUG,例如在回答史實問題時開啟搜索功能。
5. 情商提升,但智商下降?
文章提到,GPT-4.5在情商方面有所提升,能夠更好地處理一些涉及情感表達的場景。然而,在一些邏輯推理問題上,其表現卻不如GPT-4o,似乎是“情商高,智商低”的體現。
6. 寫作能力:速度緩慢,效果不佳
在寫作能力測試中,GPT-4.5的表現并未達到預期,速度緩慢,效果也遜色于GPT-4o以及其他競爭對手。
7. 總結與展望:OpenAI疲態盡顯,未來挑戰巨大
文章總結道,OpenAI GPT-4.5的發布令人失望,其高昂的價格與平庸的性能表現形成鮮明對比。作者認為OpenAI需要改進,并指出AI領域競爭激烈,只有不斷提升自身實力,才能在市場中立于不敗之地。 OpenAI CEO奧特曼表示GPT-4.5是最后一個基座模型,未來將轉向混合模型,這預示著OpenAI未來的發展方向。
聯系作者
文章來源:大數據文摘
作者微信:
作者簡介:普及數據思維,傳播數據文化