GPT4.5發(fā)布,價(jià)格是DeepSeek的280倍,他們是真沒活了。
永遠(yuǎn)可以對(duì)OpenAI保持失望。

原標(biāo)題:GPT4.5發(fā)布,價(jià)格是DeepSeek的280倍,他們是真沒活了。
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):3852字
OpenAI GPT-4.5發(fā)布:高價(jià)低能,令人失望?
本文總結(jié)了大數(shù)據(jù)文摘轉(zhuǎn)載自數(shù)字生命卡茲克的文章,對(duì)OpenAI最新發(fā)布的GPT-4.5模型進(jìn)行了評(píng)價(jià),指出其在價(jià)格、性能以及與競(jìng)爭(zhēng)對(duì)手相比的不足之處。
1. 發(fā)布會(huì)及參數(shù):低調(diào)發(fā)布,數(shù)據(jù)存疑
與GPT-4發(fā)布時(shí)的驚艷不同,GPT-4.5的發(fā)布會(huì)低調(diào)而簡(jiǎn)樸,缺乏令人印象深刻的演示。文章列出了GPT-4.5、GPT-4o以及o3-mini(high)在AIME 2024基準(zhǔn)測(cè)試中的得分,并指出GPT-4o的得分與之前公布的數(shù)據(jù)存在差異,引發(fā)了作者的質(zhì)疑。
2. 性能表現(xiàn):世界知識(shí)準(zhǔn)確度提升,但其他方面表現(xiàn)
在世界知識(shí)方面,GPT-4.5的準(zhǔn)確度和降低幻覺率有所提升,尤其在處理“人類第一種語言是什么”這類問題時(shí),表現(xiàn)出更謹(jǐn)慎的態(tài)度。然而,在代碼能力方面,GPT-4.5并未展現(xiàn)出顯著優(yōu)勢(shì),與Claude 3.7等模型相比仍有差距。在一些邏輯推理問題上,GPT-4.5的表現(xiàn)甚至不如GPT-4o。
3. 價(jià)格昂貴:性價(jià)比極低,遠(yuǎn)超競(jìng)爭(zhēng)對(duì)手
GPT-4.5最令人詬病的是其高昂的價(jià)格。百萬輸入75美元,百萬輸出150美元,遠(yuǎn)高于Claude 3.7以及DeepSeek v3等競(jìng)爭(zhēng)對(duì)手,性價(jià)比極低。作者對(duì)此表示難以理解。
4. 功能及體驗(yàn):部分功能缺失,存在BUG
GPT-4.5雖然支持識(shí)圖、搜索和畫布等功能,但缺少GPT-4o的語音、視頻和共享屏幕等功能。此外,文章還指出,GPT-4.5存在一些BUG,例如在回答史實(shí)問題時(shí)開啟搜索功能。
5. 情商提升,但智商下降?
文章提到,GPT-4.5在情商方面有所提升,能夠更好地處理一些涉及情感表達(dá)的場(chǎng)景。然而,在一些邏輯推理問題上,其表現(xiàn)卻不如GPT-4o,似乎是“情商高,智商低”的體現(xiàn)。
6. 寫作能力:速度緩慢,效果不佳
在寫作能力測(cè)試中,GPT-4.5的表現(xiàn)并未達(dá)到預(yù)期,速度緩慢,效果也遜色于GPT-4o以及其他競(jìng)爭(zhēng)對(duì)手。
7. 總結(jié)與展望:OpenAI疲態(tài)盡顯,未來挑戰(zhàn)巨大
文章總結(jié)道,OpenAI GPT-4.5的發(fā)布令人失望,其高昂的價(jià)格與平庸的性能表現(xiàn)形成鮮明對(duì)比。作者認(rèn)為OpenAI需要改進(jìn),并指出AI領(lǐng)域競(jìng)爭(zhēng)激烈,只有不斷提升自身實(shí)力,才能在市場(chǎng)中立于不敗之地。 OpenAI CEO奧特曼表示GPT-4.5是最后一個(gè)基座模型,未來將轉(zhuǎn)向混合模型,這預(yù)示著OpenAI未來的發(fā)展方向。
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:
作者簡(jiǎn)介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化

粵公網(wǎng)安備 44011502001135號(hào)