價格只有Deepseek V3九分之一 ,天生多模態。Deepseek 要淪為牛夫人了
原標題:Gemini 2.0霸榜,價格卷哭DeepSeek V3,性價比新王誕生!
文章來源:夕小瑤科技說
內容字數:3952字
谷歌Gemini 2.0家族強勢來襲,霸榜LMSYS!
谷歌近日重磅發布Gemini 2.0家族三款新模型:Gemini 2.0 Pro、Gemini 2.0 Flash和Gemini 2.0 Flash-Lite,并在LMSYS排行榜上取得驕人成績,Gemini 2.0 Pro更是榮登榜首,家族成員均躋身前十。
1. 三款模型性能亮點
此次發布的三款模型各有側重,滿足不同需求:
- Gemini 2.0 Pro (Experimental): 作為旗艦模型,Pro版本在編碼和推理方面表現卓越,支持高達2M tokens的上下文窗口,深度整合Google搜索和代碼執行功能。目前已在Google AI Studio、Vertex AI和Gemini Advanced平臺上線。
- Gemini 2.0 Flash: 定位為“高效主力模型”,兼顧速度和性能,適合低延遲應用場景。支持1M tokens上下文窗口,擁有優秀的多模態推理能力,并即將推出圖像生成和文本轉語音功能。已在Vertex AI Studio和Google AI Studio平臺正式發布。
- Gemini 2.0 Flash-Lite (Preview): 主打高性價比,在速度、成本和性能之間取得平衡。與1.5 Flash相比,在相同速度和成本下,多數基準測試中表現更佳,同樣支持1M tokens上下文窗口。
Gemini 2.0 Pro在幾乎所有基準測試中均獲得最高分,尤其在代碼生成和復雜數學問題上表現突出,長文檔理解能力也顯著提升。
2. 令人驚喜的定價策略
谷歌Gemini 2.0 Flash的百萬Token輸入價格低于1美元,展現出極高的性價比。相比之下,Deepseek V3的百萬輸入價格為1美元,R1推理價格為4美元。這表明谷歌在定價策略上具有顯著優勢,也體現了其對AI普惠的承諾。
3. 實際應用案例測試
網友們對Gemini 2.0進行了實際測試,結果顯示:
- 在基于物理引擎的彈球游戲中,Gemini 2.0 Pro的表現與o3 mini不相上下,但Flash和Flash-Lite版本表現欠佳。
- 在處理100個小球的復雜彈跳場景中,Gemini 2.0的表現令人滿意。
- 在經典的“草莓”問題中,Gemini 2.0 Pro意外答錯,而Flash Thinking Experimental則答對,凸顯了不同模型在特定任務上的差異。
Google DeepMind首席科學家Jeff Dean親自測試了Gemini 2.0 Pro的編程能力,成功在18.9秒內完成了Boggle游戲代碼編寫。
4. 谷歌AI戰略布局
Google DeepMind CEO對Gemini 2.0的更新充滿信心,認為此次發布為未來智能體奠定了基礎。谷歌CEO皮查伊也曾表示2025年將是谷歌AI加速發展的關鍵時期。Gemini 2.0家族的多版本選擇策略,如同一個AI工具箱,滿足不同用戶的需求,展現了谷歌在AI領域實用性至上的戰略布局。
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:低負擔解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189