大數據文摘受權轉載自夕小瑤科技說家人們!OpenAI o1 滿血版(o1 Pro)大家用上了嗎!作為 OpenAI 的 12 天直播計劃的首位登場重量嘉賓,o1 滿血版本,可以說是遙遙領先!在代碼和數學領域遠超 o1-preview!而且,o1 Pro 思考速度也比 o1-preview 快 50%,效率提高 34%。最重要的是,o1 和 o1 pro 上還帶上了視覺功能,上傳圖片就能做視覺推理里。滿血版o1和o1 Pro來啦!200美元/月無限使用!OpenAI第一天就放了王炸!總而言之,確實值得 OpenAI 拿出來作為首秀 ~而 o1 滿血版上線僅僅兩天,網友們已經壓榨它壓榨的灰常到位!!已經玩出花了 hh,奶茶帶大家一起看看網友們的花活 ~01 從截圖還原復現網站網友為了測試代碼生成能力,截取了一個網站的屏幕截圖,讓流行的幾個大語言模型根據網頁截圖寫代碼復現網站 ~讓我們看看各家的表現!o1 普通版:嗯 ~ 中規中矩,整體表現還不錯!最新版本的 Gemini-1206:明顯實現的功能更多了!o1 滿血版原圖網友沒放出來,奶茶去網上找了下,原圖大概是醬個樣子:雖然都不是很像啊 hh 但是 o1 Pro 明顯完成了更多的功能 ~02 o1 pro + midjourney + bolt.new 開發游戲網友嘗試探索一種新的創作流程:首先,他們利用 Midjourney 生成圖片中的人物和場景。接著,在 Photoshop 中進行微調,去除背景并擴展場景背景,為了適應游戲關卡的需求。此外,他們從 Artlist 中精選游戲音效和音樂,以增強游戲體驗。最后,他們使用一系列精心挑選的提示詞,引導 o1 生成一個完整的游戲。提示詞如圖所示:接著,網友們采用 StackBlitz/Bolt 作為開發環境,成功生成了游戲。如視頻中所展示:03 做奧林匹克數學競賽中最難的題目網友又讓 o1Pro 去做奧賽題!如下圖所示,o1 Pro 僅用時 6 分 48 秒就成功解答了 2006 年國際數學奧林匹克競賽(IMO)的第三題——當年公認難度最高的題目。2006 年全球約 500 名 19 歲以下的頂尖數學學生中,僅有 28 人能夠完全解答此題……他們擁有 4 個半小時的時間來攻克……而 6 名美國隊成員中無一人能夠解決這個問題……網友們嘗試使用其他所有模型(包括 o1)來解決這個問題,結果 o1 Pro 是唯一一個大語言模型給出了正確答案。04 搞定數學教授認為解不了的數獨謎題大家會做數獨嗎!先給大家上一道題嘗嘗咸淡!嘶,奶茶嘗試做了下,根本不會啊。。網友讓 o1-Pro 來幫忙解決!雖然解題時出了點小差錯,但它能自己調整過來。在處理第五行的時候,它通過排除 R5C7=1,巧妙地解決了第七列的沖突,這一步可能是找到答案的關鍵。整個過程用了 5 分半鐘,最后 o1-Pro 成功解開了數獨謎題。這位網友還提到,之前數學教授曾經和他說,Transformer 這類的大模型是不是可能解決數獨謎題的。。。那 o1 Pro 的表現是不是 piapia 打臉了但是,也有人認為并沒有打臉,即使大語言模型解開了數獨,但是他們做出來的,永遠都不是真的“會做”。05 根據流程圖生成代碼o1-Pro 不是新增了圖像輸入功能嘛 ~網友們發現只需上傳一張流程圖,即可請求生成構建該流程圖的高質量代碼。如下圖所示,上傳一個特別潦草的流程圖:o1 Pro 給生成了對應的代碼,雖然生成的代碼可能不是完美無缺的,但相較于 4o,它的表現已經有了顯著的提升:06 面向網絡漫畫編程網友們又嘗試,讓 o1 Pro 根據 搞怪漫畫寫代碼!給出以下提示:把這個變成現實。由于我不會編程,所以需要一個圖形界面和清晰的使用說明。這意味著你需要給我一個完整可用的軟件 。o1 Pro 用了不到 15 分鐘就完成了,而且沒有陷入任何常見的大語言模型循環。07 解決當日報紙發的文字聯接題紐約時報每日都會發布一個 Connections 謎題,這個謎題是一個基于文字關聯的益智游戲,其核心玩法是:玩家面前會有 16 個詞語(通常是英文詞),這 16 個詞看似雜亂無章,但其中暗藏 4 組關聯,每組由 4 個有共同點的詞語組成。例如,一組 4 個詞可能都與某種類型有關,另一組 4 個詞可能都和特定的電影類型相關,或共通的主題可能是食物類別、歷史、著名人物姓名、品牌名或日常物品等等。玩家需要透過審視與思考,找出這 4 個隱形群組。昨天的每日謎題是這樣的:o1 Pro 竟然在 14 秒內正確完成了這個謎題!08 解決復雜計算問題網友對 o1 Pro 的復雜問題解決能力進行了測試,他們提出了一個挑戰:計算表達式 (x – 14)^10,其中 x 代表答案中的元音字母數量。o1 Pro 很爭氣!!!那沒有對比,就沒有傷害,咱看看其他的大模型!嘶,這哥倆直接算迷糊了:GPT-4 最離譜!我用腳指頭算也知道不是 0!四舍五入 GPT-4 不如我的腳指頭而原來的 o1 確實算得又慢又錯很大!09 制作百戰天蟲網友們再次向 o1 Pro 發起挑戰,要求它制作一款類似《百戰天蟲》的游戲。不負眾望,o1 Pro 成功地完成了這項任務!!10 更強的寫作能力網友們還發現,o1 Pro 在掌握需要深度推理的寫作風格方面表現出驚人的能力——不僅僅是邏輯論證(例如:辯論海事習俗如何可能使現代貿易法規失效),還包括在詩歌、歌詞、雙關語、笑話和劇本中把握節奏和韻律。這是一首歌的歌詞。仔細思考其中隱藏的模式,然后寫出兩個在模式上完全一致的新詩節。之后解釋為什么這些新詩節符合原有模式。結語雖然網友們“方方面面”地驗證了 o1 Pro 強大的進步!氮素,奶茶還發現了 o1 Pro 不少翻車的例子 hh!比如:現在幾點了?o1 雖然會算數,但是不會讀表哈哈哈!大家用 o1 Pro 怎么樣,歡迎評論區和我們一起討論 ~參考文獻[1]https://x.com/dr_cintas/status/1865461386031120740租售GPU算力租:4090/A800/H800/H100售:現貨H100/H800特別適合企業級應用掃碼了解詳情?點「在看」的人都變好看了哦!
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
暫無評論...