超強AI代理上線!OpenAI推出“Deep Research”,媲美研究分析師水平?
AI代理更強了
原標題:超強AI代理上線!OpenAI推出“Deep Research”,媲美研究分析師水平?
文章來源:大數(shù)據(jù)文摘
內容字數(shù):5883字
OpenAI發(fā)布ChatGPT深度研究功能:AI代理智商再升級
OpenAI重磅發(fā)布了ChatGPT的全新代理功能——Deep Research(深度研究),引發(fā)業(yè)界廣泛關注。該功能能夠自動查找、分析和綜合數(shù)百個在線資源,在數(shù)十分鐘內生成一份高質量的綜合報告,堪稱“超能力”。
1. 深度研究功能詳解
深度研究由即將面世的OpenAI o3模型驅動,具備強大的推理能力,能夠智能地瀏覽互聯(lián)網(wǎng)上的文本、圖像和PDF文件,并根據(jù)信息進行調整。它旨在幫助從事金融、科學、政策和工程等領域的人員進行深入研究,也適用于需要個性化推薦的消費者。目前,ChatGPT Pro用戶每月可使用100次,Plus和Team用戶以及企業(yè)用戶也將陸續(xù)獲得該功能。
2. 性能表現(xiàn)與測試結果
深度研究在多個基準測試中取得了領先成績,例如在“Humanity’s Last Exam”測試中達到26.6%的準確性新高,并在GAIA基準測試中達到最先進水平。OpenAI展示了其在商業(yè)報告制作、信息檢索、醫(yī)學研究分析、用戶體驗設計和個性化購物推薦等多個領域的應用場景。
3. 效率提升與價值創(chuàng)造
內部評估顯示,深度研究能夠自動化完成數(shù)小時的人工調查工作,其任務通過率與工具調用次數(shù)成正比,并且任務的經(jīng)濟價值與通過率的相關性高于與人類花費時間的關系。Sam Altman表示,深度研究的性價比極高,投入50美分的計算成本,可以創(chuàng)造500美元的價值。
4. 用戶體驗與應用案例
生物醫(yī)學科學家Derya Unutmaz試用后表示,深度研究改變了多個領域的“游戲規(guī)則”,它像一位24/7全天候的專家助手,甚至能勝任專業(yè)醫(yī)生的工作。多倫多大學教授Kevin A. Bryan則展示了深度研究在10分鐘內完成一篇專業(yè)論文的案例,凸顯了其在學術研究中的潛力。
5. 與谷歌Gemini 2.0 Flash對比
與谷歌的類似功能相比,OpenAI的深度研究更注重深入分析和思考,而非單純的信息匯總。它更像是一位見解獨到的研究員,能夠提供更具深度和個性化的研究成果。
6. 局限性與未來展望
深度研究仍處于早期階段,可能存在幻覺或錯誤推斷的情況,但發(fā)生率低于現(xiàn)有ChatGPT模型。OpenAI計劃未來將其與Operator功能結合,實現(xiàn)更復雜的任務執(zhí)行,并擴展其對專業(yè)數(shù)據(jù)源的訪問。
7. OpenAI進軍AI硬件
OpenAI被爆料可能開發(fā)人工智能專用硬件和芯片,Sam Altman暗示這將是一次重大的技術革新,并可能與蘋果前首席設計官喬尼·艾維合作。 OpenAI正在開發(fā)定制芯片以提升AI效率,但原型機可能需要數(shù)年時間才能面世。
總而言之,OpenAI的深度研究功能標志著AI代理能力的顯著提升,它將深刻改變人們獲取和處理信息的方式,并釋放巨大的商業(yè)潛力。 然而,我們也需要關注其潛在的局限性和倫理問題,確保其健康發(fā)展和應用。
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:
作者簡介:普及數(shù)據(jù)思維,傳播數(shù)據(jù)文化