OpenAI緊急直播,ChatGPT瘋狂開掛「深度研究」!10分鐘爆肝萬字現(xiàn)AGI雛形,刷榜人類最后考試
最強o3加持
原標題:OpenAI緊急直播,ChatGPT瘋狂開掛「深度研究」!10分鐘爆肝萬字現(xiàn)AGI雛形,刷榜人類最后考試
文章來源:新智元
內(nèi)容字數(shù):10557字
OpenAI發(fā)布ChatGPT全新功能:Deep Research,賦能復雜研究
OpenAI近期重磅推出ChatGPT的全新功能——Deep Research,這項基于優(yōu)化版o3模型的功能,能夠在幾十分鐘內(nèi)完類專家數(shù)小時才能完成的復雜研究任務,堪稱AGI的雛形。
Deep Research的核心能力
Deep Research的核心在于其強大的互聯(lián)網(wǎng)搜索和推理能力。它可以瀏覽網(wǎng)頁、分析圖片、PDF等多種格式文件,并根據(jù)獲取的信息自主調(diào)整研究計劃,最終生成包含詳細引用和數(shù)據(jù)可視化的報告。這項功能克服了以往模型無法使用工具的限制,實現(xiàn)了對復雜信息的深度挖掘和整合。
Deep Research的應用場景
Deep Research的應用范圍廣泛,涵蓋金融、科學、政策、工程等多個領域。它可以幫助用戶完成市場調(diào)研、投資分析、學術研究等多種任務。 OpenAI在發(fā)布會上展示了多個案例,包括市場分析報告生成、投資備忘錄撰寫、學術論文檢索以及個性化購物建議等,都展現(xiàn)了其強大的實用性。 即使是尋找10年前去過的餐廳或忘記名字的電視劇,Deep Research也能輕松應對。
技術層面上的突破
Deep Research基于優(yōu)化版的o3模型,該模型經(jīng)過端到端強化學習訓練,具備強大的網(wǎng)頁瀏覽和數(shù)據(jù)分析能力。它能夠規(guī)劃多步驟研究路徑,并根據(jù)實時信息進行調(diào)整。與之前的o1模型相比,Deep Research在處理需要從多個在線資源獲取信息的現(xiàn)實世界問題上有了顯著提升。
Deep Research的性能表現(xiàn)
在“人類最后一場考試”中,Deep Research取得了26.6%的準確率,遠超之前的最高分13%,刷新了該測試的紀錄。在GAIA測試中,它也取得了SOTA的成績。這些測試結果充分證明了Deep Research在處理復雜任務上的卓越能力,以及其在多個領域節(jié)省時間和提升效率的潛力。
Deep Research的局限性和未來發(fā)展
盡管Deep Research表現(xiàn)出色,但它仍處于早期階段,存在一些局限性,例如偶爾會產(chǎn)生虛構事實或錯誤推斷,以及置信度校準方面還有待改進。OpenAI表示這些問題會隨著時間的推移而得到改善。未來,OpenAI計劃將Deep Research與Operator功能結合,進一步擴展ChatGPT的能力,使其能夠執(zhí)行更復雜的任務。
上線計劃和用戶群體
目前,Deep Research功能已在ChatGPT網(wǎng)頁版上線,并將在一個月內(nèi)推廣到移動端和桌面端。 初期,該功能將優(yōu)先提供給Pro用戶,每月最多100次查詢,之后會逐步向Plus、Team和Enterprise用戶開放。未來,OpenAI計劃推出更快速、更具成本效益的版本,并支持更多的數(shù)據(jù)源接入,進一步提升用戶體驗。
總而言之,Deep Research的推出標志著OpenAI在AGI研發(fā)道路上邁出了重要一步,它為用戶提供了強大的研究工具,極大地提升了信息獲取和處理效率,并為未來AI個人助手的開發(fā)提供了新的方向。
聯(lián)系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯(lián)網(wǎng)+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發(fā)展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。