AIGC動態歡迎閱讀
原標題:2024KDD挑戰任務,GPT-4僅得40分,Meta發布最新RAG評價基準
關鍵字:問題,答案,報告,圖譜,任務
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | Axe_越眾所周知,“要想富,先修路”,經常挖路的同學應該知道,要想修好一條路,首先就必須搞清楚關于道路質量的統一驗收標準,否則,“我怎么知道我這條路能不能走通呢”?
對于AI領域來說,也同樣如此。
還記得一年多以前,當第一批吃螃蟹的大佬們將檢索增強生成(Retrieval-Augmented Generation,RAG)與LLM結合之后,由于補齊了LLM知識不足的短板,LLM立刻在各個領域的應用方面都迸發出了更大的潛力。
如今,RAG的范式已不再局限于將外部知識作為上下文補充的最傳統范式,各種“聯合訓練”,“自我反思”,“前瞻性主動檢索”方案百花齊放。然而時至今日,對于RAG對LLM的增強效果到底怎么樣,仍然缺乏一個統一的驗收標準。
為填補這一空缺,Meta最近發布了一套RAG評測基準,或許出乎大家的意料,哪怕是被大家公認最強的GPT-4在加上RAG之后,也僅僅只能勉強飄過40分(看了很多遍確認是百分制)!在LLM+RAG這條道路上,實際上我們還有太多值得繼續探索和優化的事情。
論文標題:CRAG – Comprehensive RAG Benchmar
原文鏈接:2024KDD挑戰任務,GPT-4僅得40分,Meta發布最新RAG評價基準
聯系作者
文章來源:夕小瑤科技說
作者微信:xixiaoyaoQAQ
作者簡介:專業、有趣、深度價值導向的科技媒體。聚集30萬AI工程師、研究員,覆蓋500多家海內外機構投資人,互聯網大廠中高管和AI公司創始人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189