MaskSearch – 阿里通義推出的檢索增強預訓練框架
MaskSearch是阿里巴巴通義實驗室推出的創新型通用預訓練框架,旨在提升大型語言模型(LLM)的智能體搜索能力。它通過檢索增強掩碼預測(RAMP)任務,讓模型在輸入文本中對關鍵信息進行掩碼處理,并借助外部知識庫調用搜索工具預測被掩蓋的片段。該框架的功能包括提升問答性能、適應多種任務、兼容多種訓練方法以及數據集擴展。
### MaskSearch: 解鎖LLM智能體搜索的新篇章
在人工智能領域不斷演進的浪潮中,阿里巴巴通義實驗室隆重推出了MaskSearch,一款革新性的通用預訓練框架,旨在大幅提升大型語言模型(LLM)在智能體搜索方面的卓越性能。 MaskSearch的核心目標在于增強LLM對復雜信息的理解與處理能力,從而使其能夠更精準地檢索、分析和生成信息。
### MaskSearch的核心功能
- 卓越的問答能力:MaskSearch顯著增強了LLM在開放域多跳問答場景中的表現,尤其在領域內和領域外下游任務上,讓模型能夠更深入地理解復雜問題并給出精準解答。
- 廣泛的任務適應性:憑借RAMP任務和多智能體生成的思維鏈數據,MaskSearch能夠出色地適應各種問答任務,在不同應用場景下展現出卓越的性能。
- 靈活的訓練方法:MaskSearch兼容監督學習(SFT)和強化學習(RL)兩種訓練方法,用戶可以根據具體任務需求靈活選擇合適的訓練策略。
- 強大的數據集擴展能力:通過構建大規模預訓練數據集(例如1000萬樣本),MaskSearch能夠有效提升模型的訓練效果和可擴展性,為未來發展奠定堅實基礎。
### MaskSearch的技術精髓
- 檢索增強掩碼預測(RAMP)任務:RAMP任務是MaskSearch的核心,它借鑒了BERT的掩碼機制,讓模型在輸入文本序列中對關鍵信息進行掩碼處理。隨后,模型會主動利用外部知識庫,調用搜索工具來預測這些被掩蓋的文本片段。除了常見的命名實體、日期、數字等,RAMP還涵蓋了本體知識、特定術語和數值等關鍵信息,從而增加了任務的挑戰性,促使模型在檢索和推理過程中更加精細化地處理信息。
- 多智能體協同生成思維鏈(CoT)數據:為了生成用于監督微調(SFT)的思維鏈數據,MaskSearch采用了多智能體系統,包括規劃者、重寫者、觀察者等角色,協同完成思維鏈的生成任務,最終由一個LLM負責答案判斷,僅保留正確答案的思維鏈。為了快速擴展數據集并保持高質量,使用已有數據訓練后的教師模型,直接生成推理軌跡,逐步迭代教師模型,逐步提升數據質量。
- 強化學習(RL)的創新實踐:在強化學習環節,MaskSearch采用了動態采樣策略優化(DAPO)算法,構建混合獎勵系統,包括格式獎勵和回答獎勵。格式獎勵用于檢查模型輸出是否符合指定格式,回答獎勵則評估生成答案與標準答案的一致性。最終選擇基于模型的獎勵函數,使用Qwen2.5-72B-Instruct模型作為評判,為生成答案和標準答案的一致性進行打分。
- 課程學習的巧妙運用:MaskSearch引入了課程學習策略,依據掩碼數量對訓練樣本進行難度分級,引導模型從易到難循序漸進地學習,逐步提升其解決問題的能力。
### 了解更多
* **項目地址:** https://github.com/Alibaba-NLP/MaskSearch
* **技術論文:** https://arxiv.org/pdf/2505.20285
### MaskSearch的應用場景
- 智能客服:在智能客服領域,MaskSearch能夠幫助客服系統更精準地理解用戶問題,迅速檢索到相關的答案和信息,從而提升客服效率和用戶滿意度。
- 教育領域:在教育領域,MaskSearch可以用于構建智能輔導系統,幫助學生更好地理解和解決復雜的學術問題。它能夠根據學生的問題,檢索相關的知識點和解答,提供個性化的學習支持。
- 企業級搜索系統:企業級搜索系統需要處理大量的內部數據和復雜的查詢需求。MaskSearch可以增強企業搜索系統的檢索能力,能夠更準確地理解用戶查詢意圖,從海量數據中快速檢索到相關信息,從而提高企業決策效率。
- 機器學習模型的調試與優化:MaskSearch還可以應用于機器學習模型的調試與優化。例如,在調試圖像分類模型時,MaskSearch可以幫助用戶通過掩碼屬性查詢圖像數據庫,識別模型學習到的虛假相關性,探索模型顯著性與人類注意力之間的差異。
### 常見問題
Q: MaskSearch與傳統的LLM預訓練框架相比,有哪些優勢?
A: MaskSearch的核心優勢在于其獨特的RAMP任務和多智能體協同生成的思維鏈數據,這使得模型在處理復雜問題和進行信息檢索時表現更出色。此外,其兼容多種訓練方法和數據集擴展能力,也使其更具靈活性和可擴展性。
Q: MaskSearch適用于哪些類型的任務?
A: MaskSearch特別適用于需要進行復雜推理和信息檢索的問答任務,例如開放域多跳問答、智能客服、教育輔導等。同時,它也可以應用于機器學習模型的調試與優化。