Qwen3 Reranker

Qwen3 Reranker – 阿里通義開源的文本重排序模型

Qwen3 Reranker

Qwen3 Reranker是阿里巴巴通義千問團隊推出的文本重排序模型，隸屬于Qwen3模型家族。它采用單塔交叉編碼器結構，接收文本對作為輸入，并輸出相關性評分。該模型通過多階段訓練方法，結合高質量標注數據和大量合成訓練數據進行訓練，支持超過100種語言，涵蓋主流自然語言及多種編程語言。

Qwen3 Reranker：文本排序的革新者

在信息的時代，快速準確地獲取所需信息至關重要。Qwen3 Reranker，由阿里巴巴通義千問團隊傾力打造，正是為了解決這一難題而生。它是一個強大的文本重排序模型，是Qwen3模型家族的一員。該模型利用先進的單塔交叉編碼器架構，能夠對文本對之間的相關性進行精準評估，從而顯著提升信息檢索的效率和質量。

核心功能

精準的相關性評估：Qwen3 Reranker能夠接收用戶查詢和候選文檔等文本對，并計算它們之間的相關性得分。得分越高，表示文本對之間的關聯性越強。
智能文本排序：基于相關性得分，Qwen3 Reranker可以對候選文本進行智能排序，將與用戶查詢最相關的文本置于首位，方便用戶快速找到所需信息。
優化檢索結果：在語義檢索場景中，這一功能可以幫助用戶更快地找到最相關的信息，提升檢索效率和準確性，為用戶帶來更優質的體驗。
廣泛的語言支持：Qwen3 Reranker支持超過100種語言，包括主流自然語言以及多種編程語言，滿足全球用戶的多樣化需求。

技術亮點

單塔交叉編碼器架構：Qwen3 Reranker采用單塔交叉編碼器架構，這種設計使得模型能夠同時處理查詢和候選文檔，深度分析文本對之間的交互，從而更準確地評估它們之間的相關性。
指令感知能力：模型具備通過指令動態定義任務目標的能力，例如，在法律文檔相關性判斷中，模型可以根據不同的任務和場景靈活調整相關性評估標準，實現更精細的語義理解。
靈活的輸入輸出格式：輸入格式采用特定的模板，包含指令、查詢和文檔。輸出則為相關性得分，通過計算“是”或“否”的概率來判斷文本的相關程度。
多階段訓練策略：Qwen3 Reranker的訓練過程分為多個階段，包括監督微調和合成數據訓練。監督微調階段使用高質量標注數據，提升訓練效率。合成數據訓練則進一步增強模型性能。
高質量數據篩選：在訓練數據的選擇上，Qwen3 Reranker精選了包括MS MARCO、NQ、HotpotQA等在內的多個高質量標注數據集，并利用余弦相似度篩選出高質量的合成數據對。
模型融合技術：采用球面線性插值（SLERP）技術，對微調階段保存的多個模型檢查點進行參數融合，從而更好地保留模型參數的幾何特性，提升模型在不同數據分布下的魯棒性和泛化性能。
監督微調損失（SFT Loss）：Qwen3 Reranker優化的是監督微調損失函數，通過最大化正確標簽（“yes”或“no”）的概率，模型學習區分相關和無關文檔。這種二分類方式簡化了重排序任務，基于Qwen3模型的指令跟隨能力。