首個公開發表的SAR圖像目標識別基礎模型！國防科大劉永祥&劉麗教授團隊提出SARATR-X 1.0

SAR（合成孔徑雷達）圖像解譯領域新進展。

原標題：首個公開發表的SAR圖像目標識別基礎模型！國防科大劉永祥&劉麗教授團隊提出SARATR-X 1.0
文章來源：機器之心
內容字數：8929字

國防科技大學團隊突破SAR目標識別瓶頸，打造首個公開SAR圖像目標識別基礎模型SARATR-X

合成孔徑雷達(SAR)目標識別是SAR圖像智能解譯的核心，但面臨技術和生態兩大挑戰。技術層面，現有方法多為有監督、靜態、單任務的，導致計算冗余、泛化能力不足等問題；生態層面，缺乏高質量的開源數據和評估基準。為解決這些問題，國防科技大學劉永祥&劉麗教授團隊研發了首個公開發布的SAR圖像目標識別基礎模型SARATR-X 1.0，并構建了相應的開源數據集和評估基準，為SAR圖像解譯領域技術創新和發展生態帶來了突破。

1. SARATR-X 1.0的核心技術突破

SARATR-X 1.0在技術層面取得了多項突破：首先，它率先開展了基于自監督學習的SAR目標特征表示學習，創新性地提出了SAR-JEPA框架，該框架僅預測SAR圖像稀疏且重要的梯度特征表示，有效抑制了相干斑噪聲。其次，SARATR-X 1.0（0.66億參數，基于Transformer架構）突破了對大規模高質量標注數據的依賴，大幅提升了預訓練基礎模型的認知能力。該模型采用HiViT架構，能夠更好地處理遙感圖像的空間表示，尤其針對大圖像中的小目標。

2. 構建完善的SAR目標識別開源生態

在生態層面，團隊致力于構建良好的開源生態：規范和整合已有公開數據集，形成較大規模SAR圖像陸海目標識別數據集SARDet-180K；構建了新的SAR車輛目標識別數據集NUDT4MSTAR（40種車輛型號，規模超過同類型數據集十倍）；并開源相關的目標識別算法代碼和評估基準。

3. SARATR-X 1.0的性能及可擴展性

SARATR-X 1.0在多個下游目標識別任務（包括小樣本目標識別、穩健目標識別、目標檢測等）上取得了國際先進或領先水平。例如，在細粒度車輛MSTAR數據集中，其目標分類性能優于現有的SSL方法，提升了4.5%。在目標檢測方面，平均提升約4%。研究團隊還對模型的可擴展性進行了研究，結果表明，隨著數據和參數量的增加，下游任務性能顯著提升，展現了良好的可擴展性。

4. 未來的發展方向

團隊正在研制SARATR-X 2.0，預計參數規模將達到3億，SAR目標切片樣本規模200萬，并將收集的數據形成開源數據集，進一步服務生態建設。

5. 研究成果的影響

該團隊的代表性工作已引起國內外同行的廣泛關注，獲得積極評價，被國際頂級學術期刊《IEEE Transactions on Image Processing》和《ISPRS Journal of Photogrammetry and Remote Sensing》錄用或發表。國際同行對其工作給予了高度評價，例如ISPRS Journal主編Clement Mallet認為SAR-JEPA首次將聯合嵌入預測框架概念應用于對地觀測，并專門用于SAR數據。