SAR(合成孔徑雷達)圖像解譯領域新進展。
原標題:首個公開發表的SAR圖像目標識別基礎模型!國防科大劉永祥&劉麗教授團隊提出SARATR-X 1.0
文章來源:機器之心
內容字數:8929字
國防科技大學團隊突破SAR目標識別瓶頸,打造首個公開SAR圖像目標識別基礎模型SARATR-X
合成孔徑雷達(SAR)目標識別是SAR圖像智能解譯的核心,但面臨技術和生態兩大挑戰。技術層面,現有方法多為有監督、靜態、單任務的,導致計算冗余、泛化能力不足等問題;生態層面,缺乏高質量的開源數據和評估基準。為解決這些問題,國防科技大學劉永祥&劉麗教授團隊研發了首個公開發布的SAR圖像目標識別基礎模型SARATR-X 1.0,并構建了相應的開源數據集和評估基準,為SAR圖像解譯領域技術創新和發展生態帶來了突破。
1. SARATR-X 1.0的核心技術突破
SARATR-X 1.0在技術層面取得了多項突破:首先,它率先開展了基于自監督學習的SAR目標特征表示學習,創新性地提出了SAR-JEPA框架,該框架僅預測SAR圖像稀疏且重要的梯度特征表示,有效抑制了相干斑噪聲。其次,SARATR-X 1.0(0.66億參數,基于Transformer架構)突破了對大規模高質量標注數據的依賴,大幅提升了預訓練基礎模型的認知能力。 該模型采用HiViT架構,能夠更好地處理遙感圖像的空間表示,尤其針對大圖像中的小目標。
2. 構建完善的SAR目標識別開源生態
在生態層面,團隊致力于構建良好的開源生態:規范和整合已有公開數據集,形成較大規模SAR圖像陸海目標識別數據集SARDet-180K;構建了新的SAR車輛目標識別數據集NUDT4MSTAR(40種車輛型號,規模超過同類型數據集十倍);并開源相關的目標識別算法代碼和評估基準。
3. SARATR-X 1.0的性能及可擴展性
SARATR-X 1.0在多個下游目標識別任務(包括小樣本目標識別、穩健目標識別、目標檢測等)上取得了國際先進或領先水平。例如,在細粒度車輛MSTAR數據集中,其目標分類性能優于現有的SSL方法,提升了4.5%。在目標檢測方面,平均提升約4%。研究團隊還對模型的可擴展性進行了研究,結果表明,隨著數據和參數量的增加,下游任務性能顯著提升,展現了良好的可擴展性。
4. 未來的發展方向
團隊正在研制SARATR-X 2.0,預計參數規模將達到3億,SAR目標切片樣本規模200萬,并將收集的數據形成開源數據集,進一步服務生態建設。
5. 研究成果的影響
該團隊的代表性工作已引起國內外同行的廣泛關注,獲得積極評價,被國際頂級學術期刊《IEEE Transactions on Image Processing》和《ISPRS Journal of Photogrammetry and Remote Sensing》錄用或發表。 國際同行對其工作給予了高度評價,例如ISPRS Journal主編Clement Mallet認為SAR-JEPA首次將聯合嵌入預測框架概念應用于對地觀測,并專門用于SAR數據。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺