近期,電子信息工程學(xué)院(機(jī)器人學(xué)院)周城老師、熊承義教授團(tuán)隊(duì)在遙感圖像語(yǔ)義分割研究中實(shí)現(xiàn)新突破,為解決復(fù)雜場(chǎng)景下遙感圖像目標(biāo)邊界模糊、多尺度特征提取難等行業(yè)痛點(diǎn)提供了全新技術(shù)范式。2 月初,團(tuán)隊(duì)最新研究成果以Edge-Guided and Multiscale Feature Optimization-Based Semantic Segmentation Network for Remote Sensing Images為題,在國(guó)際遙感領(lǐng)域頂級(jí)期刊IEEE Transactions on Geoscience and Remote Sensing(TGRS)(中科院一區(qū)TOP期刊)發(fā)表。論文鏈接:https://ieeexplore.ieee.org/document/11371341。
該項(xiàng)研究成果是校企協(xié)同、校校合作開(kāi)展技術(shù)攻關(guān)的重要結(jié)晶。論文第一作者為周城老師,通訊作者為我校2025屆校友、中國(guó)鐵塔股份有限公司工程師蔡博鋒,合作作者包括熊承義教授與武漢輕工大學(xué)劉仁峰副教授。
遙感圖像語(yǔ)義分割是地理空間信息解譯的核心環(huán)節(jié),其精度直接決定智慧城市管理、土地利用分類(lèi)、環(huán)境監(jiān)測(cè)等下游應(yīng)用的可靠性。然而在實(shí)際應(yīng)用中,遙感圖像存在目標(biāo)尺度差異大、目標(biāo)遮擋嚴(yán)重、類(lèi)間相似度高等固有問(wèn)題,極易造成目標(biāo)邊界模糊;傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)經(jīng)池化操作后易丟失細(xì)粒度空間細(xì)節(jié),現(xiàn)有Transformer模型處理高分辨率遙感數(shù)據(jù)時(shí),又面臨計(jì)算成本過(guò)高、局部高頻細(xì)節(jié)保留不足等挑戰(zhàn)。諸多因素成為制約該領(lǐng)域技術(shù)發(fā)展的關(guān)鍵瓶頸。
針對(duì)上述行業(yè)難題,研究團(tuán)隊(duì)創(chuàng)新性提出邊緣引導(dǎo)與多尺度特征優(yōu)化相結(jié)合的工程集成框架,為遙感圖像語(yǔ)義分割打造了高效精準(zhǔn)的技術(shù)解決方案。該框架以金字塔視覺(jué)Transformer(PVT)為基礎(chǔ),設(shè)計(jì)了邊緣引導(dǎo)編碼器,通過(guò)引入可學(xué)習(xí)的邊緣引導(dǎo)特征模塊(EFM),能夠顯示恢復(fù)采樣過(guò)程中丟失的邊界信息,從根源上緩解邊界模糊問(wèn)題;在解碼器部分,團(tuán)隊(duì)融合特征對(duì)齊金字塔網(wǎng)絡(luò)(FaPN)與自適應(yīng)空間特征融合機(jī)制(ASFF),實(shí)現(xiàn)了跨尺度特征的精確對(duì)齊與動(dòng)態(tài)智能選擇,既能有效抑制背景噪聲,又能在保留細(xì)粒度空間結(jié)構(gòu)的同時(shí),顯著增強(qiáng)模型對(duì)小目標(biāo)的感知能力,兼顧了分割精度與特征提取的全面性。
為驗(yàn)證模型性能,研究團(tuán)隊(duì)在 ISPRS Potsdam 和 LoveDA 兩大國(guó)際主流大規(guī)模高分辨率遙感開(kāi)源數(shù)據(jù)集上開(kāi)展了系統(tǒng)實(shí)驗(yàn)。結(jié)果顯示,該模型在平均交并比(mIoU)、像素準(zhǔn)確率(aAcc)等語(yǔ)義分割核心評(píng)價(jià)指標(biāo)上,顯著超越 DeepLabV3+、SegFormer 等現(xiàn)有主流先進(jìn)算法;同時(shí),模型在參數(shù)量、計(jì)算復(fù)雜度與推理速度之間實(shí)現(xiàn)了極佳平衡,具備極高的實(shí)際工程部署價(jià)值和產(chǎn)業(yè)化應(yīng)用潛力,為遙感圖像語(yǔ)義分割技術(shù)的工程化落地提供了重要支撐。


論文內(nèi)容示意。電信學(xué)院供圖