·90· 福 建 建 筑 2023 年
行對(duì)象種類與矩形框位置等預(yù)測。 常見的作法之一,
為特征金字塔 ( Feature Pyramid Network,FPN)。 而
YOLO - v5 則是延伸使用了更為復(fù)雜的 Path Aggregation Network (PANet),充分利用高低階特征,并成功
訓(xùn)練模型。 由于 YOLO - v5 模型能達(dá)到實(shí)時(shí)運(yùn)算,且辨
識(shí)表現(xiàn)也有一定的水平,因此,能為建物損壞檢測提供實(shí)
時(shí)的辨識(shí)成果,輔助檢測人員快速掃描建物的現(xiàn)況。
2. 3 實(shí)例分割方法 - Mask R - CNN
[2]
本研究選用 Mask R - CNN 作為實(shí)例分割模型。
比起對(duì)象偵測,能將目標(biāo)物位置輪廓精確至像素級(jí)
別,并區(qū)分同一類別之不同個(gè)體。 Mask R - CNN 結(jié)
合對(duì)象偵測模型 - Faster R - CNN 和全卷積網(wǎng)絡(luò),在
對(duì)象框識(shí)別基礎(chǔ)上加入預(yù)測語義屏蔽 (mask) 的網(wǎng)
絡(luò)分支,并修改 Faster R - CNN 池化層,保留圖像上
準(zhǔn)確的空間位置,優(yōu)化影像分割之對(duì)象邊緣。 對(duì)建物
損壞檢測應(yīng)用來說,Mask R - CNN 因?yàn)楸?YOLO - v5
網(wǎng)絡(luò)節(jié)點(diǎn)較多,且需要更長的運(yùn)算時(shí)間,所以較難達(dá)
到實(shí)時(shí)辨識(shí)。 但是作為影像分割算法,可以提供更為
精確的損壞范圍,仍能提供檢測作后續(xù)的分析。 即現(xiàn)
地檢測結(jié)束后,為確定損壞目標(biāo)邊緣與位置而做二次
影像判別,利用像素級(jí)之影像辨識(shí),大幅提升肉眼難
以辨識(shí)之損壞確切位置和尺度,尤其是對(duì)于裂縫或裂
紋等較細(xì)微且形狀不規(guī)則的損壞。
3 應(yīng)用案例與成果
本研究實(shí)作之場域?yàn)樘覉@市小學(xué)之走廊,該場域
可再細(xì)分為五個(gè)區(qū)域,如圖 3 所示。 由于該場域校舍
近期經(jīng)粉刷整修,結(jié)構(gòu)表面幾乎未有裂縫裂紋,亦沒
有鋼筋裸露的現(xiàn)象,故整體損壞類別為大量壁癌滲水
和極少量裂縫裂紋。 因此,以下成果將探討壁檢測場
域之癌滲水與極少量裂縫裂紋辨識(shí)成果。 本研究使
用 iPhone SE2 相機(jī)記錄結(jié)構(gòu)表面損壞,并采固定之拍
攝流程,如圖 4 所示。 首先,以全景或透視視角拍攝
檢測區(qū)域全貌,以便取得圖像映射場域之相對(duì)位置。
再次,依建物特性區(qū)分成墻柱與版梁,由下而上、由遠(yuǎn)
至近來回拍攝,并使相機(jī)平行于受檢測之結(jié)構(gòu)表面,
逐一完整記錄建物表面之影像。 對(duì)特定范圍或需加
強(qiáng)檢測之區(qū)域,補(bǔ)強(qiáng)拍攝,紀(jì)錄該位置之損壞,且拍攝
時(shí)不需限制,將相機(jī)平行于受檢測物表面。 檢測區(qū)域
紀(jì)錄完成后,再將拍攝的影像分別輸入于訓(xùn)練好的
YOLO - v5 作對(duì)象偵測,以及 Mask R - CNN,作影像
分割。 本研究在訓(xùn)練模型設(shè)定上,除參考模型開發(fā)之
默認(rèn)值,亦參考網(wǎng)絡(luò)上公開討論之超參數(shù)設(shè)定成果,
并經(jīng)由多次實(shí)驗(yàn)反復(fù)調(diào)整設(shè)定值,訓(xùn)練迭代次數(shù)(epoch)為 300,批次數(shù)量(batch - size)為 16,初始學(xué)習(xí)率
(learning rate)分別為 0. 001,并隨著梯度下降調(diào)整學(xué)
習(xí)率。 另外,為增加模型學(xué)習(xí)效率,本研究利用采遷
移式學(xué)習(xí),利用預(yù)先針對(duì) COCO 公開數(shù)據(jù)訓(xùn)練之成
果,作為預(yù)訓(xùn)練權(quán)重輸入模型中,經(jīng)由微調(diào)可提升模
型,對(duì)結(jié)構(gòu)損壞影像的特征提取能力。 而本研究經(jīng)多
次實(shí)驗(yàn)后,采用 YOLOv5 - l,作為模型之預(yù)訓(xùn)練權(quán)重。
由于實(shí)驗(yàn)場域的影像多為壁癌滲水,故僅先考慮 YOLO - v5 所預(yù)測的偵測結(jié)果,并與人工判定損壞之基
準(zhǔn)真相(Ground Truth)做比較,如圖 5 所示,并統(tǒng)計(jì)各
個(gè)區(qū)域辨識(shí)的混淆矩陣(Confusion Matrix),獲得 True
Positive ( TP)、False Positive ( FP) 與 False Negative
(FN)值,利用其比例關(guān)系計(jì)算精確率 (Precision)、召
回率 (Recall) 及皮氏分?jǐn)?shù) ( F - score),上述各指標(biāo)
的計(jì)算公式如式(1) ~ (3):
Precision =
TP
TP + FP
(1)
Recall =
TP
TP + FN
(2)
F - score = 2 ×
precision × recall
precision + recall
(3)
圖 3 檢測場域分區(qū)示意圖
圖 4 拍攝手法示意圖
圖 5 模型辨識(shí)示意圖