·90· 福 建 建 筑 2023 年
行對象種類與矩形框位置等預(yù)測。 常見的作法之一,
為特征金字塔 ( Feature Pyramid Network,FPN)。 而
YOLO - v5 則是延伸使用了更為復(fù)雜的 Path Aggregation Network (PANet),充分利用高低階特征,并成功
訓(xùn)練模型。 由于 YOLO - v5 模型能達到實時運算,且辨
識表現(xiàn)也有一定的水平,因此,能為建物損壞檢測提供實
時的辨識成果,輔助檢測人員快速掃描建物的現(xiàn)況。
2. 3 實例分割方法 - Mask R - CNN
[2]
本研究選用 Mask R - CNN 作為實例分割模型。
比起對象偵測,能將目標(biāo)物位置輪廓精確至像素級
別,并區(qū)分同一類別之不同個體。 Mask R - CNN 結(jié)
合對象偵測模型 - Faster R - CNN 和全卷積網(wǎng)絡(luò),在
對象框識別基礎(chǔ)上加入預(yù)測語義屏蔽 (mask) 的網(wǎng)
絡(luò)分支,并修改 Faster R - CNN 池化層,保留圖像上
準(zhǔn)確的空間位置,優(yōu)化影像分割之對象邊緣。 對建物
損壞檢測應(yīng)用來說,Mask R - CNN 因為比 YOLO - v5
網(wǎng)絡(luò)節(jié)點較多,且需要更長的運算時間,所以較難達
到實時辨識。 但是作為影像分割算法,可以提供更為
精確的損壞范圍,仍能提供檢測作后續(xù)的分析。 即現(xiàn)
地檢測結(jié)束后,為確定損壞目標(biāo)邊緣與位置而做二次
影像判別,利用像素級之影像辨識,大幅提升肉眼難
以辨識之損壞確切位置和尺度,尤其是對于裂縫或裂
紋等較細(xì)微且形狀不規(guī)則的損壞。
3 應(yīng)用案例與成果
本研究實作之場域為桃園市小學(xué)之走廊,該場域
可再細(xì)分為五個區(qū)域,如圖 3 所示。 由于該場域校舍
近期經(jīng)粉刷整修,結(jié)構(gòu)表面幾乎未有裂縫裂紋,亦沒
有鋼筋裸露的現(xiàn)象,故整體損壞類別為大量壁癌滲水
和極少量裂縫裂紋。 因此,以下成果將探討壁檢測場
域之癌滲水與極少量裂縫裂紋辨識成果。 本研究使
用 iPhone SE2 相機記錄結(jié)構(gòu)表面損壞,并采固定之拍
攝流程,如圖 4 所示。 首先,以全景或透視視角拍攝
檢測區(qū)域全貌,以便取得圖像映射場域之相對位置。
再次,依建物特性區(qū)分成墻柱與版梁,由下而上、由遠
至近來回拍攝,并使相機平行于受檢測之結(jié)構(gòu)表面,
逐一完整記錄建物表面之影像。 對特定范圍或需加
強檢測之區(qū)域,補強拍攝,紀(jì)錄該位置之損壞,且拍攝
時不需限制,將相機平行于受檢測物表面。 檢測區(qū)域
紀(jì)錄完成后,再將拍攝的影像分別輸入于訓(xùn)練好的
YOLO - v5 作對象偵測,以及 Mask R - CNN,作影像
分割。 本研究在訓(xùn)練模型設(shè)定上,除參考模型開發(fā)之
默認(rèn)值,亦參考網(wǎng)絡(luò)上公開討論之超參數(shù)設(shè)定成果,
并經(jīng)由多次實驗反復(fù)調(diào)整設(shè)定值,訓(xùn)練迭代次數(shù)(epoch)為 300,批次數(shù)量(batch - size)為 16,初始學(xué)習(xí)率
(learning rate)分別為 0. 001,并隨著梯度下降調(diào)整學(xué)
習(xí)率。 另外,為增加模型學(xué)習(xí)效率,本研究利用采遷
移式學(xué)習(xí),利用預(yù)先針對 COCO 公開數(shù)據(jù)訓(xùn)練之成
果,作為預(yù)訓(xùn)練權(quán)重輸入模型中,經(jīng)由微調(diào)可提升模
型,對結(jié)構(gòu)損壞影像的特征提取能力。 而本研究經(jīng)多
次實驗后,采用 YOLOv5 - l,作為模型之預(yù)訓(xùn)練權(quán)重。
由于實驗場域的影像多為壁癌滲水,故僅先考慮 YOLO - v5 所預(yù)測的偵測結(jié)果,并與人工判定損壞之基
準(zhǔn)真相(Ground Truth)做比較,如圖 5 所示,并統(tǒng)計各
個區(qū)域辨識的混淆矩陣(Confusion Matrix),獲得 True
Positive ( TP)、False Positive ( FP) 與 False Negative
(FN)值,利用其比例關(guān)系計算精確率 (Precision)、召
回率 (Recall) 及皮氏分?jǐn)?shù) ( F - score),上述各指標(biāo)
的計算公式如式(1) ~ (3):
Precision =
TP
TP + FP
(1)
Recall =
TP
TP + FN
(2)
F - score = 2 ×
precision × recall
precision + recall
(3)
圖 3 檢測場域分區(qū)示意圖
圖 4 拍攝手法示意圖
圖 5 模型辨識示意圖