澳門理工學院機器翻譯暨人工智能應用技術教育部工程研究中心的研究團隊探究串聯式神經網絡的結構及其對影像特徵的提取方法,開發以多個分類器接入神經網絡,以提取影像在各神經網絡層中的形態及特徵,並把分類器的結果通過研發出的標準化算法組合後,為最終預測作精確識別。是次研究由博士研究生陳家豪、教授嚴肇基及副教授柯韋負責,有效應用於日常生活中識別及分類影像物件,並能顯著提升其準確性和穩定性。該科研成果已於國際著名人工智能期刊《Neural Computing and Applications》中發表。
智能網絡對於影像分析的應用主要是以捲積層作為核心,由於捲積層能有效提取影像的特徵,因此大多數應用都是通過堆疊大量的捲積層以覆蓋整體的特徵識別,並透過圖像特徵來區分目標的類別。但捲積算法不能兼顧目標整體的形態,在經常多次的捲積層後,目標的整體訊息會大量流失或被忽略從而影響準確度。目前一般的方法是把捲積前的訊息傳遞到最終分類器作為識別參考,但這樣會增加最終分類器的工作量及分薄其神經元資源和性能。尤其對高解像度的輸入源作識別時,則需要更大量的捲積層,整體訊息的缺失會變得十分嚴重,同時機器訓練的過程和結果的準確性變得不穩定。澳門理工學院研究團隊利用多個分類器對各捲積層作特徵分析,位於較前的分類器能獲得影像的形態訊息,較後的分類器則能針對影像的局部特徵作識別,並以多個分類器對當前位置作參考識別,這樣能有效緩減最終分類時的壓力。為了能有效地總結各個分類器的資訊,經研究和測試後,團隊研發出標準化方式來組合各分類器的訊息。針對使用多個分類器所需的大量機器訓練運算時間,研發團隊之標準化方法能有效減少各模型的運算時間,同時研究也論述和證明了其運算加速的方法有效。
在研究實驗中,使用多分類器機器學習結果都有顯著提高,其中對於分類目標繁多的數據源測試中,改進程度更為突出,同時發現所研發出的標準化方法能為影像識別帶來更為精準的預測。相關研究獲澳門特別行政區科學技術發展基金(檔案編號:0001/2018/AFJ)資助。全文可瀏覽: https://link.springer.com/article/10.1007%2Fs00521-021-06462-0