澳门理工学院机器翻译暨人工智能应用技术教育部工程研究中心的研究团队探究串联式神经网络的结构及其对影像特征的提取方法,开发以多个分类器接入神经网络,以提取影像在各神经网络层中的形态及特征,并把分类器的结果通过研发出的标准化算法组合后,为最终预测作精确识别。是次研究由博士研究生陈家豪、教授严肇基及副教授柯韦负责,有效应用于日常生活中识别及分类影像物件,并能显着提升其准确性和稳定性。该科研成果已于国际着名人工智能期刊《Neural Computing and Applications》中发表。
智能网络对于影像分析的应用主要是以卷积层作为核心,由于卷积层能有效提取影像的特征,因此大多数应用都是通过堆迭大量的卷积层以覆盖整体的特征识别,并透过图像特征来区分目标的类别。但卷积算法不能兼顾目标整体的形态,在经常多次的卷积层后,目标的整体讯息会大量流失或被忽略从而影响准确度。目前一般的方法是把卷积前的讯息传递到最终分类器作为识别参考,但这样会增加最终分类器的工作量及分薄其神经元资源和性能。尤其对高解像度的输入源作识别时,则需要更大量的卷积层,整体讯息的缺失会变得十分严重,同时机器训练的过程和结果的准确性变得不稳定。澳门理工学院研究团队利用多个分类器对各卷积层作特征分析,位于较前的分类器能获得影像的形态讯息,较后的分类器则能针对影像的局部特征作识别,并以多个分类器对当前位置作参考识别,这样能有效缓减最终分类时的压力。为了能有效地总结各个分类器的资讯,经研究和测试后,团队研发出标准化方式来组合各分类器的讯息。针对使用多个分类器所需的大量机器训练运算时间,研发团队之标准化方法能有效减少各模型的运算时间,同时研究也论述和证明了其运算加速的方法有效。
在研究实验中,使用多分类器机器学习结果都有显着提高,其中对于分类目标繁多的数据源测试中,改进程度更为突出,同时发现所研发出的标准化方法能为影像识别带来更为精准的预测。相关研究获澳门特别行政区科学技术发展基金(檔案编号:0001/2018/AFJ)资助。全文可浏览: https://link.springer.com/article/10.1007%2Fs00521-021-06462-0