Phương pháp kết hợp nhiều góc nhìn để tăng độ chính xác cho bài toán nhận dạng khuôn mặt
183 lượt xemDOI:
https://doi.org/10.54939/1859-1043.j.mst.95.2024.76-84Từ khóa:
Nhận dạng khuôn mặt; Học sâu; Mạng lưới nơ-ron tích chập; Kết hợp nhiều góc nhìn; Xử lý ảnh; Tối ưu hóa góc nhìn; Phân tích đa góc nhìn; Cải thiện hiệu suất nhận dạng; Ứng dụng an ninh.Tóm tắt
Bài báo này giới thiệu một phương pháp tiên tiến trong lĩnh vực nhận dạng khuôn mặt, sử dụng một kỹ thuật độc đáo kết hợp mạng Convolutional Neural Networks (CNN) và Multilayer Perceptron (MLP) để tích hợp nhiều góc nhìn khác nhau. Điểm nhấn của phương pháp này là việc áp dụng CNN để phân tích đặc điểm hình ảnh từ nhiều góc độ, cùng với MLP nhằm tối ưu hóa quá trình tổng hợp thông tin, qua đó nâng cao độ chính xác trong nhận dạng khuôn mặt dưới các điều kiện ánh sáng và góc độ biến đổi. Mục tiêu chính là giải quyết thách thức về sự suy giảm hiệu suất nhận dạng khuôn mặt trong các tình huống thực tế, đặc biệt khi góc nhìn có sự thay đổi lớn. Nghiên cứu này chi tiết cách xây dựng mô hình từ thu thập và xử lý dữ liệu, huấn luyện mạng lưới nơ-ron phức tạp, đến việc đánh giá hiệu quả thông qua các bộ dữ liệu tiêu chuẩn và thực nghiệm.
Tài liệu tham khảo
[1]. Zhao W., Krishnaswamy A., Chellappa R., Swets D.L., Weng J. “Discriminant Analysis of Principal Components for Face Recognition”. In: Wechsler H., Phillips P.J., Bruce V., Soulié F.F., Huang T.S. (eds) Face Recognition. NATO ASI Series, vol 163. Springer, (1998). DOI: https://doi.org/10.1007/978-3-642-72201-1_4
[2]. Guodong Guo, Stan Z. Li, Kap Luk Chan., “Support Vector machines for face recognition”, School of Electrical and Electronic, Nanyang Technology University, (2001).
[3]. Liao, S., Jain, A. K., Li, S. Z., “Partial face recognition: Alignment-free approach”, IEEE Trans. PAMI, 35(5):1193–1205, (2013). DOI: https://doi.org/10.1109/TPAMI.2012.191
[4]. Y. Taigman, M. Yang, M. Ranzato, L. Wolf, “DeepFace: Closing the Gap to Human-Level Performance in Face Verification”, Proc. of Computer Vision and Pattern Recognition Conference (CVPR 2014), Columbus, (2014).
[5]. Y. Taigman, M. Yang, M. Ranzato and L. Wolf, "DeepFace: Closing the Gap to Human-Level Performance in Face Verification," IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, (2014). DOI: https://doi.org/10.1109/CVPR.2014.220
[6]. A. Verma, D. Malla, A. K. Choudhary and V. Arora, "A Detailed Study of Azure Platform & Its Cognitive Services" International Conference on Machine Learning, Big Data, Cloud and Parallel Computing (COMITCon), Faridabad, India, (2019). DOI: https://doi.org/10.1109/COMITCon.2019.8862178
[7]. V. Sharma, "Object Detection and Recognition using Amazon Rekognition with Boto3", 6th International Conference on Trends in Electronics and Informatics (ICOEI), Tirunelveli, India, (2022). DOI: https://doi.org/10.1109/ICOEI53556.2022.9776884
[8]. Baojin Huang, Zhongyuan Wang, Guangcheng Wang, Kui Jiang, Zhen Han, Tao Lu, Chao Liang, " PLFace: Progressive Learning for Face Recognition with Mask Bias" College of Information Engineering, Northwest A&F University, (2023). DOI: https://doi.org/10.1016/j.patcog.2022.109142
[9]. Xiaopeng Li, Yuyun Xiang, Shuqin Li, "Combining convolutional and vision transformer structures for sheep face recognition " Computers and Electronics in Agriculture, vol. 205, p. 107651, (2023). DOI: https://doi.org/10.1016/j.compag.2023.107651
[10]. N. Dalal and B. Triggs, "Histograms of oriented gradients for human detection" IEEE Computer Society Conference on Computer Vision and Pattern Recognition, (2005).