Nhận diện quả xoài chín qua hình ảnh với mô hình EBM

Hoàng Huy Lê *

Abstract

Vietnam is a major mango exporter; however, the classification of mango ripeness is still primarily done manually, which is time-consuming and prone to errors. Previous deep learning models such as CNN and ResNet have been applied, but they still face limitations in terms of stability and generalization. This paper proposes the Energy-Based Model (EBM) — a novel machine learning approach capable of directly modeling the relationship between images and labels through an energy function. The model is built upon features extracted from ResNet101 and incorporates YOLO during the preprocessing stage to enhance the accuracy of mango ripeness detection. Experimental evaluations were conducted on a combined dataset derived from the Mango and Banana Dataset and the Mango Grading Dataset, totaling over 5,000 mango images. Results demonstrate the model’s strong potential for deployment in automated agricultural product classification systems.

Keywords: Energy-Based Model, EBM, Deep learning, Image recognition, Mango

Tóm tắt

Việt Nam là quốc gia xuất khẩu xoài lớn, tuy nhiên quá trình phân loại xoài chín vẫn chủ yếu thủ công, gây tốn thời gian và dễ sai sót. Trước đây, các mô hình học sâu như CNN, ResNet đã được áp dụng nhưng vẫn hạn chế về độ ổn định và khả năng tổng quát. Bài báo này đề xuất mô hình Energy-Based Model (EBM) – một hướng tiếp cận học máy mới có khả năng mô hình hóa mối quan hệ giữa ảnh và nhãn một cách trực tiếp thông qua hàm năng lượng. Mô hình được xây dựng dựa trên đặc trưng trích xuất từ ResNet101 kết hợp với YOLO trong giai đoạn tiền xử lý, giúp tăng độ chính xác trong phân loại xoài chín qua ảnh. Kết quả thực nghiệm trên hai tập dữ liệu gồm Mango and Banana Dataset và Mango Grading Dataset với hơn 5.000 ảnh xoài cho thấy tiềm năng lớn của mô hình trong các hệ thống phân loại nông sản tự động.

Từ khóa: Energy-Based Model, EBM, Deep learning, Nhận diện hình ảnh, Xoài.

Tài liệu tham khảo

[1] T. H. Nguyen, T. T. Bui, and N. T. Tran, “Phát hiện và nhận dạng khuyết điểm trên vỏ trái xoài,” Hội nghị quốc gia lần thứ 14 về nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), pp. 449–455, 2021.

[2] N. T. Dang, “Thiết lập mô hình phân loại trái xoài sử dụng công nghệ xử lý ảnh,” Trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, 2021.

[3] H. M. Tran, “Thiết kế hệ thống phân loại xoài tự động,” Tạp chí Khoa học và Công nghệ – Đại học Công nghiệp Hà Nội, vol. 64, no. 2, pp. 45–51, 2022.

[4] Y. LeCun et al., "A Tutorial on Energy-Based Learning," in Predicting Structured Data, MIT Press, 2006.

[5] R. Kumar et al., "Deep Energy-Based Models for Computer Vision," IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2021.

[6] Z. Tu et al., "Energy-Based Learning for Scene Understanding," International Journal of Computer Vision, vol. 128, pp. 2435-2462, 2020.

[7] Nguyễn Văn B., "Ứng dụng Deep Learning trong nhận dạng và phân loại nông sản," Tạp chí Khoa học Công nghệ Việt Nam, số 5, tr. 45-52, 2023.

[8] D. Grattarola and C. Alippi, "Graph Neural Networks in TensorFlow and Keras with Spektral," IEEE

[9] F. Scarselli, Y. LeCun, "Energy Based Models in Deep Learning," Annual Review of Control, Robotics, and Autonomous Systems, 2022.

[10] Du, Y., & Mordatch, I., "Implicit Generation and Modeling with Energy-Based Models," NeurIPS, 2019.

[11] Grathwohl et al., "Your Classifier is Secretly an Energy Based Model and You Should Treat it Like One," ICLR, 2020.

[12] Naseer et al., "Fruit Recognition Using Deep Learning: A Review," Computers and Electronics in Agriculture, 2023.

[13] Liu et al., "Mango Ripeness Classification Using RGB Images and Convolutional Neural Networks," IEEE Access, 2022.

[14] Zheng et al., "On the Learning Dynamics of Deep Energy-Based Models," ICML, 2021.

[15] Nijkamp et al., "Learning Energy-Based Models by Diffusion Recovery Likelihood," ICLR, 2021.

[16] Gonzalez, R. C., & Woods, R. E., "Digital Image Processing," 4th Edition, Pearson, 2018.

[17] Mureșan, H., & Oltean, M., "Fruit Recognition from Images Using Deep Learning," Acta

[18] Nguyễn Văn A., "Nghiên cứu phương pháp nhận dạng trái cây tự động dựa trên học sâu," Tạp chí Khoa học Công nghệ Việt Nam, 2023.

[19] D. Kingma et al., "A Survey of Energy-Based Models," Technical Report, OpenAI, 2021.

Số

Chuyên mục

Các bài báo