Trường Đại học Khoa học, Đại học Huế
Toán - Công nghệ thông tin - Vật lý - Kiến trúc
SCoTER: MÔ HÌNH CNN-TRANSFORMER TINH GỌN NHẬN DẠNG CẢM XÚC KHUÔN MẶT
https://doi.org/10.64302/joshusc.v31n1e.1335
Trần Thị Kiều, Hồ Phước Tiến
Email: kieutran@husc.edu.vn
Nhận dạng cảm xúc khuôn mặt (Facial Expression Recognition - FER) là một bài toán quan trọng trong thị giác máy tính, đóng vai trò then chốt trong các ứng dụng tương tác người-máy, giám sát hành vi và phân tích cảm xúc trong thời gian thực. Mặc dù các mô hình học sâu hiện nay đã đạt được nhiều tiến bộ, độ phức tạp tính toán cao vẫn là một thách thức lớn khi triển khai trong môi trường thực tế. Để giải quyết hạn chế này, nghiên cứu đề xuất một mô hình nhẹ (lightweight) được phát triển dựa trên ý tưởng của PAtt-Lite, nhằm nâng cao độ chính xác của mô hình đồng thời duy trì độ phức tạp tính toán ở mức hợp lý. Kết quả thực nghiệm cho thấy mô hình đạt 100% độ chính xác trên CK+ và 69% trên FER2013, cao hơn 7% so với mô hình gốc trên FER2013, điều này chứng minh tính hiệu quả và khả năng ứng dụng thực tế của mô hình được đề xuất.
mucluc.pdf
