MỘT THUẬT TOÁN ĐỊNH TUYẾN CẢI THIỆN ĐỘ TRỄ TRONG MẠNG MANET SỬ DỤNG HỌC TĂNG CƯỜNG
Nguyễn Quốc Cường, Lê Hữu Bình, Võ Thanh Tú
Ứng dụng của học tăng cường vào các giao thức định tuyến trong mạng MANET nhận được sự quan tâm của nhiều nhóm nghiên cứu trong thời gian gần đây. Đặc điểm chính của MANET là tính di động cao, dẫn đến tô-pô mạng thay đổi thường xuyên. Vì vậy, việc ứng dụng học tăng cường để tính toán bảng định tuyến tại mỗi nút sao cho hiệu quả nhất là một thách thức lớn. Bài báo này, chúng tôi đề xuất một thuật toán định tuyến sử dụng học tăng cường nhằm nâng cao hiệu năng mạng. Trong đó chúng tôi xây dựng hàm thưởng cho thuật toán Q-Learning có xem xét đến tải lưu lượng và chi phí khoảng cách đến nút đích để chọn tuyến đường ngắn nhất, tránh tắc nghẽn và giảm thiểu độ trễ. Kết quả mô phỏng cho thấy thuật toán đề xuất đã cải thiện được tỉ lệ gửi gói dữ liệu thành công, thông lượng mạng và độ trễ đầu-cuối so với thuật toán AODV.