TỐI ƯU HÓA THU THẬP DỮ LIỆU IOT BẰNG UAV SỬ DỤNG HỌC TĂNG CƯỜNG SÂU ĐA TÁC TỬ VỚI PHÂN PHỐI THỜI GIAN GAUSSIAN

  • Hoàng Trọng Nghĩa
Từ khóa: UAV, IoT, học tăng cường sâu đa tác tử (MADRL), MADDPG, phân công nhiệm vụ, thu thập dữ liệu, điện toán biên, phân phối Gaussian

Tóm tắt

Nghiên cứu này đề xuất một phương pháp mới dựa trên học tăng cường sâu đa tác tử (MADRL), cụ thể là thuật toán Multi-Agent Deep Deterministic Policy Gradient (MADDPG), để giải quyết bài toán phân công nhiệm vụ và tối ưu hóa quỹ đạo bay cho các phương tiện bay không người lái (UAV) trong việc thu thập dữ liệu từ các thiết bị Internet of Things (IoT) phân tán. Mô hình xem xét thời hạn thu thập dữ liệu từ các nút IoT tuân theo phân phối Gaussian và khả năng xử lý dữ liệu tại biên (edge computing) của UAV. Mục tiêu chính là tối thiểu hóa tổng năng lượng tiêu thụ của hệ thống UAV, tối đa hóa số lượng dữ liệu thu thập được và đảm bảo phân bổ nhiệm vụ đồng đều giữa các UAV. Kết quả mô phỏng cho thấy MADDPG vượt trội đáng kể trong việc giảm thiểu tiêu thụ năng lượng và cân bằng tải, đồng thời chỉ ra tiềm năng lớn khi được huấn luyện và tinh chỉnh tối ưu.

điểm /   đánh giá
Phát hành ngày
2025-10-10