EMPIRICAL ANALYSIS OF RGB-IR FEATURE FUSION FOR UAV-BASED OBJECT DETECTION

Nguyễn Thị Lan; Trần Cao Trưởng

Nguyễn Thị Lan Institute of Simulation Technology, Le Quy Don Technical University
Trần Cao Trưởng Institute of Information and Communication Technology, Le Quy Don Technical University

Từ khóa: Phát hiện đối tượng trên ảnh UAV, kết hợp ảnh mức đặc trưng, học sâu, kết hợp ảnh RGB-IR

Tóm tắt

Phát hiện đối tượng dựa trên UAV đóng vai trò quan trọng trong nhiều ứng dụng như giám sát, quản lý thiên tai và hoạt động quân sự. Tuy nhiên, các phương pháp truyền thống thường gặp khó khăn trong điều kiện ánh sáng kém hoặc khi đối tượng bị che khuất. Để khắc phục những hạn chế này, các nghiên cứu gần đây đã tập trung vào việc kết hợp giữa ảnh nhìn thấy (RGB) và ảnh hồng ngoại (IR) nhằm khai thác các ưu điểm bổ sung của hai loại dữ liệu này. Trong số các chiến lược kết hợp ảnh hiện có, kết hợp ở cấp độ đặc trưng (feature-level fusion) nhận được nhiều sự quan tâm nhờ tính linh hoạt trong việc lựa chọn vị trí kết hợp và khả năng tận dụng các mô hình học sâu, dẫn đến hiệu suất thường vượt trội so với phương pháp kết hợp ở cấp độ pixel hoặc cấp độ quyết định. Trong bài báo này, chúng tôi tiến hành phân tích thực nghiệm có hệ thống dưới cùng một framework nhằm đánh giá ảnh hưởng của vị trí kết hợp đặc trưng đến hiệu suất phát hiện. Kết quả thực nghiệm trên bộ dữ liệu DroneVehicle cho thấy: khi thực hiện kết hợp tại một vị trí duy nhất, việc tích hợp ở tầng giữa (middle fusion) mang lại sự cân bằng tối ưu giữa độ chính xác phát hiện và tốc độ suy luận, trong khi chiến lược kết hợp đa vị trí ở giai đoạn early-middle tiếp tục nâng cao độ chính xác định vị đối tượng, dù đi kèm với mức tăng nhẹ về độ phức tạp tính toán.

PHÂN TÍCH THỰC NGHIỆM VIỆC KẾT HỢP ĐẶC TRƯNG CỦA ẢNH RGB-IR TRONG PHÁT HIỆN ĐỐI TƯỢNG TRÊN ẢNH UAV

Tóm tắt

BỘ KHOA HỌC VÀ CÔNG NGHỆ - MINISTRY OF SCIENCE AND TECHNOLOGY OF VIETNAM

CỤC THÔNG TIN, THỐNG KÊ - NATIONAL AGENCY FOR SCIENCE AND TECHNOLOGY INFORMATION AND STATISTICS