Đánh giá mô hình DeepLabV3+ sửdụng Backbone ResNet đểtrích xuất tòa nhà từảnh UAV

  • Phạm Trung Dũng
  • Trương Minh Hùng
  • Đoàn Thị Nam Phương
  • Tạ Thị Thu Hường
  • Nguyễn Thị Hà
  • Nguyễn Thị Mến
Từ khóa: DeepLabV3 ,Mô hình học sâu,ResNet,Trích xuất tòa nhà,UA

Tóm tắt

Trích xuất dữ liệu từ ảnh viễn thám, ảnh hàng không và ảnh UAV sử dụng mạng học sâu đang là hướng nghiên cứu thu hút được nhiều sự quan tâm. Tòa nhà là thông tin trung tâm trong quá trình phát triển và quản lý đô thị cũng như các vấn đề dân số và môi trường. Do đó, việc tự động trích xuất tòa nhà trên tư liệu ảnh là vấn đề được đặt ra cho cả nghiên cứu và trong thực tiễn sản xuất. Bài báo trình bày kết quả trích xuất tòa nhàtừ ảnh UAV sử dụng mạng học sâu DeepLabV3+ với (backbone) là cấu trúc mạng phần dư (ResNet) trên bộ mẫu dữ liệu của nhóm nghiên cứu xây dựng. Bộ mẫu dữ liệu tòa nhà gồm 6500 mẫu ảnh có kích cỡ 512 x 512 pixels được xây dựng từ ảnh UAV độ phân giải cao dựatrên sự thay đổi về kiến trúc, hình dạng và phân bố của tòa nhà ở một số tỉnh, thành phố của nước ta. Kết quả chỉ ra rằng độ chính xác dự đoán tòa nhà tính theo chỉ số IoU (tỉ lệ diện tích vùng giao trên vùng hợp) đạt mức 0,774 với backbone ResNet101. Tuynhiên độ chính xác dự đoán tòa nhà từ mô hình chịu ảnh hưởng lớn bởi đặc điểm kiến trúc và phân bố của tòa nhà. Đối với khu vực đô thị mới và khu vực ngoại ô, độ chính xác dự đoán tòa nhà có thể đạt IoU = 0,874 và 0,857. Tuy nhiên độ chính xác này chỉ đạtIoU = 0,762 và 0,673 đối với khu công nghiệp và khu đô thị cũ. Kết quả của nghiên cứu cho phép ứng dụng mô hình mạng học sâu DeepLabV3+ trong trích xuất dữ liệu tòa nhà phục vụ công tác quản lý và phát triển đô thị cũng như các vấn đề dân số và môi trườngở nước t

điểm /   đánh giá
Phát hành ngày
2025-06-04
Chuyên mục
Bài viết