PHƯƠNG PHÁP XÂY DỰNG VECTOR ĐẶC TRƯNG DỰA TRÊN CHUYỂN ĐỐI CẤU TRÚC VÀ THỐNG KÊ CHUỖI TRUY VẤN TRONG MÔ HÌNH NHẬN DẠNG BẤT THƯỜNG TƯỜNG LỬA ỨNG DỤNG WEB
Tóm tắt
Ngày nay, internet đã trở nên phổ biến, cùng với sự phát triển mạnh mẽ công nghệ điện toán đám mây, IoT và điện thoại thông minh đã thúc đẩy sự gia tăng nhanh chóng của ứng dụng phát triển trên nền tảng web. Để bảo vệ các ứng dụng web, hệ thống phát hiện/ngăn chặn xâm nhập trái phép được phát triển được gọi là tường lửa ứng dụng web (WAF). Chức năng nhận dạng tấn công trên WAF thường được phân loại thành hai phương pháp là dựa trên quy tắc và bất thường. Mô hình dựa trên bất thường về lý thuyết có thể nhận dạng các truy vấn độc hại chưa được biết đến bằng cách quan sát các dữ liệu truy vấn. Trong nghiên cứu này, chúng tôi đề xuất phương pháp xây dựng vector đặc trưng bằng cách chuyển đổi cấu trúc và thống kê các thành phần của chuỗi truy vấn. Sau đó, vector đặc trưng sẽ là đầu vào cho các thuật toán phân loại không giám sát để nhận dạng truy vấn bất thường. Kết quả thử nghiệm với thuật toán K-means, DBSCAN, Isolation Forest cho thấy DBSCAN có độ chính xác cao nhất (Accuracy>96%, F1-Score >97%), ngay cả đối với ứng dụng web dễ nhận dạng nhầm như xác thực và đăng ký. Tính hiệu quả của phương pháp là sử dụng dữ liệu không cần dán nhãn trước nên giúp việc triển khai trên WAF dễ dàng hơn.