Xây dựng cấu trúc phân tử bằng thuật toán kết hợp K-Nearest Neighbor và cây tìm kiếm K-Dimension

  • Trương Thị Cẩm Mai
  • Nguyễn Trương Thành Hưng
Từ khóa: xây dựng cấu trúc phân tử , học máy , cây tìm kiếm k-dimension , k-nearest neighbors.

Tóm tắt

Việc xây dựng các đặc tính và cấu trúc phân tử đóng một vai trò quan trọng trong nhiều lĩnh vực khác nhau, như khoa học vật liệu, cảm biến, công nghệ nano, thiết kế và khám phá thuốc. Tuy nhiên, việc xây dựng cấu trúc phân tử trên một tập dữ liệu thô, tập dữ liệu bị nhiễu và thiếu thông tin, là một nhiệm vụ đầy thách thức nhưng rất quan trọng. Thuật toán phân loại K-Nearest Neighbors (KNN) là một thuật toán lazy learning, có xu hướng tìm kiếm các điểm gần nhất cho một mục tiêu trong toàn bộ tập huấn luyện. Tuy nhiên, quá trình dự đoán của KNN khá mất thời gian. Trong khi thuật toán cây tìm kiếm K-Dimension (K-D tree) là một cây nhị phân đa chiều, có cấu trúc lưu trữ cụ thể để biểu diễn dữ liệu huấn luyện một cách hiệu quả về mặt thời gian. Từ các khía cạnh trên, trong bài báo này, chúng tôi đã thử nghiệm và đề xuất một phương pháp gọi là thuật toán cây tìm kiếm KNN-KD để xử lý tập dữ liệu thô về cấu trúc phân tử bằng cách kết hợp các ưu điểm của KNN và cây K-D.

điểm /   đánh giá
Phát hành ngày
2022-06-30