Phương pháp phân lớp SVM ứng dụng trong tin sinh học
Tóm tắt
Phương pháp phân lớp sử dụng máy vec-tơ hỗ trợ SVM (support vector machine) là một phương pháp nổi tiếng dựa trên việc cực đại hóa dải biên phân lớp (max margin classification) và việc lựa chọn các hàm nhân (kernel) phù hợp. Phương pháp này được sử dụng rộng rãi để giải quyết nhiều
bài toán của tin sinh học do tính hiệu quả, độ chính xác cao, và khả năng xử lý đối với các bộ dữ liệu lớn. Trong bài viết này, chúng tôi giới thiệu những vấn đề cơ bản của kỹ thuật phân lớp sử dụng SVM, đồng thời giới thiệu một bộ công cụ phần mềm SVM cho bài toán phân lớp. Sau đó, trình bày một số thành công trong ứng dụng SVM cho một vài bài toán Tin sinh học, cụ thể là bài toán phát hiện vị trí cắt-nối (splice site detection) và bài toán phân lớp biểu hiện gene (gene expression classification).