Dự đoán phân loại của enzyme bằng cách áp dụng kỹ thuật khai thác đồ thị

  • Phạm Quốc Đàm
  • Đỗ Phúc
  • Lê Thị Thanh Mai

Tóm tắt

Trong bài báo này, chúng tôi trình bày cách thức ứng dụng kỹ thuật khai thác dữ liệu để phân rã chuỗi amino acid cấu tạo nên enzyme - thuộc cùng một phân lớp enzyme đã được định danh - thành tập các đồ thị con phổ biến tối đại tương ứng. Các đồ thị con có thể có một đỉnh và cũng có thể có nhiều đỉnh. Khi cần dự đoán có một enzyme mới, thuộc phân lớp enzyme nào, ta chỉ cần phân rã chuỗi amino acid của enzyme đó, rồi so khớp với từng tập đồ thị con phổ biến tối đại, có trong cơ sở dữ liệu. Phân loại enzyme được dự đoán dựa trên phân loại có điểm số cao nhất sau khi so khớp. Việc thử nghiệm được triển khai dựa trên các phân lớp Oxidoreductase EC 1.1.1.1 và Hydrolase EC 3.1.1.3, đã cho kết quả tốt. Qua quá trình thử nghiệm, chúng tôi nhận thấy: khi mở rộng quy mô của tập học, nên chọn tất cả các enzyme đã được định danh. Mục đích của việc chọn lựa này là để tạo nên tập đồ thị con phổ biến tối đại có độ tin cậy cao.
điểm /   đánh giá
Phát hành ngày
2008-09-19
Chuyên mục
BÀI BÁO