Khớp ngữ nghĩa sử dụng học máy

Nguyen Thai Kiet; Tran Van Thien

Nguyen Thai Kiet
Tran Van Thien

Từ khóa: jaccard, khoảng cách levenshtein, máy học, Word2Vec

Tóm tắt

Ontology matching (khớp nối ontology)bằng học máy là một lĩnh vực trong quản lý dữ liệu và truy xuất thông tin, hỗ trợ tích hợp và liên kết các nguồn dữ liệu khác nhau bằng cách xác định các tương đương và mối quan hệ giữa các khái niệm trong các ontology khác nhau. Báo cáo này cung cấp tổng quan về các kỹ thuật và phương pháp chính trong khớp nối ontologies, bao gồm vector hóa và nhúng như Word2Vec, các phép đo độ tương đồng như khoảng cách Levenshtein và chỉ số Jaccard, cùng với các phương pháp khác. Ngoài ra, các mô hình học máy được áp dụng để cải thiện độ chính xác trong phân loại và khớp nối khái niệm, với các bài toán phân loại và hồi quy giúp phân loại các cặp khái niệm dựa trên đặc trưng số. Nhiều cây quyết định được sử dụng để xử lý dữ liệu không đồng nhất và giảm thiểu hiện tượng quá khớp, cung cấp các phương pháp mạnh mẽ để dự đoán sự tương đương giữa các khái niệm với khả năng xử lý các mối quan hệ phi tuyến tính. Mặc dù khớp nối ontologies có nhiều ứng dụng đa dạng, từ tích hợp dữ liệu đến tìm kiếm thông minh, nhưng lĩnh vực này vẫn đối mặt với các thách thức như sự khác biệt về ngữ nghĩa và độ phức tạp của dữ liệu. Báo cáo này nêu bật các xu hướng nghiên cứu và công nghệ mới nổi, cùng với những phát triển tiềm năng trong tương lai.

Khớp ngữ nghĩa sử dụng học máy

Tóm tắt

BỘ KHOA HỌC VÀ CÔNG NGHỆ - MINISTRY OF SCIENCE AND TECHNOLOGY OF VIETNAM

CỤC THÔNG TIN, THỐNG KÊ - NATIONAL AGENCY FOR SCIENCE AND TECHNOLOGY INFORMATION AND STATISTICS