Xây dựng cơ sở dữ liệu liên kết mở cho thông tin du lịch ở Đồng bằng sông Cửu Long bằng cách trích xuất dữ liệu từ website và Wikipedia
Tóm tắt
Trong thời đại phát triển ngày nay, du lịch là một trong những ngành công nghiệp phát triển và sôi động nhất trên toàn cầu. Rất nhiều ứng dụng tìm kiếm thông tin du lịch được xây dựng để hỗ trợ du khách, giúp họ chuẩn bị và lập kế hoạch cụ thể cho chuyến đi của mình. Dữ liệu du lịch rất đa dạng và phong phú, nhưng lại phân tán và nằm rải rác trên nhiều nền tảng khác nhau, đặc biệt là nội dung không được liên kết về mặt ngữ nghĩa. Bài báo này đề xuất phương pháp xây dựng cơ sở dữ liệu liên kết mở (LOD) cho thông tin du lịch ở Đồng bằng sông Cửu Long, sử dụng dữ liệu từ các trang web du lịch và Wikipedia. Dữ liệu được trích xuất và liên kết bằng các kỹ thuật khai thác dữ liệu và ngôn ngữ mô tả tài nguyên (RDF). Nghiên cứu nhằm mục đích cải thiện việc truy xuất thông tin du lịch thông qua việc ứng dụng công nghệ dữ liệu liên kết mở, tạo ra nguồn thông tin phong phú và dễ tiếp cận cho người dùng. Kết quả không chỉ có lợi cho ngành du lịch mà còn có thể ứng dụng trong các lĩnh vực như nghiên cứu văn hóa, sinh thái và quản lý tài nguyên.