XÂY DỰNG HỆ THỐNG ĐÁNH GIÁ NHÀ HÀNG TRÊN ĐỊA BÀN TỈNH THỪA THIÊN HUẾ DỰA VÀO CÁC BÌNH LUẬN TRỰC TUYẾN
Tóm tắt
Các hệ thống khai phá quan điểm tiếng Việt dựa trên phương pháp từ vựng thông thường sử dụng bộ từ điển VietSentiWordNet. Tuy nhiên, bộ từ điển dữ liệu này áp dụng cho miền tin tức nên khi sử dụng để phân lớp trong lĩnh vực du lịch sẽ đạt hiệu quả không cao và dễ gây nhầm lẫn. Mục tiêu của bài báo này nhằm xây dựng hệ thống đánh giá nhà hàng đạt hiệu quả phân lớp cao trong lĩnh vực du lịch. Để xây dựng hệ thống, chúng tôi sử dụng phương pháp khai phá quan điểm dựa trên từ vựng kết hợp với bộ từ điển quan điểm tiếng Việt thuộc lĩnh vực du lịch VietSentiWordNetPlus. Ngoài ra, chúng tôi còn áp dụng các kỹ thuật tiền xử lý dữ liệu cho các câu bình luận để tăng ngữ nghĩa cho câu. Kết quả thực nghiệm cho thấy, hệ thống của chúng tôi đã cho kết quả phân lớp quan điểm tốt hơn, với trung bình độ chính xác tổng quát, độ chính xác, độ đầy đủ và độ đầy đủ điều hòa lần lượt là 84,64%; 76,39%; 81,12%; 78,15% so với 71,76%; 63,64%; 68,72%; 63,82% của hệ thống sử dụng bộ từ điển VietSentiWordNet. Hệ thống của chúng tôi đạt hiệu quả cao khi phân lớp quan điểm với nguồn dữ liệu thuộc lĩnh vực du lịch như: nhà hàng, khách sạn, điểm du lịch.