SỬ DỤNG MẠNG CNN TRÍCH RÚT ĐẶC TRƯNG LIÊN QUAN ĐẾN CÁC TIN NHẮN KHẨN CẤP TRÊN MẠNG XÃ HỘI

  • Đào Nam Anh, Nguyễn Quỳnh Anh*, Lê Mạnh Hùng
Từ khóa: Đặc trưng ảnh; Trích rút đặc trưng; Xử lý ngôn ngữ; Mạng CNN; Mạng xã hội

Tóm tắt

Từ các thông tin trên các trang mạng xã hội, bài toán phân tích xác định nội dung là thật hay giả là một vấn đề cần nghiên cứu trong xử lý ngôn ngữ tự nhiên (NLP). Bài báo trình bày một phương pháp để phân loại trường hợp cấp thiết trong các tin nhắn trên Tweeter. Nhóm nghiên cứu dựa vào biểu diễn các đặc trưng văn bản bằng các mẫu hình ảnh thay vì sử dụng các đặc trưng text được trích xuất trực tiếp từ tin nhắn văn bản.  Trong các kỹ thuật xử lý ngôn ngữ tự nhiên, các đặc trưng text thường trích chọn dựa trên việc phân đoạn hoặc phân tích thống kê tần suất xuất hiện của các từ khóa trong các tin nhắn văn bản. Để làm tăng độ chính xác của việc phân lớp nhóm nghiên cứu đã cài đặt một phương pháp dựa trên nhận dạng các mẫu ảnh. Việc chuyển từ đặc trưng text thành ảnh cho phép áp dụng các phép toán tích chập để nhận dạng các mẫu. Điều này mở ra một sự kết hợp giữa NLP và phân tích hình ảnh. Bài báo sử dụng mạng nơ ron tích chập (CNN) thực hiện với các mẫu ảnh để phân lớp các câu. Nghiên cứu cũng được so sánh với các phương pháp khác để đánh giá trong phần mô phỏng so sánh của nghiên cứu đề xuất.

điểm /   đánh giá
Phát hành ngày
2022-08-04
Chuyên mục
Khoa học Tự nhiên - Kỹ thuật - Công nghệ (TNK)