GIẢI PHÁP PHÂN LOẠI CHỦ ĐỀ TỰ ĐỘNG CHO BẢN TIN THỜI SỰ TRUYỀN HÌNH BẰNG KỸ THUẬT HỌC MÁY

  • Nguyễn Tấn Phú
  • Lâm Thanh Toản
  • Từ Thái Bảo
Từ khóa: Học máy, Phân loại video, Trích xuất đặc trưng, Xử lý ngôn ngữ tự nhiên

Tóm tắt

Phân loại video bằng học máy trở thành một lĩnh vực tiềm năng, giúp tự động nhận dạng và phân loại vào các danh mục tương ứng. Quá trình này bắt đầu bằng việc tiền xử lý dữ liệu video để trích xuất và chuyển đổi thông tin thành đặc trưng số học. Đặc biệt, các thuật toán học máy như KNN, SVM, CNN và PhoBERT được sử dụng để xử lý và phân tích nội dung video cũng như thông tin ngôn ngữ trong video. Trong thực nghiệm, dữ liệu được thu thập từ hệ thống lưu trữ nội bộ của Đài Phát thanh và Truyền hình thành phố Cần Thơ, với mỗi video có độ dài trung bình khoảng 3 phút. Các thuật toán đã được triển khai và đánh giá trên tập dữ liệu này để đo lường và so sánh hiệu suất. Kết quả của thuật toán PhoBERT, với độ chính xác đạt tới 98%. Từ kết quả cho thấy khả năng vượt trội của PhoBERT trong việc xử lý và nhận dạng nội dung video, tạo điều kiện thuận lợi cho việc phát triển hệ thống phân loại video tự động.

điểm /   đánh giá
Phát hành ngày
2024-05-27
Chuyên mục
Khoa học Kỹ thuật - Công nghệ