Phương pháp nhận diện mẫu sử dụng mô hình túi từ và mạng nơron

  • Nguyễn Toàn Thắng
  • Đinh Xuân Lâm
Từ khóa: bộ mô tả đối tượng, mạng nơron, mô hình túi từ, nhận diện cử chỉ, nhận diện mẫu.

Tóm tắt

Mục đích của bài báo là xây dựng một thuật toán nhận diện cử chỉ tay trong các khung hình thu trực tiếp từ camera theo thời gian thực. Thuật toán đề xuất sử dụng mô hình túi từ (bag-of-features, bag-of-words), bộ mô tả đối tượng SURF, phương pháp phân cụm k-means, kết hợp với phương pháp phân lớp bằng mạng nơron. Trong đó, mô hình túi từ kết hợp với SURF và k-means được sử dụng để tạo ra các vectơ đặc trưng làm dữ liệu đầu vào cho mạng nơron. Thuật toán được huấn luyện và thử nghiệm với các bộ dữ liệu ảnh tự tạo. Các thí nghiệm cho thấy, thuật toán đề xuất đảm bảo được tốc độ xử lý cao (dưới 40 ms cho mỗi khung hình) để có thể thực hiện trong thời gian thực với dữ liệu thu trực tiếp từ một camera, có tính bền vững với một số dạng biến đổi của đối tượng (xoay hình, thay đổi kích thước và vị trí trong khung hình), đồng thời đảm bảo độ chính xác nhận diện cao (~ 90%).

Tác giả

Nguyễn Toàn Thắng

Trường Đại học Công nghệ thông tin và Truyền thông, Đại học Thái Nguyên

Đinh Xuân Lâm

Trường Đại học Công nghệ thông tin và Truyền thông, Đại học Thái Nguyên

điểm /   đánh giá
Phát hành ngày
2022-11-14