MỘT PHƯƠNG PHÁP PHÂN LỚP CHO BÀI TOÁN TÌM KIẾM ẢNH DỰA TRÊN THUẬT TOÁN k-NN

  • Huỳnh Thị Châu Lan
  • Lê Hữu Hà
  • Nguyễn Hải Yến
Từ khóa: Từ khóa: k-NN, phân lớp, túi từ, ảnh tương tự, độ đo tương tự.

Tóm tắt

Trong bài báo này, một tiếp cận phân lớp dữ liệu được thực hiện nhằm áp dụng cho bài toán tìm kiếm ảnh tương tự qua đặc trưng thị giác túi từ BoVW (Bag of Visual Words). Phương pháp phân lớp được thực hiện dựa trên thuật toán k-NN (k-Nearest Neighbor) với dữ liệu đầu vào là một véc-tơ đặc trưng của hình ảnh. Từ một tập dữ liệu ảnh ban đầu, chúng tôi xây dựng một cấu trúc túi từ thị giác lưu trữ các hình ảnh có đặc trưng tương đồng theo nội dung. Dựa trên việc phân lớp một hình ảnh đầu vào theo phương pháp k-NN, một tập các hình ảnh được trích xuất từ cấu trúc túi từ thị giác. Trong phương pháp k-NN, ngoài k phần tử láng giềng gần nhất thì một bán kính được sử dụng để thống kê các phân lớp của hình ảnh. Mỗi một túi từ chứa nhiều hình ảnh tương đồng về nội dung và có nhiều phân lớp ngữ nghĩa khác nhau; đồng thời, mỗi túi từ liên kết đến các túi từ khác qua phân lớp ngữ nghĩa đại diện. Thực nghiệm được xây dựng trên bộ ảnh COREL (1.000 ảnh) nhằm đánh giá độ chính xác đồng thời so sánh với các công trình khác trên cùng bộ dữ liệu. Theo kết quả thực nghiệm, những đề xuất của nhóm tác giả là hiệu quả và có thể áp dụng trong các hệ thống đa phương tiện khác nhau.

điểm /   đánh giá
Phát hành ngày
2021-03-02
Chuyên mục
Bài viết