PHÂN LỚP DỮ LIỆU HOA IRIS SỬ DỤNG CÁC THUẬT TOÁN NAÏVE BAYES, RANDOM FOREST VÀ KNN

  • Nguyễn Văn Núi
Từ khóa: Phân lớp dữ liệu; Naïve Bayes; Random Forest; KNN; Iris; Hoa Diên Vĩ

Tóm tắt

Iris (hoa Diên Vĩ) là một loài hoa đẹp, đại diện cho sự may mắn, tình yêu, lòng dũng cảm, trung thành và sự khôn ngoan. Vì vậy việc phân lớp, dự đoán chính xác loài hoa Iris mang lại nhiều ý nghĩa quan trọng trong thực tiễn. Mặc dù đã và đang có rất nhiều công bố khoa học liên quan đến phân lớp, dự đoán loài hoa Iris, tuy nhiên hiệu năng phân lớp, dự đoán của những công bố này vẫn còn tồn tại những hạn chế nhất định cần được nghiên cứu để cải thiện hơn nữa. Trong bài báo này, tác giả đề xuất mô hình phân lớp dữ liệu, dự đoán hoa Iris trên cơ sở ứng dụng bộ công cụ Weka và các thuật toán Naïve Bayes, Random Forest và KNN. Kết quả cho thấy cả 3 thuật toán trên đều cho độ chính xác cao (trên 95%), vì vậy phù hợp để sử dụng cho việc xây dựng mô hình phân lớp dự đoán hoa Iris. Tuy nhiên, 2 thuật toán Random Forest và KNN (k=3) thể hiện sự ổn định và có tính khách quan tốt hơn so với thuật toán Naïve Bayes.

điểm /   đánh giá
Phát hành ngày
2021-08-31
Chuyên mục
Khoa học Tự nhiên - Kỹ thuật - Công nghệ (TNK)