CẢI TIẾN THUẬT TOÁN K-MEANS VÀ ỨNG DỤNG HỖ TRỢ SINH VIÊN CHỌN CHUYÊN NGÀNH THEO HỌC CHẾ TÍN CHỈ

  • Nguyễn Văn Lễ
  • Mạnh Thiên Lý
  • Nguyễn Thị Định
  • Nguyễn Thị Thanh Thủy

Tóm tắt

K-Means là thuật toán được ứng dụng rất hiệu quả trong nhiều bài toán phân cụm dữ liệu. Nhóm tác giả áp dụng thuật toán này để phân cụm chuyên ngành trên tập dữ liệu điểm số, tuy nhiên thuật toán kém hiệu quả trong một số trường hợp nên độ chính xác không cao. Vì vậy, trong bài báo này, nhóm tác giả đề xuất phương pháp phân cụm trên tập dữ liệu nhóm điểm đặc trưng cho mỗi chuyên ngành. Ngoài ra, cải tiến thuật toán K-Means để loạibỏ phần tử nhiễu nhằm giảm thời gian tính toán của thuật toán. Kết quả phân cụm sẽ hỗ trợ sinh viên Khoa Công nghệ Thông tin, Trường Đại học Công nghiệp thực phẩm Thành phố Hồ Chí Minh lựa chọn chuyên ngành phù hợp.

Từ khóa: K-Means, phân cụm dữ liệu, chọn chuyên ngành, khoảng cách Euclid, trọng tâm.

điểm /   đánh giá
Phát hành ngày
2020-01-03
Chuyên mục
Bài viết