MỘT PHƯƠNG PHÁP PHÂN VÙNG DỮ LIỆU THEO ĐỘ TIN CẬY DỰA TRÊN PHÂN CỤM MỜ VIỄN CẢNH

  • Phùng Thế Huân, Hoàng Thị Cành, Phạm Huy Thông
Từ khóa: Phân cụm mờ; Phân cụm bán giám sát mờ; Phân cụm an toàn; Trọng số an toàn; Tập mờ viễn cảnh

Tóm tắt

Phân cụm dữ liệu và các lĩnh vực ứng dụng là một trong những hướng nghiên cứu nhận được nhiều sự quan tâm từ các nhà khoa học trong những năm gần đây. Trong quá trình thu thập dữ liệu, có thể một số dữ liệu có độ tin cậy thấp hơn (sai giá trị, thuộc tính không chính xác, v.v.) tồn tại trong toàn bộ tập dữ liệu. Điều này sẽ làm giảm hiệu suất phân cụm với các nhiễu và ngoại lệ có thể xảy ra. Một số hướng nghiên cứu đã được đưa ra để giải quyết vấn đề này. Thứ nhất, đối với các dữ liệu sai giá trị, sai thuộc tính có thể sử dụng các phương pháp phân cụm bán giám sát mờ an toàn. Thứ hai, đối với các điểm dữ liệu nhiễu có thể sử dụng khái niệm tập mờ viễn cảnh, cho dù đã có một số nghiên cứu liên quan nhằm tăng chất lượng phân cụm, tuy nhiên chỉ dừng lại ở tập mờ truyền thống. Trong bài báo này, chúng tôi đề xuất một phương pháp mới trong phân vùng dữ liệu theo độ tin cậy dựa trên phân cụm mờ viễn cảnh có tên gọi PT2FCM. Thuật toán đề xuất được so sánh thực nghiệm với một số phương pháp liên quan như phân cụm bán giám sát mờ trên tập mờ viễn cảnh (FCPFS), phân cụm bán giám sát mờ an toàn (CS3FCM), v.v. Các kết quả thực nghiệm cho thấy, phương pháp đề xuất có chất lượng phân cụm tốt so với các phương pháp liên quan trong cùng tập dữ liệu.

điểm /   đánh giá
Phát hành ngày
2022-05-31
Chuyên mục
Khoa học Tự nhiên - Kỹ thuật - Công nghệ (TNK)