SỬ DỤNG DIFFSET ĐỂ KHAI THÁC TẬP ĐÓNG ĐƯỢC GÁN TRỌNG PHỔ BIẾN TRÊN CƠ SỞ DỮ LIỆU SỐ LƯỢNG

  • Trần Như Ý
  • Nguyễn Văn Tùng
  • Ngô Dương Hà

Tóm tắt

Khai thác tập phổ biến đóng vai trò quan trọng trong khai thác luật kết hợp. Đối với cơ sở dữ liệu số lượng, khai thác tập đóng được gán trọng phổ biến (FWCIs) là một trong những phương pháp khai thác tập phổ biến đã được tác giả đề xuất. Tuy nhiên đối với cơ sở dữ liệu dày đặc, thời gian khai thác tập phổ biến (FWCIs) vẫn còn cao. Trong bài báo này, tác giả đề xuất thuật toán sử dụng diffset để khai thác tập đóng được gán trọng phổ biến (FWCIs-DIFF). Dựa trên cơ sở các định lý và tính chất, tác giả đề xuất thuật toán (FWCIs-DIFF). Kết quả thực nghiệm cho thấy, với cơ sở dữ liệu dày đặc thời gian khai thác của (FWCIs-DIFF) là nhanh hơn so với (FWCIs).
Từ khóa: khai thác tập phổ biến, khai thác tập đóng được gán trọng phổ biến, diffset
điểm /   đánh giá
Phát hành ngày
2020-02-28
Chuyên mục
Bài viết