PHÂN TÍCH THÀNH PHẦN CHÍNH - PHƯƠNG PHÁP TRÍCH RÚT ĐẶC TRƯNG HỮU HIỆU TRONG KHÔNG GIAN CÓ SỐ CHIỀU LỚN

  • Nguyễn Phương Nga

Tóm tắt

Khi xử lý các bài toán trong thực tế ta thường gặp tập mẫu có số chiều mô tả lớn. Hơn nữa, trong tập mẫu có thể chứa các thuộc tính chứa ít thông tin hữu dụng, các thuộc tính tương tác lẫn nhau. Điều đó làm cho việc xử lý gặp rất nhiều khó khăn. Vấn đề đặt ra là phải trích rút được các đặc trưng từ  tập thuộc tính mô tả tập dữ liệu mẫu đó,  phục vụ cho việc phát hiện tri thức. Trong bài báo này chúng tôi chỉ ra rằng phân tích thành phần chính (PCA-Principal Component Analysis) là một phương pháp hiệu quả, thực hiện công việc này trong trường hợp không gian bài toán lớn. Kết quả thực nghiệm với bài toán dự báo hoạt tính  sinh học dựa trên tập mẫu PDGFR (platelet derived growth factor receptor) Inhibitors đã chứng tỏ hiệu quả của phương pháp.

điểm /   đánh giá
Phát hành ngày
2012-05-07
Chuyên mục
KHOA HỌC-CÔNG NGHỆ