NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI UNG THƯ THÔNG QUA BIỂU HIỆN GEN TỪ CÁC THÍ NGHIỆM MICROARRAY

  • Do Van Dinh
  • Tran Hoai Linh
  • Dang Thuy Hang
Từ khóa: PCA; DT; MLP; lựa chọn đặc tính; microarray; phân loại.

Tóm tắt

Dữ liệu biểu hiện gen từ các thí nghiệm microarray là một dữ liệu phổ biến cho
chẩn đoán ung thư. Tuy nhiên, điểm đặc biệt của loại dữ liệu này là có rất ít mẫu
trong khi số biểu hiện gen lại lên tới hàng nghìn mẫu nên rất khó để lựa chọn được
các gen có hiệu quả cho việc phân tích. Do đó, giảm chiều dữ liệu là phương pháp
cần thiết trước khi dữ liệu đưa vào phân tích và phân tích thành phần cơ bản (PCA)
là phương pháp được sử dụng để giảm chiều dữ liệu đầu vào. Trong bài báo này, có
thể nhận thấy không phải phải thành phần dữ liệu đầu tiên là các thành phần dữ
liệu tốt nhất do đo cần phải sử dụng thêm phương pháp lựa chọn đặc tính sau khi
giảm chiều dữ liệu để chọn ra các đặc tính tốt nhất cho việc phân loại. Vì vậy, chúng
tôi đề xuất sử dụng PCA để giảm chiều dữ liệu sau đó dùng thuật toán cây quyết
định (DT) để lựa chọn ra các đặc tính phù hợp nhất và mạng MLP để phân loại dữ
liệu. Các kết quả đạt được cho thấy đề xuất của chúng tôi cho hiệu quả tốt.

điểm /   đánh giá
Phát hành ngày
2023-03-31
Chuyên mục
KHOA HỌC-CÔNG NGHỆ