HỒI QUY LASSO VÀ ỨNG DỤNG TRONG PHÂN TÍCH DỮ LIỆU UNG THƯ VÚ

  • Nông Quỳnh Vân, Trần Đình Hùng
Từ khóa: Hồi quy; Bình phương tối thiểu; LASSO; Chính quy hóa L1; Hồi quy phạt; Ung thư vú

Tóm tắt

Hồi quy LASSO là một trong những phương pháp hồi quy phạt được đề xuất bởi Tibshirani vào năm 1996. Mục tiêu của LASSO là lựa chọn và ước lượng tham số trong mô hình hồi quy tuyến tính bằng cách hiệu chỉnh một số hệ số bằng 0. Đặc biệt, LASSO rất hữu ích trong việc phân tích dữ liệu gen, trong đó số lượng yếu tố dự báo (gen) lớn hơn nhiều so với số lượng quan sát mẫu (số bệnh nhân). Trong bài báo này, chúng tôi sẽ hệ thống lại các kiến thức cơ bản về hồi quy LASSO và áp dụng phương pháp LASSO cho nghiên cứu gen ở bệnh nhân ung thư vú. Mục tiêu của chúng tôi là xác định gen nào ảnh hưởng đến mức độ nghiêm trọng của ung thư vú theo dữ liệu microarray. Kết quả cho thấy, LASSO hoạt động tương đối tốt trong phân tích mức độ biểu hiện gen và chỉ ra được những gen có liên quan tới gen gây ung thư vú BRC1 là các gen NBR2, AASDH, KIAA2013, VPS25, NBR1, SEC22C, RPL27, CBLN3, KHDRBS1, XRCC2. Trên thực tế, gen NBR2 tiếp giáp với BRCA1 trên nhiễm sắc thể 17 và hai gen này có chung một vùng gen khởi động. Như vậy, tiên lượng ung thư vú xác định bằng hồi quy sẽ giúp chúng ta hiểu rõ hơn về cơ chế tiềm ẩn sự xuất hiện của ung thư vú đối với phụ nữ còn trẻ.

điểm /   đánh giá
Phát hành ngày
2022-05-31
Chuyên mục
Khoa học Tự nhiên - Kỹ thuật - Công nghệ (TNK)