Dự đoán khả năng sạt lở đất ở Việt Nam bằng các thuật toán học máy

Phạm Trọng Huynh

Phạm Trọng Huynh

Từ khóa: Sạt lở đất; Học máy; Hồi quy; Rừng ngẫu nhiên; K- láng giềng.

Tóm tắt

Việt Nam là quốc gia có địa hình đồi núi dốc và nằm trong vùng mưa nhiệt đới gió mùa, vì vậy hiện tượng sạt lở đất diễn ra khá phổ biến. Nghiên cứu này tập trung vào việc dự đoán khả năng sạt lở đất ở Việt Nam bằng các thuật toán hồi quy, Random Forest (RF), Extreme Gradient Boosting (XGBoost), K-Nearest Neighbor regression (KNN), Linear Support Vector Regressor (SVR), và Linear Regression (LR). Các biến đặc trưng có liên quan đến sạt lở đất được sử dụng, bao gồm độ ẩm đất, địa chấn động đất, lượng mưa, độ cao và độ dốc. Các thuật toán được huấn luyện trên tập dữ liệu mẫu để đánh giá hiệu suất của chúng. Kết quả nghiên cứu cho thấy thuật toán Random Forest (RF) có thể dự đoán tốt khả năng sạt lở đất. Kết quả dự đoán từ tập huấn luyện và tập kiểm tra, với hệ số xác định R² có giá trị cao nhất 0,85, thể hiện khả năng giải thích biến động dữ liệu tốt. Bên cạnh đó các giá trị (MSE) và (RMSE) thấp nhất lần lượt là 150,21 và 12,25. Các thuật toán khác cũng cho kết quả tương đối tốt, nhưng (RF) vượt trội hơn. Điều đó cho thấy cần kết hợp năm thuật toán này lại với nhau để xử lý một lượng lớn các dữ liệu có độ phức tạp cao, nhằm tạo ra một mô hình dự đoán sạt lở đất ở Việt Nam bằng các thuật toán Học máy có tính ổn định, chính xác.

Dự đoán khả năng sạt lở đất ở Việt Nam bằng các thuật toán học máy

Tóm tắt

BỘ KHOA HỌC VÀ CÔNG NGHỆ - MINISTRY OF SCIENCE AND TECHNOLOGY OF VIETNAM

CỤC THÔNG TIN, THỐNG KÊ - NATIONAL AGENCY FOR SCIENCE AND TECHNOLOGY INFORMATION AND STATISTICS