Mô phỏng nồng độ bụi PM2.5 tại khu vực trung tâm Thành phố Hồ Chí Minh bằng thuật toán học máy và học sâu

  • Nguyễn Phúc Hiếu
  • Nguyễn Nhật Dương
  • Đỗ Quang Lĩnh
  • Đào Nguyên Khôi
Từ khóa: Bụi PM2.5; Học máy; Học sâu; TP. Hồ Chí Minh.

Tóm tắt

Nghiên cứu áp dụng ba thuật toán học máy Random Forest Regression (RFR)XGBoost Regression (XGBR), Multilayer Perceptron Regression (MLPR) và một thuật toán học sâu Convolutional Neural Network (CNN) để mô phỏng nồng độ bụi PM2.5 tại khu vực trung tâm Thành phố Hồ Chí Minh. Bộ dữ liệu được sử dụng trong nghiên cứu là dữ liệu ngày trong giai đoạn từ 2016-2021 bao gồm nồng độ bụi PM2.5 thu thập từ trạm Lãnh Sự Quán Mỹ và sáu thông số khí tượng bao gồm nhiệt độ trung bình, hướng gió, tốc độ gió, độ ẩm, số giờ nắng và lượng mưa tại trạm Tân Sơn Hòa. Bộ dữ liệu được chuẩn hóa và phân chia với tỷ lệ 80:20 phục vụ quá trình huấn luyện và kiểm tra các thuật toán. Sau đó, sáu kịch bản các thông số đầu vào khác nhau được xây dựng dựa trên kết quả phân tích tương quan riêng phần giữa các thông số khí tượng với nồng độ bụi PM2.5. Kết quả nghiên cứu cho thấy cả ba thuật toán học máy đều có khả năng mô phỏng tốt nồng độ PM2.5 với giá trị hệ số tương quan r dao động trong khoảng 0,770 đến 0,854, trong đó thuật toán XGBR với sáu thông số khí tượng đầu vào cho hiệu quả mô phỏng tốt nhất với r = 0,854, IOA = 0,922 và NMB = 6,711. Bên cạnh đó, kết quả mô phỏng nồng độ PM2.5của thuật toán CNN là chưa đạt với giá trị r nhỏ hơn 0,5 ở tất cả kịch bản mô phỏng.

điểm /   đánh giá
Phát hành ngày
2024-04-01