Các phương pháp chuẩn hóa dữ liệu thủy văn áp dụng cho trạm 74129 - Yên Bái

  • Đặng Văn Nam
  • Hoàng Quý Nhân
  • Ngô Văn Mạnh
  • Nguyễn Thị Hiền
Từ khóa: Mực nước , ngoại lai , dữ liệu thiếu , chuỗi thời gian.

Tóm tắt

Dữ liệu mực nước (water level) tại các trạm trên sông hiện nay chủ yếu được thu thập bằng phương pháp quan trắc thủ công với tần suất thu thập khác nhau tùy thuộc vào từng thời điểm trong năm. Các dữ liệu này cần phải được làm sạch để loại bỏ các điểm bất thường (Outliers), các giá trị thiếu (Missing values), chuẩn hóa về dạng chuỗi thời gian (Time series)…. Trong nội dung của bài báo này, nhóm tác giả sẽ chỉ ra hiện trạng của dữ liệu mực nước thu thập được tại trạm 74129 - Yên Bái trong giai đoạn 9 năm từ 01/01/2011 đến 31/12/2019; Đây là các dữ liệu thực tế, được cung cấp bởi Trung tâm thông tin và Dữ liệu khí tượng thủy văn. Trên cơ sở hiện trạng của tập dữ liệu này, sẽ tiến hành thực nghiệm các phương pháp làm sạch dữ liệu để loại bỏ ngoại lai, thay thế giá trị thiếu bằng phương pháp nội suy và chuẩn hóa dữ liệu về dạng chuỗi thời gian với khoảng thời gian cách đều nhau 3h. Dữ liệu sau khi đã được chuẩn hóa, làm sạch, đảm bảo tính đầy đủ và độ tin cậy sẽ là yếu tố quyết định tới độ chính xác của các mô hình dự đoán, dự báo.

điểm /   đánh giá
Phát hành ngày
2021-08-12