Phát hiện ngoại lai trong chuỗi tọa độ GNSS bằng máy học

  • Nguyễn Đình Huy
  • Trần Đình Trọng
Từ khóa: Chuỗi tọa độ GNSS, Isolation Forest, LOF, Ngoạilai, O-C SVM.

Tóm tắt

Chuỗi tọa độ (position time series) nhận được từ kết quả đo GNSS (Global
Navigation Satellite System) liên tục được ứng dụng trong các nghiên cứu
yêu cầu định vị độ chính xác cao như dịch chuyển mảng kiến tạo, biến dạng
vỏ trái đất,… Ngoại lai hay dịthường (outlier) cần phải loại bỏ trong xửlý số
liệu nói chung, đặc biệt trong phân tích chuỗi tọađộGNSS do chúng làm giảm
độ chính xác khi xác định vịtrí điểm đo và các tham số dịch chuyển của điểm
đo, làm nhiễu kết quả phân tích dữ liệu của chuỗi. Với những ưu điểm vượt
trội so với các phương pháp thống kê, hay phương pháp cửa sổ trượt,…
trong nghiên cứu này, nhóm nghiên cứu sử dụng 3 phương pháp máy học
được đánh giá là tối ưu trong phát hiện ngoại lai là Isolation Forest, OneClass Support Vector Machines (O-C SVM) và Local Outlier Factor (LOF) để
phát hiện ngoại lai chiếm tỉ lệ cao (15%) của chuỗi tọa độ GNSS mô hình
SYNT. Kết quả cho thấy Isolation Forest đạt hiệu suất tốt nhất, với độ chính
xác cao, khả năng tìm ra hầu hết các điểm ngoại lai và diện tích dưới đường
cong ROC gần 1, LOF có hiệu suất kém hơn, trong khi O-C SVM chỉ có độ chính
xác tương đối cao trong việc xác định các điểm bình thường. Kết quả nghiên
cứu góp phần khẳng định ưu điểm vượt trội của các phương pháp máy học
trong việc xử lý số liệu đo GNSS liên tục

điểm /   đánh giá
Phát hành ngày
2024-03-08
Chuyên mục
Bài viết