NHẬN DIỆN SAI SÓT BÁO CÁO TÀI CHÍNH BẰNG HỌC MÁY: NGHIÊN CỨU THỰC NGHIỆM TẠI THỊ TRƯỜNG VIỆT NAM
Tóm tắt
Nghiên cứu này tập trung nhận diện sai sót trọng yếu trong báo cáo tài chính của các doanh nghiệp niêm yết tại Việt Nam thông qua ứng dụng học máy. Bài viết khai thác dữ liệu tài chính và phi tài chính từ nền tảng FiinPro giai đoạn 2016 - 2023, sử dụng hồi quy LASSO để chọn lọc 33 biến đầu vào. Ba mô hình dự đoán được áp dụng gồm hồi quy logistic, rừng ngẫu nhiên và XGBoost, với kỹ thuật xác thực chéo k-fold (k=10). Kết quả cho thấy, các mô hình học máy vượt trội hơn thống kê truyền thống, đặc biệt mô hình rừng ngẫu nhiên đạt độ chính xác 81,55% và F1-score 73,38%. Nghiên cứu khẳng định hiệu quả của việc kết hợp dữ liệu sẵn có với thuật toán học máy trong phát hiện sai sót báo cáo tài chính, đồng thời đề xuất hướng mở rộng tích hợp thêm biến phi tài chính và chuyên môn kế toán nhằm nâng cao khả năng phát hiện trong tương lai.