Nghiên cứu ứng dụng thuật toán nhận dạng cấu trúc bảng dựa trên phát hiện đối tượng

  • Ngô Đại Dương
  • Hải Hồng Phan
  • Phạm Lê Phương
Từ khóa: Nhận dạng cấu trúc bảng; Nhận dạng ô; Khí tượng thủy văn

Tóm tắt

Nhận dạng cấu trúc bảng là vấn đề quan trọng trong số hóa tài liệu. Với sự phát
triển của các kỹ thuật học sâu hiện nay việc phát hiện bảng đã có nhiều bước tiến lớn, trong
khi đó nhận dạng cấu trúc bảng vẫn gặp rất nhiều khó khăn do cấu trúc bảng phức tạp, đặc
biệt với dữ liệu thực tế. Bài báo này đề xuất một phương pháp ứng dụng mô hình Cascade
mask R–CNN x101FPN deconv để nhận dạng hàng và cột. Bài báo cũng đề xuất sử dụng mô
hình Faster R–CNN để nhận dạng các ô trong bảng, từ đó đưa ra cấu trúc bảng. Thuật toán
đề xuất được đánh giá trên tập dữ liệu phổ biến như TabStructDB và các tài liệu thu thập
được từ các trạm Khí tượng thủy văn. Kết quả thực nghiệm đạt 90% độ chính xác trên các
tập dữ liệu này. Thuật toán có khả năng áp dụng hiệu quả vào việc nhận dạng cấu trúc bảng
của các tài liệu thông thường; đặc biệt thuật toán có khả năng xử lý với các tài liệu lịch sử và
các chữ viết tay, phù hợp với đặc điểm tài liệu của ngành Khí tượng thủy văn. Từ đó góp
phần vào việc số hóa tài liệu, lưu trữ và truy xuất thông tin dữ liệu của ngành Khí tượng thủy
văn.

điểm /   đánh giá
Phát hành ngày
2021-09-18