MÔ HÌNH BIỂU DIỄN VĂN BẢN THÀNH ĐỒ THỊ
Tóm tắt
Biểu diễn văn bản là một bước tiền xử lý rất quan trọng trong nhiều lĩnh vực như khai thác dữ liệu văn bản, truy vấn thông tin, xử lý ngôn ngữ tự nhiên. Bài báo này trình bày tổng quan mô hình biểu diễn văn bản thành đồ thị. Mô hình đồ thị có thể giữ lại các thông tin cấu trúc như vị trí, thứ tự xuất hiện và sự gần nhau của từ, trong khi chúng bị loại bỏ trong mô hình không gian vectơ truyền thống. Chúng tôi xây dựng thử nghiệm hệ thống phân lớp văn bản tiếng Việt dựa trên mô hình biểu diễn văn bản thành đồ thị.
điểm /
đánh giá
Phát hành ngày
2009-10-14
In ra
Chuyên mục
BÀI BÁO
Copyright belongs to VNU-HCM “Science and Technology Development” Journal. Any copy or reprinting of any form must be permitted by the Journal.