CẢI TIẾN CHẤT LƯỢNG CỦA NHẬN DẠNG NGƯỜI NÓI TIẾNG VIỆT SỬ DỤNG HỌC CHUYỂN ĐỔI VÀ HỌC BIỂU DIỄN CỘNG ĐỒNG

  • Hồ Tấn Hoàng Viện Công nghệ thông tin và Truyền thông, Trường Đại học Kỹ thuật Lê Quý Đôn
  • Trần Cao Trưởng Viện Công nghệ thông tin và Truyền thông, Trường Đại học Kỹ thuật Lê Quý Đôn
Từ khóa: Nhận dạng người nói, học chuyển đổi, học cộng đồng, học biểu diễn, học sâu

Tóm tắt

Công nghệ nhận dạng người nói giúp nhận diện hoặc xác minh danh tính dựa trên các đặc điểm giọng nói riêng của từng người, chẳng hạn như cao độ, tông giọng và cách nói chuyện. Công nghệ này được sử dụng rộng rãi để tăng cường an ninh, cải thiện dịch vụ khách hàng, hỗ trợ điều tra và tạo ra các tương tác cá nhân hóa với thiết bị thông minh. Trong những năm gần đây, nhờ ứng dụng các kỹ thuật học sâu, nhận dạng người nói đã đạt được
nhiều tiến bộ. Tuy nhiên, việc nhận dạng người nói tiếng Việt vẫn còn gặp nhiều khó khăn. Bài viết này đề xuất những chiến lược mới, kết hợp giữa học chuyển giao và học cộng đồng, nhằm cải thiện độ chính xác trong nhận dạng người nói tiếng Việt. Các kết quả thử nghiệm trên dữ liệu tiếng Việt cho thấy độ chính xác đã được cải thiện rõ rệt.

điểm /   đánh giá
Phát hành ngày
2025-01-20
Chuyên mục
Bài viết