Page 296 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 296
công trình của Mittal et al. (2022) và Yadav and Pandey (2022). Một số mô
hình học sâu ứng dụng thành công cho bài toán phân đoạn ảnh có thể kể đến
đó là: 1- DeepLab (Chen et al., 2016); 2- U-Net (Siddique et al., 2021). Hình
14.10 minh họa kết quả phát hiện ký tự theo cách tiếp cận 2.
Hình 14.10. Phát hiện ký tự với kỹ thuật phân đoạn ảnh
14.3.1.2 Nhận dạng ký tự
Sau khi xác định vùng ký tự cần nhận dạng, quá trình nhận dạng ký tự
sẽ được áp dụng với đầu vào là ảnh chứa chuỗi ký tự và kết quả là giá trị chuỗi
ký tự nhận dạng được. Có 2 giải pháp chính: 1- rolling character classification
(Ye & Doermann, 2015); 2- sequence modeling (Santa Cruz et al., 2017). Với
cách tiếp cận thứ nhất, ảnh chứa ký tự đầu vào sẽ được tách thành các vùng
chứa ký tự đơn, tiếp đó từng vùng ký tự này sẽ được nhận dạng bởi bộ phân
lớp được huấn luyện trước đó, quy trình này được minh họa ở Hình 14.11.
Hình 14.11. Nhận dạng ký tự theo tiếp cận rolling character classification
Ở cách tiếp cận thứ hai, từ ảnh đầu vào chứa chuỗi ký tự cần nhận dạng,
các đặc trưng không gian của ảnh sẽ được rút trích, các đặc trưng không gian
này sẽ được căn chỉnh và sau đó hợp nhất các đặc trưng được căn chỉnh này
thành ký tự duy nhất. Quy trình này được minh họa ở Hình 14.12.
282