Page 295 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 295
Ô số - Thành phần Ô số - Thành phần
thể thức văn bản thể thức văn bản
1 - Quốc hiệu và Tiêu 8 - Dấu, Chữ ký số của
ngữ cơ quan, tổ chức
2 - Tên cơ quan, tổ chức 9a, 9b - Nơi nhận
ban hành
3 - Số, ký hiệu 10a - Dấu chỉ độ mật
4 - Địa danh, thời gian 10b - Dấu chỉ mức độ
ban hành khẩn
5a - Tên loại, trích yếu 11 - Chỉ dẫn phạm vi
nội dung lưu hành.
5b - Trích yếu nội dung 12 - Ký hiệu người
công văn soạn thảo và số lượng
bản phát hành
6 - Nội dung 13 - Địa chỉ cơ quan, tổ
chức; thư điện tử; trang
thông tin điện tử; số
điện thoại; số Fax.
7a, 7b, 7c - Chức vụ, họ 14 - Chữ ký số của cơ
tên và chữ ký của người quan, tổ chức cho bản
có thẩm quyền. sao văn bản sang định
dạng điện tử
Hình 14.8. Vị trí trình bày các thành phần thể thức văn bản
Cách tiếp cận 1 có thể hiểu là ứng dụng kỹ thuật phát hiện đối tượng
cho bài toán phát hiện ký tự (text detection). Nhiều mô hình học sâu đã được
đề xuất cho bài toán phát hiện đối tượng (Zhao et al., 2019; Xiao et al., 2020)
trong đó nổi bật là 2 mô hình Faster R-CNN (Ren et al., 2015) và YOLO
(Solawetz & Francesco, 2023). Hình 14.9 minh họa kết quả phát hiện ký tự
theo cách tiếp cận 1.
Hình 14.9. Phát hiện ký tự với tiếp cận nhận dạng đối tượng
Cách tiếp cận 2 có thể hiểu là ứng dụng kỹ thuật phân đoạn ảnh cho bài
toán phát hiện ký tự. Phân đoạn ảnh là một kỹ thuật cơ bản của lĩnh vực thị
giác máy tính và được ứng dụng trong giai đoạn tiền xử lý cho nhiều bài toán
khác. Tổng quan các kỹ thuật phân đoạn ảnh được giới thiệu chi tiết trong các
281