Page 392 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 392
ResNet (He et al., 2016) là bước đột phá trong lĩnh vực thị giác máy
tính. ResNet là mạng học sâu với hàng trăm, thậm chí hàng nghìn lớp nhưng
chỉ cần rất ít tham số nhờ kỹ thuật kết nối tắt (skip connection). Kết nối tắt
giúp thông tin không bị mất bằng cách kết nối lớp trước với lớp tiếp theo và
bỏ qua một số lớp trung gian. ResNet bao gồm nhiều kiến trúc khác nhau
bao gồm 34, 50, 101 và 152. Trong đó, ResNet-101 khi sử dụng làm mạng
khung xương cho Faster R-CNN sẽ đạt hiệu suất tốt hơn.
Inception ResNet V2 (Szegedy et al., 2017) là một mạng nơ-ron tích
chập được đào tạo trên hơn một triệu hình ảnh từ cơ sở dữ liệu ImageNet.
Đây là sự kết hợp giữa kiến trúc mạng Inception và ResNet. Inception là
một mạng lưới thần kinh nhân tạo để trích xuất đặc trưng với tỷ lệ lỗi thấp.
ResNet là một mạng học sâu với hàng trăm, thậm chí hàng nghìn lớp sử
dụng kỹ thuật kết nối tắt (skip connection). Inception ResNet V2 có thể
được sử dụng làm mạng khung xương (backbone) trong Faster R-CNN để
trích xuất các đặc trưng.
19.2.3.3 Các chỉ số đánh giá
Việc đánh giá các thuật toán phân loại dựa trên: độ chính xác
(precision) và khả năng thu hồi (recall). Độ chính xác và thu hồi được tính
theo công thức 1. Trong đó, TP là chỉ số dương tính thật, FP là chỉ số dương
tính giả, và FN là chỉ số âm tính giả.
= ; = (1)
+ +
Chỉ số F1 là giá trị trung bình có trọng số của độ chính xác và khả
năng thu hồi được định nghĩa như công thức 2.
( ) = (1 + ) ( ∗ ) = 2 ∗ (2)
2
2
∗ + +
Độ chính xác trung bình trung bình (mAP) là một phương pháp phổ
biến để đánh giá mô hình được tính toán như trong công thức 3, trong đó
th
APi là độ chính xác trung bình cho lớp i trong N lớp.
1
= ∑ (3)
1
378