Page 187 - Công nghệ kỹ thuật và công nghệ thông tin trong tiến trình công nghiệp hóa - hiện đại hóa Đồng bằng sông Cửu Long
P. 187
mỗi rừng ngẫu nhiên, một giá trị vector ngẫu nhiên được xác định (Breiman,
2001). Kết quả thu được bằng cách chọn kết quả từ đa số do đó, rừng ngẫu
nhiên phù hợp và mạnh mẽ hơn so với cây quyết định đơn lẻ.
Tăng cường độ dốc
Tăng cường độ dốc là một kỹ thuật máy học mạnh mẽ khác cũng dựa
trên cây quyết định. Thuật toán này thuộc về kỹ thuật tăng cường đào tạo một
nhóm các mô hình riêng lẻ theo cách tuần tự, và mỗi mô hình riêng lẻ sẽ học
hỏi từ những sai lầm của mô hình trước đó.
9.4.3 Kết quả
Để dự đoán sự xuất hiện của bệnh, tập dữ liệu đã được chia thành tập huấn
luyện và tập kiểm tra (tỷ lệ 4:1) với số lượng 145 và 37 ao nuôi tương ứng.
Thuật toán hồi quy logistic cho kết quả chính xác trên bệnh viêm gan tụy,
đốm trắng và bệnh chậm lớn lần lượt là 91,89%; 72,97% và 72,97%. Kết quả
được biểu diễn ở Bảng 9.2.
Bảng 9.2. Kết quả dự đoán của hồi quy logistic
Tập huấn luyện Tập kiểm tra
Đúng Tỷ lệ Đúng Tỷ lệ
Đốm trắng 129 88,96 27 72,97
Chậm lớn 126 86,89 27 72,97
Viêm gan tụy 142 97,93 34 91,89
Thuật toán mạng neuron cho kết quả dự đoán trên bệnh viêm gan tụy,
đốm trắng và bệnh chậm lớn lần lượt là 91,89%; 83,78% và 75,67%. Kết quả
được biểu diễn ở Bảng 9.3.
Bảng 9.3. Kết quả dự đoán của mạng lưới neuron
Tập huấn luyện Tập kiểm tra
Đúng Tỷ lệ Đúng Tỷ lệ
Đốm trắng 141 97,24 31 83,78
Chậm lớn 139 95,86 28 75,67
Viêm gan tụy 140 96,55 34 91,89
Thuật toán rừng ngẫu nhiên cho kết quả dự đoán tương đối ổn định trên
bệnh viêm gan tụy, đốm trắng và bệnh chậm lớn lần lượt là 83,78%; 83,78%
và 78,37%. Kết quả được biểu diễn ở Bảng 9.4.
173