Page 400 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 400
Hình 19.9. Cây quyết định có độ sâu 4 cho việc phát hiện cao huyết áp
Ngoài ra, một số yếu tố sức khỏe của bệnh nhân có liên quan chặt chẽ
đến huyết áp cao được chỉ ra dựa trên mô hình cây quyết định và các quy tắc
được tạo ra. Ví dụ, một bệnh nhân có huyết áp tâm thu trên 147 thường có
một số triệu chứng như đau đầu, chóng mặt và mệt mỏi. Những người trên
55 tuổi có nguy cơ cao bị cao huyết áp. Các mô hình được đào tạo trên cụm
máy tính Spark và thời gian đào tạo được trình bày trong Hình 19.10a. Cây
càng sâu càng tốn nhiều thời gian cho quá trình đào tạo.
Giai đoạn thử nghiệm:
Sau khi kết thúc quá trình đào tạo, việc đánh giá các mô hình phát
hiện huyết áp cao được dựa trên tập dữ liệu kiểm thử. Độ chính xác của các
mô hình được trình bày trong Hình 19.10b. Độ chính xác của các mô hình
với các độ sâu cây khác nhau đạt từ 84% đến 87%. Khi cây đạt độ sâu là 6,
việc đào tạo sẽ dừng lại vì các luật sinh ra phù hợp với thực tế. Nếu tăng độ
sâu của cây, các nhánh dư thừa bắt đầu xuất hiện và các cây quyết định rơi
vào tình trạng quá khớp (overfitting).
386