Page 398 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 398
tâm trương là chỉ số thấp hơn, tương ứng với giai đoạn nghỉ giữa hai nhịp
tim liên tiếp. Thông thường, cao huyết áp là khi huyết áp đo được tại cơ sở y
tế lớn hơn hoặc bằng 140/90 mmHg. Theo báo cáo của Ủy ban quốc gia về
phòng ngừa, phát hiện, đánh giá và điều trị huyết áp cao của Hoa Kỳ
(Chobanian et al., 2003), việc phân loại huyết áp cho người lớn từ 18 tuổi
trở lên được trình bày trong Bảng 19.1.
Bảng 19.1. Phân loại huyết áp ở người lớn
Huyết áp tâm thu Huyết áp tâm trương
Loại
(mmHg) (mmHg)
Bình thường < 120 và < 80
Tiền cao huyết áp 120 – 139 hoặc 80 – 89
Cao huyết áp giai đoạn 1 140 – 159 hoặc 90 – 99
Cao huyết áp giai đoạn 2 >= 160 hoặc >= 100
Ngoài kết quả chẩn đoán trước đó của bác sĩ, Bảng 19.1 cũng được sử
dụng để có thể phân loại mức độ bệnh cao huyết áp dựa trên huyết áp tâm
thu và tâm trương. Thuật toán máy học được sử dụng trong tầng tri thức cho
loại bệnh này là cây quyết định.
19.4.1.1 Cây quyết định cho phát hiện cao huyết áp
Giai đoạn đào tạo
Tiền xử lý: Dữ liệu văn bản có nhiều trường trống, có giá trị bằng 0,
thậm chí giá trị không có thực sẽ ảnh hưởng đến hoạt động của tầng tri thức.
Do đó, quá trình tiền xử lý dữ liệu sẽ loại bỏ các giá trị không có thực ra
khỏi tập dữ liệu. Giải pháp cho các trường dữ liệu trống là điền giá trị bằng
phép nội suy toán học. Tập dữ liệu này được lưu dưới dạng tập tin có phần
mở rộng csv và đưa vào HBase để sử dụng về sau trong môi trường phân
tán. Các dòng dữ liệu được gán nhãn dựa trên kết quả chẩn đoán theo kết
luận bởi bác sĩ chuyên khoa với độ tin cậy cao. Dòng dữ liệu được gắn nhãn
1 nếu bệnh nhân được chẩn đoán bị cao huyết áp và 0 trong trường hợp
ngược lại. Sau khi gắn nhãn, tập dữ liệu sẽ được dùng để xây dựng mô hình
trích xuất đặc trưng và nhận về các vectơ đặc trưng.
384