Page 398 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 398

tâm trương là chỉ số thấp hơn, tương ứng với giai đoạn nghỉ giữa hai nhịp
          tim liên tiếp. Thông thường, cao huyết áp là khi huyết áp đo được tại cơ sở y
          tế lớn hơn hoặc bằng 140/90 mmHg. Theo báo cáo của Ủy ban quốc gia về
          phòng  ngừa,  phát  hiện,  đánh  giá  và  điều  trị  huyết  áp  cao  của  Hoa  Kỳ
          (Chobanian et al., 2003), việc phân loại huyết áp cho người lớn từ 18 tuổi
          trở lên được trình bày trong Bảng 19.1.

               Bảng 19.1. Phân loại huyết áp ở người lớn

                                     Huyết áp tâm thu       Huyết áp tâm trương
                    Loại
                                          (mmHg)                  (mmHg)
           Bình thường                     < 120                   và < 80
           Tiền cao huyết áp             120 – 139               hoặc 80 – 89
           Cao huyết áp giai đoạn 1      140 – 159               hoặc 90 – 99
           Cao huyết áp giai đoạn 2        >= 160                hoặc >= 100

               Ngoài kết quả chẩn đoán trước đó của bác sĩ, Bảng 19.1 cũng được sử
          dụng để có thể phân loại mức độ bệnh cao huyết áp dựa trên huyết áp tâm
          thu và tâm trương. Thuật toán máy học được sử dụng trong tầng tri thức cho
          loại bệnh này là cây quyết định.
               19.4.1.1  Cây quyết định cho phát hiện cao huyết áp

               Giai đoạn đào tạo

               Tiền xử lý: Dữ liệu văn bản có nhiều trường trống, có giá trị bằng 0,
          thậm chí giá trị không có thực sẽ ảnh hưởng đến hoạt động của tầng tri thức.
          Do đó, quá trình tiền xử lý dữ liệu sẽ loại bỏ các giá trị không có thực ra
          khỏi tập dữ liệu. Giải pháp cho các trường dữ liệu trống là điền giá trị bằng
          phép nội suy toán học. Tập dữ liệu này được lưu dưới dạng tập tin có phần
          mở rộng csv và đưa vào HBase để sử dụng về sau trong môi trường phân
          tán. Các dòng dữ liệu được gán nhãn dựa trên kết quả chẩn đoán theo kết
          luận bởi bác sĩ chuyên khoa với độ tin cậy cao. Dòng dữ liệu được gắn nhãn
          1 nếu bệnh nhân được chẩn đoán bị  cao  huyết  áp và 0  trong trường hợp
          ngược lại. Sau khi gắn nhãn, tập dữ liệu sẽ được dùng để xây dựng mô hình
          trích xuất đặc trưng và nhận về các vectơ đặc trưng.












          384
   393   394   395   396   397   398   399   400   401   402   403