Page 397 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 397

19.4  HỆ THỐNG QUẢN LÝ TRI THỨC CHĂM SÓC SỨC KHỎE

               Phần này sẽ minh họa phương pháp đã đề xuất trong việc xây dựng
          hệ thống quản lý  tri thức chăm sóc sức khỏe (Phan, 2022) để chẩn đoán
          bệnh tăng huyết áp, xuất huyết não và tổn thương gan. Tập dữ liệu đầu vào
          được thu thập từ một số bệnh viện ở đồng bằng sông Cửu Long và được lưu
          trữ trong cơ sở dữ liệu Postgres. Một số bảng dữ liệu chính chứa dữ liệu
          cần thiết cho ứng dụng liên quan đến bệnh cao huyết áp và xuất huyết não
          được sử dụng. Những dữ liệu này là hồ sơ bệnh nhân ở định dạng văn bản
          và hình ảnh CT/MRI. Các trường dữ liệu văn bản bao gồm 168.793 dòng
          dữ liệu với 13 trường (giới tính, tuổi, chiều cao, cân nặng, nhiệt độ, huyết
          áp tâm thu, huyết áp tâm trương, mạch, nhịp thở, chu vi vòng đầu, chu vi
          ngực, triệu chứng và kết quả chẩn đoán). Ngoài dữ liệu văn bản, 479 hồ sơ
          bệnh nhân còn chứa hình ảnh CT/MRI não kích thước 512 x 512 pixel. Bộ
          dữ liệu hình ảnh bao gồm 79 hình ảnh tụ máu ngoài màng cứng (EDH), 54
          hình ảnh tụ máu dưới màng cứng (SDH), 90 hình ảnh xuất huyết dưới nhện
          (SAH) và 256 hình ảnh xuất huyết nội sọ (ICH). Ngoài ra, bộ dữ liệu tổn
          thương gan bao gồm 2.000 hình ảnh CT của bốn giai đoạn trước và sau khi
          tiêm thuốc cản quang tập trung vào ba loại tổn thương gan khu trú phổ biến
          là u nang gan (NAN), u mạch máu (HEM) và ung thư biểu mô tế bào gan
          (HCC). Tập dữ liệu đào tạo chứa 1.600 hình ảnh của 256 NAN, 396 HEM
          và 948 HCC. Tập dữ liệu kiểm thử bao gồm 400 hình ảnh của 60 NAN, 108
          HEM và 232 HCC.
               Hệ thống được xây dựng trên cụm máy tính Spark gồm ba nút (một
          nút chính và hai nút thợ). Cấu hình nút chính là Intel Core i7 3.2 GHz 4CPU
          16GB RAM với GPU Nvidia Tesla P100 và cấu hình nút phụ là Intel Core
          i7  CPU  3.2GHz  1  CPU  4GB  RAM.  Hệ  điều  hành  sử  dụng  là  Ubuntu
          20.04.1  LTS  64  bit.  Các  phiên  bản  phần  mềm  được  cài  đặt  là  Java  1.8,
          Hadoop 3.2.1 và Spark 3.0.1. Thư viện dùng để hỗ trợ đào tạo các mô hình
          mạng là TensorFlow GPU phiên bản 1.5. Các mô hình được đào tạo trên
          cụm Spark để có thể thực thi trên nhiều nút tính toán nhằm rút ngắn thời
          gian đào tạo.
               19.4.1  Chẩn đoán cao huyết áp

               Huyết áp là lực của máu tác dụng lên thành mạch khi máu di chuyển
          (American Health Association, 2017). Huyết áp được biểu thị bằng hai chỉ số:
          huyết áp tâm thu và huyết áp tâm trương. Huyết áp tâm thu là chỉ số cao
          hơn, tương ứng với giai đoạn tim đập để đẩy máu vào động mạch. Huyết áp



                                                                                383
   392   393   394   395   396   397   398   399   400   401   402