Page 397 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 397
19.4 HỆ THỐNG QUẢN LÝ TRI THỨC CHĂM SÓC SỨC KHỎE
Phần này sẽ minh họa phương pháp đã đề xuất trong việc xây dựng
hệ thống quản lý tri thức chăm sóc sức khỏe (Phan, 2022) để chẩn đoán
bệnh tăng huyết áp, xuất huyết não và tổn thương gan. Tập dữ liệu đầu vào
được thu thập từ một số bệnh viện ở đồng bằng sông Cửu Long và được lưu
trữ trong cơ sở dữ liệu Postgres. Một số bảng dữ liệu chính chứa dữ liệu
cần thiết cho ứng dụng liên quan đến bệnh cao huyết áp và xuất huyết não
được sử dụng. Những dữ liệu này là hồ sơ bệnh nhân ở định dạng văn bản
và hình ảnh CT/MRI. Các trường dữ liệu văn bản bao gồm 168.793 dòng
dữ liệu với 13 trường (giới tính, tuổi, chiều cao, cân nặng, nhiệt độ, huyết
áp tâm thu, huyết áp tâm trương, mạch, nhịp thở, chu vi vòng đầu, chu vi
ngực, triệu chứng và kết quả chẩn đoán). Ngoài dữ liệu văn bản, 479 hồ sơ
bệnh nhân còn chứa hình ảnh CT/MRI não kích thước 512 x 512 pixel. Bộ
dữ liệu hình ảnh bao gồm 79 hình ảnh tụ máu ngoài màng cứng (EDH), 54
hình ảnh tụ máu dưới màng cứng (SDH), 90 hình ảnh xuất huyết dưới nhện
(SAH) và 256 hình ảnh xuất huyết nội sọ (ICH). Ngoài ra, bộ dữ liệu tổn
thương gan bao gồm 2.000 hình ảnh CT của bốn giai đoạn trước và sau khi
tiêm thuốc cản quang tập trung vào ba loại tổn thương gan khu trú phổ biến
là u nang gan (NAN), u mạch máu (HEM) và ung thư biểu mô tế bào gan
(HCC). Tập dữ liệu đào tạo chứa 1.600 hình ảnh của 256 NAN, 396 HEM
và 948 HCC. Tập dữ liệu kiểm thử bao gồm 400 hình ảnh của 60 NAN, 108
HEM và 232 HCC.
Hệ thống được xây dựng trên cụm máy tính Spark gồm ba nút (một
nút chính và hai nút thợ). Cấu hình nút chính là Intel Core i7 3.2 GHz 4CPU
16GB RAM với GPU Nvidia Tesla P100 và cấu hình nút phụ là Intel Core
i7 CPU 3.2GHz 1 CPU 4GB RAM. Hệ điều hành sử dụng là Ubuntu
20.04.1 LTS 64 bit. Các phiên bản phần mềm được cài đặt là Java 1.8,
Hadoop 3.2.1 và Spark 3.0.1. Thư viện dùng để hỗ trợ đào tạo các mô hình
mạng là TensorFlow GPU phiên bản 1.5. Các mô hình được đào tạo trên
cụm Spark để có thể thực thi trên nhiều nút tính toán nhằm rút ngắn thời
gian đào tạo.
19.4.1 Chẩn đoán cao huyết áp
Huyết áp là lực của máu tác dụng lên thành mạch khi máu di chuyển
(American Health Association, 2017). Huyết áp được biểu thị bằng hai chỉ số:
huyết áp tâm thu và huyết áp tâm trương. Huyết áp tâm thu là chỉ số cao
hơn, tương ứng với giai đoạn tim đập để đẩy máu vào động mạch. Huyết áp
383