Page 327 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 327
16.2.1 Các giải pháp thu thập dữ liệu
Hiện nay, số lượng thông tin y khoa tăng ngày càng nhanh, tăng gấp đôi
sau mỗi 3 năm (Sở Y tế Thành phố Hồ Chí Minh, 2020). Ước tính một bác sĩ
muốn cập nhật toàn bộ thông tin y khoa cần khoảng 29 giờ mỗi ngày. Bên
cạnh đó là sự tổn tại của nguồn dữ liệu lớn (big data) như các dữ liệu “omic”
- dữ liệu về di truyền học (genomics), dữ liệu về chuyển hóa (metabolomics),
dữ liệu về protein (protenomics),.. hay dữ liệu về hồ sơ sức khỏe điện tử
(electronic health record - EHR), dữ liệu về xã hội học và lối sống,… Các
nguồn dữ liệu y khoa này sẽ tạo nên một lượng dữ liệu cực lớn, tuy nhiên nó
sẽ không mang lại lợi ích hay thông tin quan trọng nếu như không trải qua
phân tích toàn diện. Do sự khổng lồ và phức tạp của dữ liệu lớn trong y học,
nếu chỉ phân tích thủ công thì sẽ không mang lại hiệu quả và rất tốn thời gian,
nên sự hỗ trợ của các công nghệ tiên tiến như AI sẽ giúp giải quyết được bài
toán này.
Nguồn dữ liệu y khoa có thể thu thập từ 3 dạng chính: dữ liệu dạng số,
dữ liệu dạng văn bản (text) và dữ liệu hình ảnh/âm thanh/video. Dữ liệu dạng
số là các dữ liệu đo lường và đồng bộ như chỉ số huyết áp, nồng độ đường
huyết, dữ liệu xét nghiệm sinh hóa như chỉ số trong máu, dữ liệu theo dõi sức
khỏe như nhịp tim, nhiệt độ cơ thể,… có thể thu thập từ các thiết bị xét nghiệm
y tế, các cảm biến gắn trong hoặc trên cơ thể. Ngoài ra, chúng ta còn có các
dữ liệu dạng văn bản như các mẫu ghi chép về triệu chứng của bệnh nhân,
bệnh án,… Dữ liệu dạng hình ảnh như ảnh CT, X-quang, ảnh siêu âm,… Khi
các dữ liệu y khoa được phân tích tốt, kết hợp cùng với sự hỗ trợ của trí tuệ
nhân tạo sẽ hỗ trợ rất đắc lực cho các bác sĩ trong công tác chẩn đoán lâm
sàng và đưa ra quyết định điều trị, đặc biệt là trong bối cảnh xu hướng điều
trị bệnh y học chính xác (precision medicine) và y học cá thể hóa
(personalized medicine) đang rất được quan tâm.
Sự tiến bộ vượt trội của di truyền học trong thập kỷ qua, đặc biệt là
thành tựu trong nghiên cứu tế bào gốc và bản đồ gene người đã giúp các nhà
khoa học có thể dự đoán được phản ứng của cơ thể người thông qua việc phân
tích chính bộ gene của người bệnh và đưa ra được phương hướng điều trị phù
hợp cho từng bệnh nhân. Phương pháp điều trị bệnh này được gọi là y học cá
thể hóa, đây được xem là mô hình y học của tương lai.
Dữ liệu của mô hình y học cá thể hóa là dữ liệu metagenomics (dữ liệu
hệ đa gen), nó thường được dùng để nghiên cứu một cộng đồng vi sinh vật cụ
thể như cộng đồng vi sinh vật trên da người, trong đất hoặc nước. Đối với y
313