Page 327 - SDMD CNKT va CNTT trong tien trinh CNH_HDH DBSCL
P. 327

16.2.1  Các giải pháp thu thập dữ liệu

               Hiện nay, số lượng thông tin y khoa tăng ngày càng nhanh, tăng gấp đôi
          sau mỗi 3 năm (Sở Y tế Thành phố Hồ Chí Minh, 2020). Ước tính một bác sĩ
          muốn cập nhật toàn bộ thông tin y khoa cần khoảng 29 giờ mỗi ngày. Bên
          cạnh đó là sự tổn tại của nguồn dữ liệu lớn (big data) như các dữ liệu “omic”
          - dữ liệu về di truyền học (genomics), dữ liệu về chuyển hóa (metabolomics),
          dữ liệu về protein (protenomics),.. hay dữ liệu về hồ sơ sức khỏe điện tử
          (electronic health record - EHR), dữ liệu về xã hội học và lối sống,… Các
          nguồn dữ liệu y khoa này sẽ tạo nên một lượng dữ liệu cực lớn, tuy nhiên nó
          sẽ không mang lại lợi ích hay thông tin quan trọng nếu như không trải qua
          phân tích toàn diện. Do sự khổng lồ và phức tạp của dữ liệu lớn trong y học,
          nếu chỉ phân tích thủ công thì sẽ không mang lại hiệu quả và rất tốn thời gian,
          nên sự hỗ trợ của các công nghệ tiên tiến như AI sẽ giúp giải quyết được bài
          toán này.

               Nguồn dữ liệu y khoa có thể thu thập từ 3 dạng chính: dữ liệu dạng số,
          dữ liệu dạng văn bản (text) và dữ liệu hình ảnh/âm thanh/video. Dữ liệu dạng
          số là các dữ liệu đo lường và đồng bộ như chỉ số huyết áp, nồng độ đường
          huyết, dữ liệu xét nghiệm sinh hóa như chỉ số trong máu, dữ liệu theo dõi sức
          khỏe như nhịp tim, nhiệt độ cơ thể,… có thể thu thập từ các thiết bị xét nghiệm
          y tế, các cảm biến gắn trong hoặc trên cơ thể. Ngoài ra, chúng ta còn có các
          dữ liệu dạng văn bản như các mẫu ghi chép về triệu chứng của bệnh nhân,
          bệnh án,… Dữ liệu dạng hình ảnh như ảnh CT, X-quang, ảnh siêu âm,… Khi
          các dữ liệu y khoa được phân tích tốt, kết hợp cùng với sự hỗ trợ của trí tuệ
          nhân tạo sẽ hỗ trợ rất đắc lực cho các bác sĩ trong công tác chẩn đoán lâm
          sàng và đưa ra quyết định điều trị, đặc biệt là trong bối cảnh xu hướng điều
          trị  bệnh  y  học  chính  xác  (precision  medicine)  và  y  học  cá  thể  hóa
          (personalized medicine) đang rất được quan tâm.
               Sự tiến bộ vượt trội của di truyền học trong thập kỷ qua, đặc biệt là
          thành tựu trong nghiên cứu tế bào gốc và bản đồ gene người đã giúp các nhà
          khoa học có thể dự đoán được phản ứng của cơ thể người thông qua việc phân
          tích chính bộ gene của người bệnh và đưa ra được phương hướng điều trị phù
          hợp cho từng bệnh nhân. Phương pháp điều trị bệnh này được gọi là y học cá
          thể hóa, đây được xem là mô hình y học của tương lai.

               Dữ liệu của mô hình y học cá thể hóa là dữ liệu metagenomics (dữ liệu
          hệ đa gen), nó thường được dùng để nghiên cứu một cộng đồng vi sinh vật cụ
          thể như cộng đồng vi sinh vật trên da người, trong đất hoặc nước. Đối với y



                                                                                313
   322   323   324   325   326   327   328   329   330   331   332