Machine learning trong sức khoẻ dân số: Cơ hội và các mối đe doạ

25/01/2019

Machine learning (ML) đã đạt được thành công trong các công việc cơ bản bằng cách giúp các chuyên gia và lập trình viên thống kê dữ liệu. Tuy nhiên, các ứng dụng của machine learning triển khai thành công trong y tế và y sinh còn tồn tại một số giới hạn. Những giới hạn này cũng có trong y tế dân số, trong đó chúng ta cần chú ý đến kết quả sức khỏe của một nhóm cá nhân và sự phân phối kết quả trong nhóm.

Trong số liệu, chúng ta cần đối phó với kho dữ liệu sức khoẻ toàn cầu rất hỗn độn, và cần một nỗ lực lớn trong việc sắp xếp lại các thông tin thưa thớt, bị nhiễu, để có thể hiểu được nguyên nhân gây nên sự mất mát về sức khoẻ xảy ra ở đâu và thay đổi như thế nào. Trong các can thiệp, chúng ta phải đối mặt với sự ràng buộc nghiêm ngặt về nguồn và cần phát triển các giải pháp phù hợp và chấp nhận được dưới những ràng buộc này. Vậy, làm sao những tiếp cận dựa trên machine learning (ML) có thể thay đổ sức khoẻ dân số ? Tại đây, chúng ta sẽ thảo luận về những cơ hội cũng như mối nguy cơ đối của machine learning, theo quan điểm chung về sự phát triển cần thiết của machine learning, nhằm tạo ra được kết quả tốt nhất có thể.

Khởi đầu, ML và trí tuệ nhân tạo (AI) có thể tự động hóa các công việc con người không thích làm, không thể làm đủ nhanh, hoặc không đủ khả năng thực hiện. Nhà sáng chế AI Andrew Ng đã từng đưa một lời hướng dẫn súc tích:”Nếu một người bình thường có thể thực hiện một hoạt động thần kinh thông qua suy nghĩ kéo dài chưa đến một giây , chúng ta hoàn toàn có thể tự động hóa nó bằng AI ngay bây giờ hoặc trong tương lai gần. Theo cách tiếp cận của Ng, thử thách trong việc thực hiện điều này chính là việc phân chia công việc thành nhiều phần mà một người có thể làm trong thời gian dưới một giây. Ví dụ, quá trình kiểm tra kết quả của chúng ta trong Nghiên cứu về gánh nặng bệnh tật toàn cầu bao gồm việc kiểm tra trực quan hàng ngàn lô hiển thị dữ liệu cùng với ước tính trên mô hình. Cá nhân các nhà nghiên cứu không thể chú ý và theo dõi cụ thể theo tất cả các lô bất thường. Công việc sơ bộ của chúng ta đã cho thấy mạng lưới thần kinh tích chập có thể sàng lọc chính xác những lô bất thường ấy, và để lại hàng trăm những trường hợp đáng nghi ngờ để con người kiểm tra lại. Phần mềm ML nguồn mở như Scikit-Learn và Keras tạo điều kiện thuận lợi cho việc này, nhưng hoạt động nghiên cứu về cách tốt nhất để áp dụng các phương pháp hiện có có thể thúc đẩy việc áp dụng rộng rãi hơn. Cách tiếp cận ML không dễ để được phát triển hoặc triển khai, và chúng ta vẫn còn thiếu vốn kinh nghiệm cần thiết cũng như ca lâm sàng để biết khi nào thì giải pháp ML xứng đáng với những nỗ lực đã được bỏ ra.

Một ví dụ hứa hẹn khác về tự động hoá dựa trên ML xuất phát từ thách thức lập bản đồ kết quả phỏng vấn khám nghiệm tử thi thông qua lời nói để tìm ra nguyên nhân cơ bản dẫn đến cái chết. Dữ liệu nguyên nhân tử vong cụ thể là một thành phần quan trọng của ước tính gánh nặng bệnh tật, nhưng trên toàn cầu, gần hai phần ba tổng số ca tử vong lại không được ghi nhận. Khám nghiệm tử thi bằng lời nói là một cuộc phỏng vấn có cấu trúc để có thể cung cấp thông tin nhằm lấp đầy khoảng trống này, nhưng quá trình lập bản đồ từ kết quả phỏng vấn đến tìm ra nguyên nhân cái chết cơ bản, vẫn theo như truyền thống, đòi hỏi cần có một bác sĩ với kinh nghiệm ở địa điểm nơi xảy ra ca tử vong ấy.Các chuyên gia đang thiếu nguồn tài nguyên, hỗ trợ, và những nỗ lực trong quá trình khám nghiệm tử thi thông qua lời nói có thể kết thúc bằng việc bị trì hoãn hàng năm giữa quá trình thu thập dữ liệu và liên kết chúng với nguyên nhân cơ bản của ca tử vong. Phương pháp ML đối với chứng nhận của máy tính về khám nghiệm tử thi thông qua lời nói cũng có thể mang đến sự chính xác tương tự như các chuyên gia là con người, mà không cần lo đến vấn đề trì hoãn.

Sự công bằng, trách nhiệm và minh bạch

Hiểu được lý do tại sao các phương pháp ML dự đoán khi chúng thực hiện là một khía cạnh nghiên cứu tương đối mới. Đây thường được xem là tính công bằng, trách nhiệm và minh bạch trong ML (FAT / ML) hoặc AI có thể giải thích được, và là một lĩnh vực đáng chú ý của một góc nhìn khác trong nghiên cứu này. Mặc dù thuật ngữ song song liên kết với các nhóm nghiên cứu tương đối khác nhau, cả hai đều đề cập đến một điểm yếu tiềm tàng của nhiều phương pháp ML hiện tại, đó là sự bất lực của nhà nghiên cứu trong việc giải thích tại sao máy móc đã dự đoán như nó có. Làm việc trong Y học lâm sàng đã chỉ ra được tầm quan trọng của các phương pháp dự đoán có thể giải thích được. Chúng ta tin rằng, cũng như đối với sức khoẻ dân số, một cơ chế để giải thích sự dự đoán dựa trên MI, sẽ làm tăng cơ hội triển khai các phương pháp dựa theo MI-sự hấp thu sẽ tăng nếu có một lời giải thích một cách trực quan hoặc chứng minh rằng một phương pháp có theo một mô hình hợp lý. Trong công việc về Gánh nặng bệnh tật toàn cầu của chúng tôi, sự phản đối về ý nghĩa của chính sách bắt nguồn từ các hoạt động dựa trên mô hình phức tạp-chúng không đáng được tin cậy. Các hướng dẫn về Báo cáo Ước tính Sức khỏe Chính xác và Minh bạch (GATHER) đã được phát triển để giải quyết các phản đối này, và để tạo điều kiện cho việc giải thích trên mô hình trong giao tiếp học thuật. Các phương pháp phát triển dựa trên kinh nghiệm của chúng ta dành cho chứng nhận máy tính về khám nghiệm tử thi bằng lời nói đã củng cố niềm tin cho chúng ta trong việc áp dụng cách tiếp cận có thể giải thích được, ngay cả khi suy giảm độ chính xác, vẫn có thể vượt trội. Trong khám nghiệm tử thi bằng lời nói, chúng ta đã đề xuất một cách tiếp cận đơn giản hơn (Thuế quan) trên phương pháp ML phức tạp (rừng ngẫu nhiên), và điều này đã hỗ trợ trong thiết kế khảo sát tiếp theo, và dường như đã đang từng bước được chấp nhận bởi các học viên Y Tế Công Cộng.

Phương pháp ML bảo vệ quyền riêng tư

Các định nghĩa chính thức và sự đảm bảo của quyền riêng tư đang dần được làm rõ thời gian gần đây từ công việc, tại điểm giao giữa mật mã, thống kê và bảo mật máy tính. Các phương pháp cung cấp sự hiểu biết thấu đáo dựa trên dữ liệu mà không làm rò rỉ bí mật dữ liệu, có thể đóng vai trò vô cùng hữu dụng trong sức khoẻ dân số, khi các dữ liệu có giá trị lại thường không được chia sẻ bởi chính các mối lo về vấn đề bảo mật. Phương pháp ML bảo mật quyền riêng tư có thể mang đến một cơ hội mang tính chất công nghệ, để tích góp được sự hiểu biết thấu đáo từ các bộ dữ liệu lớn, riêng tư. Tuy nhiên, khi phát triển loại hình điều tra này, đặc biệt là áp dụng trong sức khoẻ dân số, các nhà nghiên cứu cần quan tâm đến nhiều lí do tiềm tàng có thể dẫn đến việc bộ dữ liệu không được phát hành công khai. Một số, chẳng hạn như các yêu cầu về đạo đức và quy định, có thể được giải quyết bằng các công nghệ như sự khác biệt về quyền riêng tư, trong khi một số khác, ví dụ như tình trạng sắp xếp sai của sự khuyến khích về chiến lược giữa các nhà nghiên cứu, có thể cần đến xã hội cũng như sự đổi mới về kỹ thuật để khắc phục. Để thực hiện điều này, theo như hướng dẫn của GATHER đã cho phép :“Đối với bất kỳ quá trình nhập liệu nào không đượng chia sẻ vì các lí do đạo đức hay pháp luật, ví dụ như quyền sở hữu của bên thứ 3, để cung cấp tên liên hệ hoặc tên của tổ chức vẫn giữ quyền đối với dữ liệu. Một giải pháp kỹ thuật cho phép sự giới hạn chia sẻ nhập liệu sẽ thúc đẩy khả năng tái tạo một cách trực tiếp hơn so với thông tin liên lạc.

Nguyên nhân can thiệp

Những điểm yếu của nhiều can thiệp ML có cùng với các lời giải thích cũng đồng thời liên quan với những điểm yếu của quá trình đòi hỏi tìm ra nguyên nhân dẫn đến. Tuy nhiên, câu hỏi trọng tâm đối với yêu cầu sức khoẻ dân số hiện nay cũng chính là về những đòi hỏi ấy.Nếu chúng ta mở rộng một chương trình sức khoẻ, giới thiệu một loại vaccine mới, hoặc có một thay đổi nào đó về việc động viên chăm sóc sức khoẻ, những điều này sẽ thay đổi sức khoẻ dân số như thế nào? Sự giải nghĩa và phát triển xa hơn của các phương pháp ML sẽ đi xa hơn cả dự đoán, rằng liệu một hình ảnh kĩ thuật số có hình ảnh một con mèo có thể dự đoán được kết quả chính sách, sẽ mang lại những giá trị lớn lao. Tác phẩm sơ bộ của Kleinberg và đồng nghiệp đã cung cấp một số ví dụ sáng suốt và viễn cảnh khi việc dự đoán nguyên nhân tác động là điều cần thiết, và một số phương pháp cho mục đích này đang dần xuất hiện.

Lường trước ảnh hưởng độc hại

Cuối cùng, chúng ta phải lường trước các tác động gây bệnh của khoa học kỹ thuật vận hành bởi ML lên sức khoẻ dân số và chuẩn bị biện pháp đối phó với chúng. Vậy, những ảnh hưởng tiêu cực của ML mà ta cần lường trước là gì? Mặc dù một số lượng lớn các tiểu thuyết khoa học viễn tưởng có thể được phát triển như một cách đáp lại, thử thách đối với một sức khoẻ dân số đã đang được làm rõ và chứng minh bằng tài liệu, diễn ra khi AI được mang vào sử dụng dựa trên quyết định ở mức độ cá nhân cho những chương trình xã hội. Cơ hội để hợp lý hoá các nỗ lực thiếu năng lực này để mang lại sức khoẻ và các dịch vụ xã hội khác cũng là một mối đe doạ, và nghiên cứu biện pháp đối phó đối với các thuật toán tiềm tàng của sự không công bằng ngày càng gia tăng trong xã hội, có thể đóng vai trò vô cùng quan trọng trong sức khoẻ dân số.

Kết luận

ML đã đạt được một thành tựu mà tại đó, nó có khả năng làm những công việc một cách tự động, mà cho đến hiện nay vẫn không thể được thực hiện mà không cần đến sự lao động đáng kể của con người. Điều này mang đến cơ hội cho sức khoẻ dân số để chúng ta có thể làm nhiều hơn, nhanh hơn, tốt hơn, và rẻ hơn, tuy nhiên vẫn còn đi kèm với rủi ro. Sự phát triển xa hơn nữa trong cách triển khai các phương pháp ML-đặc biệt là những phương pháp có thể giải thích được, tôn trọng quyền riêng tư và thực hiện các can thiệp nguyên nhân chính xác- sẽ giúp chúng ta tận dụng được lợi thế của cơ hội này.

Tin và bài liên quan

Lộ trình chăm sóc loãng xương ở các nước phát triển – góc nhìn từ Việt Nam
Lộ trình chăm sóc loãng xương ở các nước phát triển – góc nhìn từ Việt Nam

19/01/2021

Là một nền kinh tế đang phát triển với GDP bình quân đầu người khoảng 2.600 USD (số liệu năm 2018), Việt Nam là quốc gia đông dân thứ 15 trên thế giới với dân số 97 triệu người. Dân số của Việt Nam đang gìa đi nhanh chóng. Mặc dù hiện nay, tỷ lệ dân số từ 60 tuổi trở lên của cả nước là 12%, con số này dự kiến sẽ tăng lên 25% vào năm 2049. Theo đánh giá của Quỹ Tiền tệ Quốc tế (IMF), Việt Nam là một quốc gia đang già đi trước khi trở nên giàu có.

Thúc Đẩy Lợi Ích Sử Dụng Của Machine Learning trong Chăm Sóc Sức Khỏe Và Y Tế: Hướng Tới Sự Hiểu Biết Cộng Đồng
Thúc Đẩy Lợi Ích Sử Dụng Của Machine Learning trong Chăm Sóc Sức Khỏe Và Y Tế: Hướng Tới Sự Hiểu Biết Cộng Đồng

29/01/2019

Nhờ vào sự phong phú của dữ liệu sức khỏe và sức mạnh tính toán ngày càng tăng, Machine learning đang hấp dẫn các nhà nghiên cứu sức khỏe trong quá trình khám phá xung quanh sự phát triển các thuật toán điều khiển dữ liệu để đưa ra các dự đoán đáng tin cậy về mặt lâm sàng.

Xem thêm