X quang cốt hóa xương bàn tay ở trẻ em

30/01/2019

Phát hiện vùng bị cốt hóa của xương bàn tay trên ảnh chụp X-quang là một công việc quan trọng, là một bước tiền xử lý trong việc ước lượng tự động tuổi của xương. Deep neural networks gần đây đang nổi bật lên trở thành phương pháp tìm kiếm chuẩn phổ biến.

Đặt vấn đề

Phát hiện vùng bị cốt hóa của xương bàn tay trên ảnh chụp X-quang là một công việc quan trọng, ví dụ như nó là một bước tiền xử lý trong việc ước lượng tự động tuổi của xương. Deep neural networks (mô hình mạng nơ ron nhân tạo phức tạp) gần đây đang nổi bật lên trở thành phương pháp tìm kiếm chuẩn phổ biến. Nhưng hạn chế của nó là cần những tập dữ liệu chú giải rất lớn. Tinh chỉnh mạng lưới đào tạo trước (finetuning pre-trained networks) là một sự lựa chọn khả thi, nhưng nó không làm rõ được tiên nghiệm rằng liệu huấn luyện với tập dữ liệu chú giải nhỏ có thành công hay không, vì nó còn phụ thuộc vào các vấn đề sẵn có. Trong văn bản này, chúng tôi cho thấy mạng lưới đào tạo trước (pre-trained networks) có thể được tận dụng để sản xuất ra máy dò hiệu quả cho vùng bị cốt hóa của xương bàn tay trên ảnh chụp X-quang bàn tay ở trẻ em.

Phương pháp và tài liệu tìm thấy

Một mạng lưới Faster R-CNN tồn tại công khai, đào tạo trước trên tệp dữ liệu COCO, được tận dụng và tinh chỉnh bằng 240 ảnh chụp X-quang có chú thích tay lấy từ RSNA Pediatric Bone Age Challenge (ở đây bao gồm hơn 14000 ảnh chụp X-quang nhi khoa). Việc xác nhận được thực hiện trên 89 bản chụp khác từ tập dữ liệu và hiệu suất được đo bằng tỉ lệ diện tích Giao trên Hợp (Intersection-over-Union – IoU). Để hiểu được tác động của kích cỡ dữ liệu trên một mạng lưới đào tạo trước, chúng tôi tiến hành lấy mẫu con trên dữ liệu đào tạo và quá trình đào tạo được lặp lại. Thêm vào đó, mạng lưới được đào tạo từ đầu và không có bất kì trọng số đào tạo trước nào. Và cuối cùng, để hiểu được mẫu đào tạo có hữu dụng hay không, chúng tôi so sánh suy luận của mạng lưới với chú thích của một bác sĩ X-quang chuyên nghiệp. Mạng lưới được tinh chỉnh có thể đạt được độ chính xác trung bình (mAP@0.5IoU) là 92.92 ± 1.93. Ngoại trừ phần cổ tay, tất cả vùng bị cốt hóa đều có lợi từ nhiều dữ liệu hơn. Ngược lại, mạng lưới được đào tạo từ đầu không thể tạo ra kết quả chính xác nào. Khi so sánh với chú thích của một bác sĩ Xquang chuyên nghiệp, mạng lưới có thể xác định vị trí các vùng khá tốt, theo như F1-Score thì đạt trung bình 91.85 ± 1.06.

Kết luận

Bằng cách tinh chỉnh mô hình mạng nơ ron nhân tạo phức tạp đào tạo trước (pre-trained deep neural network), với 240 bản chụp X-quang được ghi chú, chúng tôi có thể dò tìm thành công vị trí vùng bị cốt hóa trong các bản chụp X-quang bàn tay ở trẻ em.

Ảnh 1: Kết luận ví dụ của một bản chụp X-quang, đánh dấu tất cả các vùng cần quan tâm bằng cách sử dụng mạng lưới đào tạo cuối cùng Faster-RCNN

Ảnh 1: Kết luận ví dụ của một bản chụp X-quang, đánh dấu tất cả các vùng cần quan tâm bằng cách sử dụng mạng lưới đào tạo cuối cùng Faster-RCNN

Ảnh 2: Các mảnh được tách ra ngẫu nhiên của các vùng cần quan tâm được chú thích. Các mảnh được tách ra trong các khuôn hình vuông để đạt được sự hình dung tốt hơn.

Ảnh 2: Các mảnh được tách ra ngẫu nhiên của các vùng cần quan tâm được chú thích. Các mảnh được tách ra trong các khuôn hình vuông để đạt được sự hình dung tốt hơn.

Ảnh 3: Phân tích phân phối tuổi giữa cả hai tập chú thích. Tập được xác nhận chứa số bệnh nhân lớn tuổi nhiều hơn một chút.

Ảnh 3: Phân tích phân phối tuổi giữa cả hai tập chú thích. Tập được xác nhận chứa số bệnh nhân lớn tuổi nhiều hơn một chút.

Ảnh 4: Phân tích kích cỡ hộp chú thích giữa cả hai tập chú thích. Kích cỡ hộp giới hạn được bình thường hóa tới độ dài cạnh hình ảnh tối đa là 1024px. Đây cũng chính là sự chuyển vận mặc nhiên của các mẫu Faster-RCNN trong Tensorflow Object Detection API

Ảnh 4: Phân tích kích cỡ hộp chú thích giữa cả hai tập chú thích. Kích cỡ hộp giới hạn được bình thường hóa tới độ dài cạnh hình ảnh tối đa là 1024px. Đây cũng chính là sự chuyển vận mặc nhiên của các mẫu Faster-RCNN trong Tensorflow Object Detection API

Tin và bài liên quan

Xem thêm