Bộ dữ liệu hình ảnh y tế DICOM dành cho các ứng dụng AI/ML tiên tiến trong chăm sóc sức khỏe
Đã ẩn danh Bộ dữ liệu hình ảnh DICOM Với siêu dữ liệu được bảo toàn—và các báo cáo nghiên cứu X quang tùy chọn—để đẩy nhanh quá trình huấn luyện, xác thực mô hình và nghiên cứu lâm sàng.
Dữ liệu hình ảnh DICOM được xây dựng cho trí tuệ nhân tạo ứng dụng thực tế.
Shaip cung cấp giải pháp sẵn sàng cho AI. Bộ dữ liệu hình ảnh y tế DICOM Được thiết kế để giúp các nhóm AI chăm sóc sức khỏe xây dựng, huấn luyện và xác thực các mô hình mạnh mẽ cho việc chẩn đoán, phân loại và hỗ trợ ra quyết định—sử dụng dữ liệu đã được ẩn danh nhưng vẫn giữ được giá trị lâm sàng.
Ảnh chụp nhanh tập dữ liệu
- Tổng số nghiên cứu:10M +
- Các khu vực địa lý hàng đầu (theo nghiên cứu): Mỹ, Brazil và Ấn Độ
- Các phương thức được thể hiện: CR, CT, US, DX, MR, MG, OT, RF, NM, Chụp nhũ ảnh
- Các bộ phận cơ thể được thể hiện: Ngực, bụng, đầu, cột sống, cổ, tim, và nhiều bộ phận khác.
Các trường hợp sử dụng phổ biến của bộ dữ liệu hình ảnh DICOM
Huấn luyện các mô hình AI chẩn đoán hình ảnh
- Phát hiện bất thường
- Phân loại bệnh
- Mức độ nghiêm trọng/phân loại giai đoạn
- Phân loại ưu tiên
- Hỗ trợ phát triển đa phương thức
Xác thực và đánh giá hiệu suất mô hình
- Đánh giá độ chính xác của mô hình trên phạm vi dân số rộng hơn.
- Đánh giá hiệu suất theo phương thức/vùng cơ thể
- Thực hiện kiểm định độc lập bên ngoài để giảm thiểu hiện tượng quá khớp.
Cải thiện độ ổn định của mô hình trên nhiều thiết bị và trang web.
- Kiểm tra khả năng khái quát hóa trên nhiều máy quét/nhà cung cấp khác nhau.
- Giảm thiểu tình trạng suy giảm hiệu năng khi triển khai tại các bệnh viện mới.
Xây dựng AI đa phương thức (hình ảnh + báo cáo X quang)
- Trích xuất các nhãn yếu từ ngôn ngữ báo cáo
- Mô hình huấn luyện phù hợp với nội dung báo cáo.
- Xây dựng hệ thống phân loại và hỗ trợ ra quyết định dựa trên báo cáo.
Nghiên cứu lâm sàng và tạo lập nhóm đối tượng nghiên cứu
- Lọc nhóm đối tượng theo phương thức/bộ phận cơ thể/thời gian
- Hỗ trợ các nghiên cứu hồi cứu
- Đẩy nhanh quá trình kiểm chứng giả thuyết trong khi vẫn duy trì các biện pháp bảo mật.
Tạo chú thích và dữ liệu tham chiếu cho quá trình huấn luyện ML
- Thẻ phân loại
- Hộp giới hạn
- Mặt nạ phân đoạn
Những gì bạn nhận được trong Bộ dữ liệu hình ảnh DICOM
1. Dữ liệu pixel DICOM (hình ảnh)
Tất cả hình ảnh đều được ẩn danh ở cấp độ pixel:
- Văn bản trên hình ảnh đã được lược bỏ hoặc ẩn danh.
- Hiện tượng "làm mờ khuôn mặt" có thể xuất hiện khi việc tái tạo khuôn mặt là khả thi (ví dụ: chụp CT độ phân giải cao).
3. Báo cáo nghiên cứu (không bắt buộc, nếu có)
Văn bản tường thuật không có cấu trúc được viết bởi bác sĩ X quang/bác sĩ đa khoa, với phương pháp ẩn danh theo luật Safe Harbor và cách tiếp cận thay đổi ngày tháng tương tự được áp dụng.
2. Siêu dữ liệu DICOM (với Safe Harbor)
Tất cả siêu dữ liệu DICOM tiêu chuẩn đều được bảo toàn để truyền tải trong khi các định danh theo quy định HIPAA Safe Harbor được ẩn danh, bao gồm:
- Tên bệnh nhân được thay thế bằng Mã số bệnh nhân
- Mã định danh bệnh nhân được mã hóa bằng hàm băm mật mã.
- Tên tổ chức được thay thế bằng một tên khác.
- Ngày tháng được điều chỉnh trong vòng 365 ngày (sự điều chỉnh nhất quán ở cấp độ bệnh nhân).
4. Siêu dữ liệu tùy chỉnh (tùy chọn bổ sung giá trị)
Siêu dữ liệu phái sinh tùy chọn có thể bao gồm:
- Tuổi bệnh nhân đã được phân tích
- Các thẻ SNOMED (từ báo cáo)
- Các thực thể tích cực (theo báo cáo)
- Quốc gia cư trú (địa chỉ xuất phát)
- Chủng tộc/Dân tộc được suy luận (các trường dẫn xuất)
Các phương pháp khử nhận dạng DICOM ưu tiên quyền riêng tư
Bộ dữ liệu sử dụng hàm băm mật mã và mã hóa ẩn danh để tuân thủ HIPAA đồng thời vẫn giữ được tính hữu ích trong lâm sàng và bảo vệ dữ liệu nhạy cảm.
Bảo vệ ở cấp độ pixel
Chỉnh sửa/che giấu danh tính văn bản được khắc chìm và loại bỏ lớp phủ khi cần thiết.
Bảo vệ siêu dữ liệu
Các định danh Safe Harbor được ẩn danh, trong khi siêu dữ liệu DICOM tiêu chuẩn được bảo toàn.
Chuyển ngày
Các mốc thời gian được điều chỉnh trong phạm vi 365 ngày, ở cấp độ bệnh nhân, để duy trì mối quan hệ về mặt thời gian giữa các nghiên cứu.
Sàn nhà theo nhân khẩu học
Một số trường thông tin được giới hạn trên/dưới để giảm nguy cơ nhận dạng lại (ví dụ: tuổi, cân nặng, kích thước và một số giá trị về dân tộc).
Không thể tìm thấy những gì bạn đang tìm kiếm?
Bộ dữ liệu y tế mới có sẵn đang được thu thập trên tất cả các loại dữ liệu
Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo chăm sóc sức khỏe của bạn
Những câu hỏi thường gặp (FAQ)
1. Bộ dữ liệu hình ảnh DICOM là gì?
Bộ dữ liệu hình ảnh DICOM là tập hợp các nghiên cứu hình ảnh y tế được lưu trữ theo tiêu chuẩn DICOM, bao gồm dữ liệu pixel và siêu dữ liệu lâm sàng, thường được sử dụng để huấn luyện và xác thực các mô hình AI chăm sóc sức khỏe.
2. Bộ dữ liệu hình ảnh DICOM này bao gồm những gì?
Tùy thuộc vào phạm vi cấp phép, nó có thể bao gồm dữ liệu pixel DICOM, siêu dữ liệu DICOM được bảo toàn (đã ẩn danh), báo cáo nghiên cứu tùy chọn và siêu dữ liệu tùy chỉnh có giá trị gia tăng tùy chọn.
3. Các hình ảnh đã được ẩn danh chưa?
Đúng vậy. Hình ảnh được ẩn danh ở cấp độ pixel, bao gồm việc che mờ/mã hóa văn bản trên hình ảnh và làm mờ các chi tiết không cần thiết khi cần.
4. Dữ liệu siêu dữ liệu DICOM có được bảo toàn không?
Siêu dữ liệu DICOM tiêu chuẩn được giữ nguyên để truyền tải, trong khi các định danh theo quy định HIPAA Safe Harbor được ẩn danh (ví dụ: định danh bệnh nhân/cơ sở y tế và ngày tháng).
5. Ngày tháng được xử lý như thế nào?
Ngày tháng có thể được điều chỉnh trong vòng 365 ngày, áp dụng nhất quán ở cấp độ bệnh nhân để duy trì tính tương đối về thời gian giữa các nghiên cứu.
6. Có bao gồm báo cáo chụp X-quang/kết quả nghiên cứu không?
Khi có sẵn và được cấp phép, các báo cáo nghiên cứu (văn bản tường thuật không có cấu trúc) có thể được đưa vào, với các định danh được mã hóa.
7. Những loại siêu dữ liệu tùy chỉnh nào có thể được cung cấp?
Các tùy chọn có thể bao gồm tuổi bệnh nhân đã được phân tích cú pháp, thẻ SNOMED, các thực thể tích cực, quốc gia cư trú và các trường dẫn xuất khác.
8. Tôi có thể yêu cầu một nhóm đối tượng cụ thể (phương thức điều trị, bộ phận cơ thể, khu vực địa lý, v.v.) không?
Vâng—hãy chia sẻ phạm vi mục tiêu và các bộ lọc của bạn, và Shaip sẽ đề xuất phân đoạn dữ liệu phù hợp nhất dựa trên tính khả dụng.
9. Tôi cần cấp phép sử dụng bộ dữ liệu như thế nào?
Vui lòng gửi yêu cầu của bạn qua biểu mẫu Liên hệ với chúng tôi. Nhóm của chúng tôi sẽ xác nhận tính khả dụng, phạm vi, điều khoản cấp phép và các tùy chọn giao hàng.