Định nghĩa
Nhận dạng thực thể y tế có tên (NER) là quá trình xác định và phân loại các thuật ngữ y tế quan trọng như bệnh tật, triệu chứng, thuốc hoặc quy trình trong văn bản lâm sàng.
Mục đích
Mục đích là trích xuất thông tin y tế có cấu trúc từ hồ sơ phi cấu trúc, hỗ trợ phân tích chăm sóc sức khỏe, nghiên cứu và ra quyết định lâm sàng.
Tầm quan trọng
- Cho phép sử dụng hồ sơ sức khỏe điện tử (EHR) tốt hơn.
- Hỗ trợ nghiên cứu y tế và phát hiện thuốc.
- Yêu cầu độ chính xác cao do độ nhạy lâm sàng.
- Phải tuân thủ các tiêu chuẩn về quyền riêng tư dữ liệu và HIPAA/GDPR.
Quy trình triển khai
- Thu thập tài liệu y tế hoặc dữ liệu EHR.
- Xác định các thực thể quan tâm (bệnh tật, phương pháp điều trị, thuốc).
- Đào tạo các mô hình NER trên các tập dữ liệu có chú thích.
- Áp dụng mô hình để trích xuất các thực thể trong bản ghi mới.
- Sử dụng kết quả để phân tích lâm sàng hoặc hỗ trợ quyết định.
Ví dụ (Thực tế)
- Bộ dữ liệu MIMIC-III: ghi chú lâm sàng có chú thích cho nghiên cứu NER.
- IBM Watson Health: trích xuất thông tin y tế từ EHR.
- MetaMap (NIH): xác định các khái niệm y sinh trong văn bản.
Tài liệu tham khảo / Đọc thêm
- ISO/TS 22220: Tin học y tế — Cấu trúc và thành phần dữ liệu.
- “Nhận dạng thực thể có tên lâm sàng: Một bài đánh giá.” Tạp chí tin sinh học y khoa.
- Cơ sở dữ liệu lâm sàng MIMIC-III.
- Sự công nhận của thực thể y tế được đặt tên cho chăm sóc sức khỏe