Cải thiện nghiên cứu NLP ung thư

Độ chính xác của dữ liệu ung thư: Cấp phép, hủy nhận dạng và chú thích để đổi mới mô hình NLP

Ung thư nlp

Cách mạng hóa việc chăm sóc ung thư bằng công nghệ NLP tiên tiến

Khách hàng, một công ty lớn trong ngành chăm sóc sức khỏe, đã yêu cầu một giải pháp NLP tiên tiến để xử lý một khối lượng đáng kể hồ sơ y tế về ung thư. Là một phần của sáng kiến ​​quan trọng nhằm cải tiến nghiên cứu ung thư, nhu cầu cân bằng giữa phân tích dữ liệu chi tiết với các tiêu chuẩn nghiêm ngặt về quyền riêng tư là điều tối quan trọng. Nghiên cứu điển hình này nêu ra những đóng góp của chúng tôi trong việc nâng cao nỗ lực nghiên cứu của khách hàng thông qua chú thích dữ liệu có độ chính xác cao, thực hành loại bỏ nhận dạng nghiêm ngặt và áp dụng các kỹ thuật Xử lý ngôn ngữ tự nhiên (NLP), tất cả đều nằm trong khung pháp lý do HIPAA cung cấp.

Khối lượng

Cấp phép dữ liệu + Xóa dữ liệu
10 trang
Mối quan hệ ung thư
10 trang
Tên miền không ung thư
10 trang
Phủ định
10 trang
Tên miền ung thư
10 trang
NER + Bản đồ mối quan hệ
10 trang

Những thách thức

Dự án yêu cầu sự hiểu biết sâu sắc về tài liệu lâm sàng, nhận dạng chính xác các thực thể y tế và khả năng áp dụng nhãn phủ định một cách chính xác, tất cả đều nằm trong khuôn khổ an toàn nhằm bảo vệ quyền riêng tư của bệnh nhân theo quy định của HIPAA. Nỗ lực này không chỉ đòi hỏi chuyên môn kỹ thuật trong việc xử lý khối lượng lớn dữ liệu phức tạp mà còn cả cách tiếp cận chiến lược để kết hợp phản hồi và duy trì chất lượng trong tất cả các giai đoạn của quy trình chú thích.

Mục tiêu

Mô tả chi tiết dịch vụ

Phân loạiMô tả
Bao phủ dữ liệu lâm sàng toàn diệnBao gồm nhiều loại ghi chú, cơ sở chăm sóc và chuyên khoa ung thư khác nhau, đảm bảo bộ dữ liệu mạnh mẽ phản ánh các tình huống lâm sàng đa dạng.
Xác định danh tính nghiêm ngặtĐảm bảo tất cả các hồ sơ được gắn nhãn đều được xác định lại theo phương pháp Cảng an toàn của HIPAA, đảm bảo sự tin cậy của khách hàng về quyền riêng tư và bảo mật dữ liệu.
Nguyên tắc chú thíchTạo và triển khai các nguyên tắc chú thích dữ liệu tiêu chuẩn để chuẩn bị Hồ sơ được gắn nhãn phù hợp với tiêu chuẩn HIPAA.
Chiến lược chú thích nâng caoViệc chú thích thủ công 10,000 trang hồ sơ liên quan đến ung thư đã được thực hiện với trọng tâm chi tiết là xác định các trạng thái phủ định và thông tin thích hợp khác theo các hướng dẫn đã được thiết lập.
Đảm bảo chất lượng nghiêm ngặtĐạt được tiêu chuẩn chất lượng quy định được nêu trong hướng dẫn

Dung dịch

Cách tiếp cận của chúng tôi liên quan đến các chiến lược chính sau:

Biên soạn bộ dữ liệu ung thư tùy chỉnh

Từ kho lưu trữ khổng lồ gồm hơn 5 MN EHR, một tập hợp con dữ liệu được lựa chọn cẩn thận đã được trích xuất nhằm giải quyết các yêu cầu chuyên biệt của khách hàng về dữ liệu ung thư, tập trung vào các thực thể gen. Quá trình thu thập bao gồm việc tạo ra một danh sách đầy đủ các dấu hiệu khối u, gen, biến thể và giai đoạn TNM, sử dụng tìm kiếm từ khóa để xác định chính xác các tài liệu có nhiều trong dữ liệu này. Các biểu thức thông thường được sử dụng để xác định một loạt các biến thể di truyền và các giai đoạn ung thư. Cách tiếp cận này, kết hợp với phạm vi dữ liệu rộng bao gồm nhiều loại tài liệu, chuyên khoa, cơ sở chăm sóc và dữ liệu từ nhiều bác sĩ, đã đảm bảo một bộ dữ liệu ung thư toàn diện và phù hợp.

Oncology dataset compilation

Xác định danh tính nghiêm ngặt

Quy trình này tuân thủ nghiêm ngặt phương pháp Che giấu an toàn của HIPAA để loại bỏ nhận dạng, đảm bảo sự tin cậy của khách hàng về quyền riêng tư và bảo mật dữ liệu. Điều này liên quan đến việc xóa tất cả Thông tin sức khỏe được bảo vệ (PHI) và thay thế nó bằng các phần giữ chỗ được gắn nhãn, từ đó duy trì tính hữu ích của dữ liệu trong khi bảo vệ tính bảo mật của bệnh nhân.

Các biến khử nhận dạng

Phân loạiTiểu thể loại
Họ tênTên bệnh nhân, Tên bác sĩ, Tên y tá, Tên thành viên gia đình, Tên trung tâm y tế, Tên phòng khám, Tên viện dưỡng lão, Tên công ty, Tên trường đại học
Độ tuổi 
NgàyMẫu ngày, mẫu tháng năm, mẫu ngày tháng, mẫu ngày năm, ngày, tháng, năm, mùa
Địa ChỉQuốc gia, Tiểu bang, Thành phố, Đường phố, Mã ZIP, Số phòng, Số phòng, Số tầng
IDSố an sinh xã hội, Số hồ sơ y tế, Số người thụ hưởng chương trình sức khỏe, Số tài khoản, Số chứng chỉ/giấy phép, ID sinh trắc học, ID hồ sơ, Số gia nhập, Số nhận dạng phương tiện, Số biển số xe Số nhận dạng thiết bị và số sê-ri
Liên hệSố điện thoại, số Fax, địa chỉ Email, URL Web, địa chỉ IP

Ví dụ:

Vào ngày 25 tháng 2106 năm 11, lúc 00 giờ sáng, ông Harry Pace, 90 tuổi, được đưa vào Bệnh viện Đa khoa Forrest để phẫu thuật hông theo lịch trình, trước đó đã được bác sĩ chăm sóc chính của ông, Tiến sĩ Jose Martin tư vấn, và có sự tham dự của Kendra Reith, MD. Trong thời gian lưu trú, anh ấy được chăm sóc bởi Mary Hu, NP, và Suzan Ray, RN, cùng với R. Charles Melancon, PA, cũng được tư vấn. Ca phẫu thuật của anh ấy, được tiến hành cùng ngày nhập viện, đã thành công và không có biến chứng nào được báo cáo. Sau phẫu thuật, ông Pace được chuyển về Phòng 202, tầng 2 để hồi phục. Vợ ông, Emma Pace, đã có mặt xuyên suốt và được cung cấp mọi thông tin cập nhật cần thiết. Trong thời gian lưu trú ngắn ngủi của ông, hồ sơ y tế của ông, bao gồm MRN MR99062619 và Tài khoản KV000014764, được xử lý theo các quy trình tiêu chuẩn của Viện dưỡng lão Gracewood, nơi ở trước đây của ông. Anh ta được xuất viện sau đó cùng ngày để được chăm sóc tại Phòng khám Ngoại trú Oakland để phục hồi sức khỏe thêm. Trong suốt quá trình, tất cả các thủ tục đều được ghi lại và bảo đảm tuân thủ các tiêu chuẩn bảo mật.

Ví dụ: Không xác định được

On [Mẫu ngày tháng], vào lúc 11 giờ sáng, ông. [Tên bệnh nhân], tuổi [Già đi], đã được nhận vào [Tên trung tâm y tế] cho một cuộc phẫu thuật hông theo lịch trình, trước đó đã được tư vấn bởi bác sĩ chăm sóc chính của ông, Tiến sĩ John. [Tên bác sĩ], và có sự tham dự của [Tên bác sĩ] MD. Trong thời gian lưu trú, ông được chăm sóc bởi [Y tá hành nghề], NP và [Y tá hành nghề], RN, với [Tên bác sĩ], PA, cũng đang được lấy ý kiến. Ca phẫu thuật của anh ấy, được tiến hành cùng ngày nhập viện, đã thành công và không có biến chứng nào được báo cáo. Sau cuộc phẫu thuật, anh T. [Tên bệnh nhân] đã được chuyển đến Phòng số. [Số phòng], Tầng số. [Lầu số], để phục hồi. Vợ anh ấy, [Tên thành viên gia đình], đã có mặt xuyên suốt và được cung cấp tất cả các thông tin cập nhật cần thiết. Trong thời gian lưu trú ngắn ngủi, hồ sơ bệnh án của ông, bao gồm cả MRN [Số hồ sơ y tế] và Tài khoản [Số tài khoản], được xử lý theo các giao thức chuẩn của [Tên viện dưỡng lão], nơi ở trước đây của anh ấy. Anh ấy đã được xuất viện sau đó cùng ngày để được chăm sóc bởi [Tên phòng khám] để phục hồi thêm. Trong suốt quá trình, tất cả các thủ tục đều được ghi lại và bảo đảm tuân thủ các tiêu chuẩn bảo mật.

Nguyên tắc chú thích & Kỹ thuật chú thích nâng cao

Shaip có công trong việc thiết lập và triển khai các nguyên tắc chú thích dữ liệu tiêu chuẩn để đảm bảo rằng tất cả các Hồ sơ được gắn nhãn đều được chuẩn bị một cách nhất quán và tuân thủ các tiêu chuẩn HIPAA. Hơn nữa, 10,000 trang từ các hồ sơ y tế khác nhau đã được chú thích tỉ mỉ, tập trung vào việc ghi nhãn chi tiết về các trạng thái phủ định và các thực thể liên quan đến lâm sàng khác bao gồm các chuyên khoa ung thư khác nhau. Chú thích được thực hiện bởi một nhóm chuyên gia chú thích có kiến ​​thức chuyên môn về ung thư và các quy định về quyền riêng tư dữ liệu.

Tiêu chí chú thích phức tạp

Phân loạiTiểu thể loại
Chú thích ngày (Ung thư)Ngày chẩn đoán, Ngày giai đoạn, Bắt đầu, Ngày thủ thuật, Ngày bắt đầu dùng thuốc, Ngày kết thúc thuốc, Ngày bắt đầu xạ trị, Ngày kết thúc xạ trị
Bệnh (Ung thư)Vấn đề về ung thư, Mô học, Tình trạng lâm sàng, Vị trí cơ thể, Hành vi, Cấp độ, Giai đoạn ung thư, Giai đoạn TNM, Xét nghiệm dấu hiệu khối u, Kích thước, Mã
Điều trị (Ung thư)Y học điều trị ung thư, Liều lượng thuốc, Tần suất, Phẫu thuật ung thư, Kết quả phẫu thuật, Phương thức xạ trị, Liều lượng xạ trị
GenomicsMã biến thể, nghiên cứu gen, phương pháp, mẫu vật
Phủ địnhTiêu cực, Có thể tiêu cực, Không chắc chắn, Có thể tích cực
NER lâm sàngVấn đề về ung thư – Vị trí cơ thể, Mô học – Vị trí cơ thể, Hành vi – Vị trí cơ thể, Phẫu thuật ung thư – Các mối quan hệ Vị trí cơ thể, Phương thức bức xạ – Vị trí cơ thể, Mô học – Cấp độ, Vấn đề ung thư – Kích thước

Ví dụ:

Tuyên bố ghi chú lâm sàng ung thư

Tuyên bố ghi chú lâm sàng về ung thư

“Bệnh nhân Jane Doe được chẩn đoán mắc bệnh ung thư phổi không phải tế bào nhỏ (NSCLC) Giai đoạn IIIB, cụ thể là ung thư biểu mô tuyến, vào ngày 03/05/2023. Ung thư nằm ở thùy dưới bên phải của phổi. Nó được phân loại là T3N2M0 theo hệ thống phân giai đoạn TNM, với kích thước khối u là 5 cm x 3 cm. Việc xóa EGFR exon 19 đã được xác định thông qua phân tích PCR mẫu sinh thiết khối u. Hóa trị bằng Carboplatin AUC 5 và Pemeterxed 500 mg/m03 được bắt đầu vào ngày 20/2023/3 và được thực hiện 60 tuần một lần. Liệu pháp xạ trị chùm tia ngoài (EBRT) với liều 30 Gy chia 04 đợt bắt đầu vào ngày 01/2023/XNUMX. Quá trình điều trị của bệnh nhân đang diễn ra và không có bằng chứng nào về di căn não trên kết quả chụp MRI gần đây. Khả năng xâm lấn mạch bạch huyết vẫn chưa được xác định và khả năng dung nạp của bệnh nhân đối với chế độ hóa trị đầy đủ vẫn chưa chắc chắn.

Tuyên bố ghi chú lâm sàng về ung thư

Tuyên bố ghi chú lâm sàng ung thư

Đảm bảo chất lượng nghiêm ngặt

Triển khai khung quản lý dự án linh hoạt tạo điều kiện thuận lợi cho việc tích hợp hiệu quả phản hồi của khách hàng đồng thời duy trì các tiêu chuẩn chất lượng nghiêm ngặt. Một quy trình đảm bảo chất lượng toàn diện đã được thực thi, phù hợp với các hướng dẫn để đạt được các tiêu chuẩn chất lượng cần thiết. Giao thức này bao gồm các vòng xem xét và xác minh liên tiếp, đảm bảo độ chính xác và độ tin cậy của dữ liệu được chú thích. Việc giám sát chất lượng tỉ mỉ như vậy là rất quan trọng trong việc tạo ra một giải pháp NLP đáng tin cậy, rất quan trọng cho việc ra quyết định lâm sàng sáng suốt và nghiên cứu xuất sắc.

Kết quả

Đã phân phối thành công 10,000 Bản ghi được gắn nhãn không xác định, chất lượng cao, cung cấp bộ dữ liệu an toàn và có giá trị cho việc phát triển mô hình NLP của khách hàng. Việc áp dụng NLP tỉ mỉ và tuân thủ các tiêu chuẩn loại bỏ nhận dạng HIPAA đã tạo ra một tập dữ liệu được tinh chỉnh cao sẽ củng cố các nỗ lực nghiên cứu ung thư đang diễn ra và trong tương lai của khách hàng, cuối cùng nhằm mục đích nâng cao kết quả của bệnh nhân ung thư và hiệu quả cung cấp dịch vụ chăm sóc.

Thành công của dự án thể hiện khả năng của chúng tôi trong việc xử lý dữ liệu y tế phức tạp một cách chính xác, góp phần vào mục tiêu của khách hàng là cải thiện kết quả chăm sóc bệnh nhân và đẩy nhanh tốc độ đổi mới chăm sóc sức khỏe.

Sự hợp tác của chúng tôi với Shaip là công cụ giúp nâng cao khả năng NLP của chúng tôi trong lĩnh vực ung thư. Việc xử lý chuyên nghiệp 10,000 hồ sơ y tế, được chú thích bằng sự phủ định chi tiết và các thực thể lâm sàng khác, đã thể hiện cam kết của họ về sự xuất sắc và tuân thủ. Hơn nữa, cam kết của họ đối với các tiêu chuẩn về quyền riêng tư như HIPAA đã cung cấp cho chúng tôi những nguồn lực vô giá để thúc đẩy các sáng kiến ​​AI của chúng tôi nhằm phát triển các phương pháp chẩn đoán và điều trị ung thư tiên tiến.

Vàng-5 sao

Tăng tốc AI chăm sóc sức khỏe của bạn
phát triển ứng dụng 100%