Nghiên cứu điển hình: AI hội thoại

Độ chính xác của dữ liệu ung thư: Cấp phép, hủy nhận dạng và chú thích để đổi mới mô hình NLP

Cách mạng hóa việc chăm sóc bệnh ung thư bằng công nghệ NLP tiên tiến.

Phát triển NLP về ung thư

Tổng Quan Dự Án

Khách hàng, một công ty lớn trong ngành chăm sóc sức khỏe, đã yêu cầu một giải pháp NLP tiên tiến để xử lý một khối lượng đáng kể hồ sơ y tế về ung thư. Là một phần của sáng kiến ​​quan trọng nhằm cải tiến nghiên cứu ung thư, nhu cầu cân bằng giữa phân tích dữ liệu chi tiết với các tiêu chuẩn nghiêm ngặt về quyền riêng tư là điều tối quan trọng. Nghiên cứu điển hình này nêu ra những đóng góp của chúng tôi trong việc nâng cao nỗ lực nghiên cứu của khách hàng thông qua chú thích dữ liệu có độ chính xác cao, thực hành loại bỏ nhận dạng nghiêm ngặt và áp dụng các kỹ thuật Xử lý ngôn ngữ tự nhiên (NLP), tất cả đều nằm trong khung pháp lý do HIPAA cung cấp.

Phát triển NLP về ung thư

Số liệu thống kê chính

Cấp phép dữ liệu
+ Dữ liệu De-id

10,000 trang

Không phải ung thư
miền

10,000 trang

Ung thư
miền

10,000 trang

Ung thư
Mối quan hệ

4500 trang

Phủ định

9000 trang

Mối quan hệ NER +
Lập bản đồ

1223 trang

Những thách thức

Dự án yêu cầu sự hiểu biết sâu sắc về tài liệu lâm sàng, nhận dạng chính xác các thực thể y tế và khả năng áp dụng nhãn phủ định một cách chính xác, tất cả đều nằm trong khuôn khổ an toàn nhằm bảo vệ quyền riêng tư của bệnh nhân theo quy định của HIPAA. Nỗ lực này không chỉ đòi hỏi chuyên môn kỹ thuật trong việc xử lý khối lượng lớn dữ liệu phức tạp mà còn cả cách tiếp cận chiến lược để kết hợp phản hồi và duy trì chất lượng trong tất cả các giai đoạn của quy trình chú thích.

Mô tả chi tiết về dịch vụ:

  • Phạm vi dữ liệu lâm sàng toàn diện: Bao gồm nhiều loại ghi chú, bối cảnh chăm sóc và chuyên khoa ung thư khác nhau, đảm bảo có một tập dữ liệu mạnh mẽ phản ánh nhiều tình huống lâm sàng khác nhau.
  • Hủy nhận dạng nghiêm ngặt: Đảm bảo tất cả các hồ sơ được gắn nhãn đều được xác định lại theo phương pháp Cảng an toàn của HIPAA, đảm bảo sự tin cậy của khách hàng về quyền riêng tư và bảo mật dữ liệu.
  • Nguyên tắc chú thích: Tạo và triển khai các nguyên tắc chú thích dữ liệu tiêu chuẩn để chuẩn bị Hồ sơ được gắn nhãn phù hợp với tiêu chuẩn HIPAA.
  • Kỹ thuật chú thích nâng cao: Ứng dụng NLP vào 10,000 trang hồ sơ liên quan đến ung thư, bao gồm việc dán nhãn phức tạp các trạng thái phủ định và các chi tiết liên quan khác theo các hướng dẫn đã thiết lập trước đó.
  • Đảm bảo chất lượng nghiêm ngặt: Đạt được tiêu chuẩn chất lượng cụ thể được nêu trong hướng dẫn.

Dung dịch

Cách tiếp cận của chúng tôi liên quan đến các chiến lược chính sau:

Bao phủ dữ liệu lâm sàng toàn diện

Để điều chỉnh tập dữ liệu theo nhu cầu cụ thể của khách hàng, một lựa chọn dữ liệu mục tiêu đã được trích xuất tỉ mỉ từ kho lưu trữ rộng lớn của Shaip gồm hơn 5 triệu Hồ sơ sức khỏe điện tử. Tập dữ liệu được quản lý này bao gồm nhiều loại ghi chú và cài đặt chăm sóc, cung cấp một
phổ các tình huống lâm sàng. Điều này đảm bảo một tập dữ liệu không chỉ toàn diện mà còn có tính đại diện cao cho dữ liệu y tế thực tế.

Xác định danh tính nghiêm ngặt

Quy trình này tuân thủ nghiêm ngặt phương pháp Che giấu an toàn của HIPAA để loại bỏ nhận dạng, đảm bảo sự tin cậy của khách hàng về quyền riêng tư và bảo mật dữ liệu. Điều này liên quan đến việc xóa tất cả Thông tin sức khỏe được bảo vệ (PHI) và thay thế nó bằng các phần giữ chỗ được gắn nhãn, từ đó duy trì tính hữu ích của dữ liệu trong khi bảo vệ tính bảo mật của bệnh nhân.

Các biến khử nhận dạng

Phân loạiTiểu thể loại
Họ tênTên bệnh nhân, Tên bác sĩ, Tên y tá, Tên thành viên gia đình, Tên trung tâm y tế, Tên phòng khám, Tên viện dưỡng lão, Tên công ty, Tên trường đại học
Độ tuổi 
NgàyMẫu ngày, mẫu tháng năm, mẫu ngày tháng, mẫu ngày năm, ngày, tháng, năm, mùa
Địa điểmQuốc gia, Tiểu bang, Thành phố, Đường phố, Mã ZIP, Số phòng, Số phòng, Số tầng
IDSố an sinh xã hội, Số hồ sơ y tế, Số người hưởng lợi từ chương trình bảo hiểm y tế, Số tài khoản, Số giấy chứng nhận/giấy phép, ID sinh trắc học, ID hồ sơ, Số gia nhập, Số nhận dạng xe, Số biển số xe Mã định danh thiết bị và số sê-ri
Liên lạcSố điện thoại, số Fax, địa chỉ Email, URL Web, địa chỉ IP

Ví dụ:

Vào ngày 25 tháng 2106 năm 11, lúc 00 giờ sáng, ông Harry Pace, 90 tuổi, được đưa vào Bệnh viện Đa khoa Forrest để phẫu thuật hông theo lịch trình, trước đó đã được bác sĩ chăm sóc chính của ông, Tiến sĩ Jose Martin tư vấn, và có sự tham dự của Kendra Reith, MD. Trong thời gian lưu trú, anh ấy được chăm sóc bởi Mary Hu, NP, và Suzan Ray, RN, cùng với R. Charles Melancon, PA, cũng được tư vấn. Ca phẫu thuật của anh ấy, được tiến hành cùng ngày nhập viện, đã thành công và không có biến chứng nào được báo cáo. Sau phẫu thuật, ông Pace được chuyển về Phòng 202, tầng 2 để hồi phục. Vợ ông, Emma Pace, đã có mặt xuyên suốt và được cung cấp mọi thông tin cập nhật cần thiết. Trong thời gian lưu trú ngắn ngủi của ông, hồ sơ y tế của ông, bao gồm MRN MR99062619 và Tài khoản KV000014764, được xử lý theo các quy trình tiêu chuẩn của Viện dưỡng lão Gracewood, nơi ở trước đây của ông. Anh ta được xuất viện sau đó cùng ngày để được chăm sóc tại Phòng khám Ngoại trú Oakland để phục hồi sức khỏe thêm. Trong suốt quá trình, tất cả các thủ tục đều được ghi lại và bảo đảm tuân thủ các tiêu chuẩn bảo mật.

Ví dụ: Không xác định được

On [Mẫu ngày tháng], vào lúc 11 giờ sáng, ông. [Tên bệnh nhân], tuổi [Già đi], đã được nhận vào [Tên trung tâm y tế] cho một cuộc phẫu thuật hông theo lịch trình, trước đó đã được tư vấn bởi bác sĩ chăm sóc chính của ông, Tiến sĩ John. [Tên bác sĩ]và có sự tham dự của [Tên bác sĩ] MD. Trong thời gian lưu trú, ông được chăm sóc bởi [Y tá hành nghề], NP, và [Y tá hành nghề], RN, với [Tên bác sĩ], PA, cũng đang được tham vấn. Ca phẫu thuật của ông, được tiến hành vào cùng ngày nhập viện, đã thành công mà không có biến chứng nào được báo cáo. Sau ca phẫu thuật, ông. [Tên bệnh nhân] đã được chuyển đến Phòng số. [Số phòng], Tầng số [Số Tầng], để phục hồi. Vợ anh ấy, [Tên thành viên gia đình], đã có mặt trong suốt thời gian và được cung cấp tất cả các thông tin cập nhật cần thiết. Trong thời gian lưu trú ngắn ngủi của mình, hồ sơ bệnh án của ông, bao gồm MRN [Số hồ sơ y tế] và Tài khoản [Số tài khoản], đã được xử lý theo các giao thức chuẩn của [Tên Viện dưỡng lão], nơi cư trú trước đây của ông. Ông đã được xuất viện sau đó cùng ngày để được chăm sóc [Tên phòng khám] để phục hồi thêm. Trong suốt quá trình, tất cả các thủ tục đều được ghi lại và bảo đảm tuân thủ các tiêu chuẩn bảo mật.

Nguyên tắc chú thích & Kỹ thuật chú thích nâng cao

Shaip đóng vai trò quan trọng trong việc thiết lập và triển khai các hướng dẫn chú thích dữ liệu chuẩn, đảm bảo rằng tất cả các Hồ sơ được dán nhãn đều được chuẩn bị một cách nhất quán và tuân thủ các tiêu chuẩn HIPAA. Hơn nữa, 10,000 trang từ nhiều hồ sơ y tế khác nhau đã được chú thích tỉ mỉ, với
tập trung vào việc dán nhãn chi tiết các trạng thái phủ định và các thực thể có liên quan về mặt lâm sàng khác bao gồm nhiều chuyên khoa phụ về ung thư. Việc chú thích được thực hiện bởi một nhóm chuyên gia chú thích có kiến ​​thức chuyên sâu về ung thư và các quy định về quyền riêng tư dữ liệu.

Chú thích phức tạp

Phân loạiTiểu thể loại
Ngày
Chú thích
(Ung thư)
Ngày chẩn đoán, Ngày giai đoạn, Ngày bắt đầu, Ngày thủ thuật, Ngày bắt đầu dùng thuốc, Ngày kết thúc dùng thuốc,
Ngày bắt đầu bức xạ, Ngày kết thúc bức xạ
Bệnh
(Ung thư)
Vấn đề về ung thư, Mô học, Tình trạng lâm sàng, Vị trí cơ thể, Hành vi, Cấp độ, Giai đoạn ung thư, Giai đoạn TNM, Xét nghiệm dấu hiệu khối u, Kích thước, Mã
Dưỡng mi
(Ung thư)
Y học điều trị ung thư, Liều lượng thuốc, Tần suất, Phẫu thuật ung thư, Kết quả phẫu thuật, Phương thức xạ trị, Liều lượng xạ trị
GenomicsMã biến thể, nghiên cứu gen, phương pháp, mẫu vật
Phủ địnhTiêu cực, Có thể tiêu cực, Không chắc chắn, Có thể tích cực
NER lâm sàng
Mối quan hệ
Vấn đề ung thư – Vị trí cơ thể, Mô học – Vị trí cơ thể, Hành vi – Vị trí cơ thể, Phẫu thuật ung thư – Vị trí cơ thể, Phương thức xạ trị – Vị trí cơ thể, Mô học – Cấp độ, Vấn đề ung thư – Kích thước

Ví dụ:

Tuyên bố ghi chú lâm sàng ung thư

Tuyên bố ghi chú lâm sàng về ung thư

“Bệnh nhân Jane Doe được chẩn đoán mắc bệnh ung thư phổi không phải tế bào nhỏ (NSCLC) Giai đoạn IIIB, cụ thể là ung thư biểu mô tuyến, vào ngày 03/05/2023. Ung thư nằm ở thùy dưới bên phải của phổi. Nó được phân loại là T3N2M0 theo hệ thống phân giai đoạn TNM, với kích thước khối u là 5 cm x 3 cm. Việc xóa EGFR exon 19 đã được xác định thông qua phân tích PCR mẫu sinh thiết khối u. Hóa trị bằng Carboplatin AUC 5 và Pemeterxed 500 mg/m03 được bắt đầu vào ngày 20/2023/3 và được thực hiện 60 tuần một lần. Liệu pháp xạ trị chùm tia ngoài (EBRT) với liều 30 Gy chia 04 đợt bắt đầu vào ngày 01/2023/XNUMX. Quá trình điều trị của bệnh nhân đang diễn ra và không có bằng chứng nào về di căn não trên kết quả chụp MRI gần đây. Khả năng xâm lấn mạch bạch huyết vẫn chưa được xác định và khả năng dung nạp của bệnh nhân đối với chế độ hóa trị đầy đủ vẫn chưa chắc chắn.

Tuyên bố ghi chú lâm sàng về ung thư:

Tuyên bố ghi chú lâm sàng ung thư

Đảm bảo chất lượng nghiêm ngặt

Đã triển khai một khuôn khổ quản lý dự án linh hoạt tạo điều kiện thuận lợi cho việc tích hợp hiệu quả phản hồi của khách hàng trong khi vẫn duy trì các tiêu chuẩn chất lượng nghiêm ngặt. Một giao thức đảm bảo chất lượng toàn diện đã được thực thi, phù hợp với các hướng dẫn để đạt được các tiêu chuẩn chất lượng cần thiết. Giao thức này có các vòng đánh giá và xác minh liên tiếp, đảm bảo độ chính xác và độ tin cậy của dữ liệu được chú thích. Việc giám sát chất lượng tỉ mỉ như vậy rất quan trọng trong việc tạo ra một giải pháp NLP đáng tin cậy, rất quan trọng đối với việc ra quyết định lâm sàng sáng suốt và sự xuất sắc trong nghiên cứu.

Các kết quả

Đã chuyển giao thành công 10,000 Hồ sơ được gắn nhãn ẩn danh chất lượng cao, cung cấp một tập dữ liệu an toàn và có giá trị cho quá trình phát triển mô hình NLP của khách hàng. Việc áp dụng NLP một cách tỉ mỉ và tuân thủ các tiêu chuẩn ẩn danh HIPAA đã tạo ra một tập dữ liệu được tinh chỉnh cao sẽ hỗ trợ cho các nỗ lực nghiên cứu ung thư đang diễn ra và trong tương lai của khách hàng, cuối cùng hướng đến mục tiêu nâng cao kết quả điều trị ung thư cho bệnh nhân và hiệu quả cung cấp dịch vụ chăm sóc.

Sự thành công của dự án minh họa cho khả năng xử lý dữ liệu y tế phức tạp của chúng tôi một cách chính xác, góp phần vào mục tiêu cải thiện kết quả chăm sóc bệnh nhân của khách hàng và đẩy nhanh tốc độ đổi mới chăm sóc sức khỏe.

Sự hợp tác của chúng tôi với Shaip là công cụ giúp nâng cao khả năng NLP của chúng tôi trong lĩnh vực ung thư. Việc xử lý chuyên nghiệp 10,000 hồ sơ y tế, được chú thích bằng sự phủ định chi tiết và các thực thể lâm sàng khác, đã thể hiện cam kết của họ về sự xuất sắc và tuân thủ. Hơn nữa, cam kết của họ đối với các tiêu chuẩn về quyền riêng tư như HIPAA đã cung cấp cho chúng tôi những nguồn lực vô giá để thúc đẩy các sáng kiến ​​AI của chúng tôi nhằm phát triển các phương pháp chẩn đoán và điều trị ung thư tiên tiến.

Vàng-5 sao