Tâm trí con người từ lâu đã không thể giải thích được và bí ẩn. Và có vẻ như các nhà khoa học đã thừa nhận một ứng cử viên mới cho danh sách này – Trí tuệ nhân tạo (AI). Lúc đầu, việc hiểu tâm trí của AI nghe có vẻ khá mâu thuẫn. Tuy nhiên, khi AI dần trở nên có tri giác hơn và tiến hóa gần hơn đến việc bắt chước con người và cảm xúc của họ, chúng ta đang chứng kiến những hiện tượng vốn có ở con người và động vật – ảo giác.
Đúng vậy, có vẻ như chính chuyến đi mà tâm trí dấn thân khi bị bỏ rơi trên sa mạc, bị bỏ rơi trên một hòn đảo hoặc bị nhốt một mình trong căn phòng không có cửa sổ và cửa ra vào cũng được máy móc trải nghiệm. ảo giác AI là có thật và các chuyên gia cũng như những người đam mê công nghệ đã ghi lại nhiều quan sát và suy luận.
Trong bài viết hôm nay, chúng ta sẽ khám phá khía cạnh bí ẩn nhưng hấp dẫn này của Mô hình ngôn ngữ lớn (LLM) và tìm hiểu những sự thật kỳ lạ về ảo giác AI.
Ảo giác AI là gì?
Trong thế giới AI, ảo giác không đề cập một cách mơ hồ đến các kiểu mẫu, màu sắc, hình dạng hoặc con người mà tâm trí có thể hình dung một cách rõ ràng. Thay vào đó, ảo giác đề cập đến những sự thật và phản hồi không chính xác, không phù hợp hoặc thậm chí gây hiểu nhầm. Công cụ AI sáng tạo đưa ra lời nhắc.
Ví dụ: hãy tưởng tượng bạn hỏi một mô hình AI kính viễn vọng không gian Hubble là gì và nó bắt đầu trả lời bằng câu trả lời chẳng hạn như “Máy ảnh IMAX là một loại hình ảnh chuyển động chuyên dụng, có độ phân giải cao…”.
Câu trả lời này không liên quan. Nhưng quan trọng hơn, tại sao mô hình lại tạo ra phản hồi khác hẳn với lời nhắc được đưa ra? Các chuyên gia tin rằng ảo giác có thể xuất phát từ nhiều yếu tố như:
- Chất lượng dữ liệu đào tạo AI kém
- Các mô hình AI quá tự tin
- Sự phức tạp của các chương trình Xử lý ngôn ngữ tự nhiên (NLP)
- Lỗi mã hóa và giải mã
- Các cuộc tấn công hoặc hack đối nghịch của các mô hình AI
- Phân kỳ tham chiếu nguồn
- Độ lệch đầu vào hoặc sự mơ hồ đầu vào và hơn thế nữa
Ảo giác AI cực kỳ nguy hiểm và cường độ của nó chỉ tăng lên khi đặc tính ứng dụng của nó tăng lên.
Ví dụ: một công cụ GenAI gây ảo giác có thể gây tổn thất danh tiếng cho doanh nghiệp triển khai nó. Tuy nhiên, khi một mô hình AI tương tự được triển khai trong lĩnh vực như chăm sóc sức khỏe, nó sẽ thay đổi phương trình giữa sự sống và cái chết. Hãy hình dung điều này, nếu một mô hình AI gây ảo giác và tạo ra phản ứng với phân tích dữ liệu trong các báo cáo hình ảnh y tế của bệnh nhân, nó có thể vô tình báo cáo một khối u lành tính là ác tính, dẫn đến sai lệch trong chẩn đoán và điều trị của cá nhân đó.
Tìm hiểu các ví dụ về ảo giác AI
Ảo giác AI có nhiều loại khác nhau. Hãy hiểu một số trong những cái nổi bật nhất.
Phản hồi thông tin thực tế không chính xác
- Phản hồi tích cực sai chẳng hạn như gắn cờ ngữ pháp đúng trong văn bản là không chính xác
- Những phản hồi tiêu cực sai lầm như bỏ qua những lỗi hiển nhiên và coi chúng là lỗi thật
- Phát minh ra sự thật không tồn tại
- Nguồn không chính xác hoặc giả mạo trích dẫn
- Quá tự tin khi trả lời những câu trả lời sai. Ví dụ: Ai hát Here Comes Sun? Kim loại.
- Trộn lẫn các khái niệm, tên, địa điểm hoặc sự cố
- Những phản ứng kỳ lạ hoặc đáng sợ như tiếng cười tự chủ của ma quỷ phổ biến của Alexa và hơn thế nữa
Ngăn chặn ảo giác AI
Thông tin sai lệch do AI tạo ra thuộc bất kỳ loại nào đều có thể được phát hiện và sửa chữa. Đó là điểm đặc biệt khi làm việc với AI. Chúng tôi đã phát minh ra điều này và chúng tôi có thể khắc phục điều này. Dưới đây là một số cách chúng ta có thể làm điều này.
Hạn chế phản hồi
Họ nói rằng việc chúng ta nói bao nhiêu ngôn ngữ không quan trọng. Chúng ta cần biết khi nào nên ngừng nói về tất cả chúng. Điều này cũng áp dụng cho các mô hình AI và phản hồi của chúng. Trong bối cảnh này, chúng tôi có thể hạn chế khả năng của mô hình trong việc tạo ra phản hồi cho một khối lượng cụ thể và giảm thiểu khả năng mô hình đưa ra những kết quả kỳ lạ. Điều này được gọi là Chính quy hóa và nó cũng liên quan đến việc trừng phạt các mô hình AI vì đã tạo ra những kết quả cực đoan và kéo dài theo lời nhắc.
Các nguồn có liên quan và kín đáo để trích dẫn và trích xuất phản hồi
Khi đào tạo một mô hình AI, chúng tôi cũng có thể giới hạn các nguồn mà mô hình có thể tham khảo và trích xuất thông tin chỉ từ những nguồn hợp pháp và đáng tin cậy. Ví dụ: các mô hình AI chăm sóc sức khỏe như ví dụ mà chúng ta đã thảo luận trước đó chỉ có thể tham chiếu đến các nguồn đáng tin cậy về thông tin chứa hình ảnh y tế và công nghệ hình ảnh. Điều này ngăn máy móc tìm kiếm và liên kết các mẫu từ các nguồn lưỡng cực và tạo ra phản hồi.
Xác định mục đích của mô hình AI
Các mô hình AI là những người học nhanh và họ chỉ cần được cho biết chính xác những gì họ nên làm. Bằng cách xác định chính xác mục đích của các mô hình, chúng ta có thể đào tạo các mô hình để hiểu được khả năng và hạn chế của chính chúng. Điều này sẽ cho phép họ tự động xác thực các phản hồi của mình bằng cách điều chỉnh các phản hồi được tạo theo lời nhắc của người dùng và mục đích của chúng là mang lại kết quả rõ ràng.
Giám sát con người trong AI
Việc đào tạo hệ thống AI cũng quan trọng như việc dạy một đứa trẻ bơi lội hoặc đạp xe lần đầu tiên. Nó đòi hỏi sự giám sát, điều độ, can thiệp và nắm tay của người lớn. Hầu hết các ảo giác về AI xảy ra do sự sơ suất của con người trong các giai đoạn phát triển AI khác nhau. Bằng cách triển khai các chuyên gia phù hợp và đảm bảo quy trình làm việc liên tục của con người để xác thực và xem xét kỹ lưỡng các phản hồi của AI, bạn có thể đạt được kết quả chất lượng. Bên cạnh đó, các mô hình có thể được cải tiến hơn nữa để đảm bảo độ chính xác và chính xác.
Shaip và vai trò của chúng tôi trong việc ngăn chặn ảo giác AI
Một trong những nguồn gây ảo giác lớn nhất khác là dữ liệu đào tạo AI kém. Những gì bạn cho ăn là những gì bạn nhận được. Đó là lý do Shaip thực hiện các bước chủ động để đảm bảo cung cấp dữ liệu chất lượng cao nhất cho bạn đào tạo AI sáng tạo nhu cầu.
Các giao thức đảm bảo chất lượng nghiêm ngặt và bộ dữ liệu có nguồn gốc hợp pháp của chúng tôi là lý tưởng cho tầm nhìn AI của bạn trong việc mang lại kết quả rõ ràng. Mặc dù các trục trặc kỹ thuật có thể được giải quyết, nhưng điều quan trọng là những lo ngại về chất lượng dữ liệu đào tạo phải được giải quyết ở cấp cơ sở để ngăn chặn việc phải làm lại quá trình phát triển mô hình từ đầu. Đây là lý do tại sao bạn AI và LLM giai đoạn đào tạo nên bắt đầu với bộ dữ liệu từ Shaip.