Phân đoạn ngữ nghĩa

Phân đoạn ngữ nghĩa

Định nghĩa

Phân đoạn ngữ nghĩa là nhiệm vụ thị giác máy tính nhằm phân loại từng pixel trong hình ảnh thành một danh mục, chẳng hạn như đường, tòa nhà hoặc người đi bộ.

Mục đích

Mục đích là cung cấp hiểu biết chi tiết về bối cảnh cho các ứng dụng AI trong xe tự lái, hình ảnh y tế và robot.

Tầm quan trọng

  • Cần thiết cho khả năng nhận biết ở cấp độ pixel trong các hệ thống quan trọng về an toàn.
  • Cho phép xác định ranh giới đối tượng chính xác hơn so với hộp giới hạn.
  • Yêu cầu tập dữ liệu có chú thích lớn.
  • Tính toán phức tạp ở độ phân giải cao.

Quy trình triển khai

  1. Thu thập và dán nhãn hình ảnh có chú thích ở cấp độ pixel.
  2. Đào tạo các mô hình học sâu như mạng tích chập hoàn toàn.
  3. Hình ảnh đầu vào được xử lý thành các dự đoán ở cấp độ pixel.
  4. Mặt nạ đầu ra gán mỗi pixel vào một lớp.
  5. Đánh giá bằng các số liệu như Giao điểm trên Hợp nhất (IoU).

Ví dụ (Thực tế)

  • Bộ dữ liệu cảnh quan thành phố: phân đoạn ngữ nghĩa cho các cảnh quan đô thị.
  • Tesla Autopilot: phân đoạn theo cấp độ pixel để điều hướng đường bộ.
  • Chụp ảnh y tế: phân đoạn khối u trong ảnh chụp MRI.

Tài liệu tham khảo / Đọc thêm

Hãy cho chúng tôi biết cách chúng tôi có thể trợ giúp với sáng kiến ​​AI tiếp theo của bạn.