Tầm nhìn máy tính

22+ Bộ dữ liệu mã nguồn mở được mua nhiều nhất cho thị giác máy tính

Thuật toán AI chỉ tốt khi dữ liệu bạn cung cấp cho nó.

Nó không phải là một tuyên bố táo bạo cũng không phải là một tuyên bố độc đáo. AI có thể đã khá xa vời cách đây vài thập kỷ, nhưng Trí tuệ nhân tạo và Máy học đã đi một chặng đường dài kể từ đó.

Thị giác máy tính giúp máy tính hiểu và giải thích các nhãn và hình ảnh. Khi bạn huấn luyện máy tính của mình bằng cách sử dụng đúng loại hình ảnh, nó có thể có được khả năng phát hiện, hiểu và xác định các đặc điểm khuôn mặt khác nhau, phát hiện bệnh tật, lái xe tự hành và cũng có thể cứu sống bằng cách quét nội tạng đa chiều.

Thị trường Thị giác Máy tính được dự đoán sẽ tiếp cận $ 144.46 tỷ vào năm 2028 từ mức khiêm tốn 7.04 tỷ đô la vào năm 2020, tăng trưởng với tốc độ CAGR là 45.64% trong giai đoạn 2021-2028.

Một số trường hợp sử dụng của thị giác máy tính là:

  • Hình ảnh y tế
  • Xe tự hành
  • Nhận dạng khuôn mặt và vật thể
  • Nhận dạng khiếm khuyết
  • Phát hiện cảnh

Sản phẩm tập dữ liệu hình ảnh bạn đang nuôi dưỡng và đào tạo các nhiệm vụ Máy học và thị giác máy tính của bạn là yếu tố quan trọng đối với sự thành công của dự án AI của bạn. Rất khó để có được một tập dữ liệu chất lượng. Tùy thuộc vào mức độ phức tạp của dự án của bạn, có thể mất từ ​​vài ngày đến vài tuần để có được bộ dữ liệu đáng tin cậy và phù hợp cho mục đích thị giác máy tính.

Tại đây, chúng tôi cung cấp cho bạn một loạt các bộ dữ liệu nguồn mở (được phân loại để bạn dễ dàng sử dụng) mà bạn có thể sử dụng ngay lập tức.

Danh sách toàn diện các bộ dữ liệu thị giác máy tính

Nói chung:

  1. IMAGEnet (Liên kết)

    ImageNet là một tập dữ liệu được sử dụng rộng rãi và nó đi kèm với 1.2 triệu hình ảnh đáng kinh ngạc được phân loại thành 1000 loại. Tập dữ liệu này được tổ chức theo phân cấp WorldNet và được phân loại thành ba phần - dữ liệu đào tạo, nhãn hình ảnh và dữ liệu xác thực.

  2. Động học 700 (Liên kết)

    Kinetics 700 là một tập dữ liệu chất lượng cao khổng lồ với hơn 650,000 clip về 700 lớp hành động khác nhau của con người. Mỗi hành động của lớp có khoảng 700 video clip. Các clip trong tập dữ liệu có các tương tác giữa con người-đối tượng và con người-con người, được chứng minh là khá hữu ích khi nhận ra hành động của con người trong video.

  3. CIFAR-10 (Liên kết)

    CIFAR 10 là một trong những bộ dữ liệu thị giác máy tính lớn nhất với 60000 hình ảnh màu 32 x 32 đại diện cho mười lớp khác nhau. Mỗi lớp có khoảng 6000 hình ảnh được sử dụng để đào tạo các thuật toán thị giác máy tính và học máy.

Nhận dạng khuôn mặt:

nhận dạng khuôn mặt

  1. Các khuôn mặt được gắn nhãn trong tự nhiên (Liên kết)

    Labeled Faced in the Wild là một tập dữ liệu khổng lồ chứa hơn 13,230 hình ảnh của gần 5,750 người được phát hiện từ internet. Bộ dữ liệu về khuôn mặt này được thiết kế để giúp việc nghiên cứu tính năng phát hiện khuôn mặt không bị giới hạn trở nên dễ dàng hơn.

  2. Trang web CASIA (Liên kết)

    Khuôn mặt web CASIA là một tập dữ liệu được thiết kế tốt giúp máy học và nghiên cứu khoa học về nhận dạng khuôn mặt không bị giới hạn. Với hơn 494,000 hình ảnh của gần 10,000 danh tính thực, nó lý tưởng cho các nhiệm vụ xác minh và nhận dạng khuôn mặt.

  3. Tập dữ liệu khuôn mặt UMD (Liên kết)

    UMD phải đối mặt với một tập dữ liệu được chú thích tốt chứa hai phần - hình ảnh tĩnh và khung video. Bộ dữ liệu có hơn 367,800 chú thích khuôn mặt và 3.7 triệu khung hình video có chú thích về các đối tượng.

Nhận dang chu Viet:

  1. Cơ sở dữ liệu MNIST (Liên kết)

    MNIST là một cơ sở dữ liệu chứa các mẫu chữ số viết tay từ 0 đến 9, và nó có 60,000 và 10,000 hình ảnh đào tạo và thử nghiệm. Được phát hành vào năm 1999, MNIST giúp việc kiểm tra các hệ thống xử lý hình ảnh trong Deep Learning trở nên dễ dàng hơn.

  2. Tập dữ liệu ký tự nhân tạo (Liên kết)

    Như tên cho thấy, Tập dữ liệu ký tự nhân tạo là dữ liệu được tạo nhân tạo mô tả cấu trúc ngôn ngữ tiếng Anh bằng mười chữ cái viết hoa. Nó đi kèm với hơn 6000 hình ảnh.

Hãy thảo luận về yêu cầu Dữ liệu đào tạo AI của bạn ngay hôm nay.

Phát hiện đối tượng:

  1. MS COCO (Liên kết)

    MS COCO hoặc Đối tượng chung trong ngữ cảnh là một tập dữ liệu phát hiện đối tượng và phụ đề.

    Nó có hơn 328,000 hình ảnh với tính năng phát hiện điểm chính, phát hiện đa đối tượng, chú thích mặt nạ phân đoạn và chú thích. Nó đi kèm với 80 danh mục đối tượng và năm chú thích cho mỗi hình ảnh.

  2. LSUN(Liên kết)

    LSUN, viết tắt của Large-scale Scene Hiểu, có hơn một triệu hình ảnh được gắn nhãn trong 20 danh mục đối tượng và 10 cảnh. Một số danh mục có gần 300,000 hình ảnh, với 300 hình ảnh đặc biệt để xác thực và 1000 hình ảnh cho dữ liệu thử nghiệm.

  3. Đồ vật tại nhà(Liên kết)

    Bộ dữ liệu Đối tượng Nhà chứa các hình ảnh có chú thích của các đối tượng ngẫu nhiên từ xung quanh nhà - nhà bếp, phòng khách và phòng tắm. Bộ dữ liệu này cũng có một vài video có chú thích và 398 bức ảnh không có chú thích được thiết kế để thử nghiệm.

Ô tô:

  1. Bộ dữ liệu cảnh quan thành phố (Liên kết)

    Cảnh quan thành phố là tập dữ liệu cần truy cập khi tìm kiếm các chuỗi video khác nhau được ghi lại từ một số cảnh đường phố được trích dẫn. Những hình ảnh này được chụp trong một thời gian dài và trong các điều kiện thời tiết và ánh sáng khác nhau. Các chú thích dành cho 30 loại hình ảnh được chia thành tám loại khác nhau.

  2. Ổ sâu Barkley (Liên kết)

    Barkley DeepDrive được thiết kế đặc biệt để đào tạo xe tự hành và nó có hơn 100 nghìn chuỗi video có chú thích. Đây là một trong những dữ liệu đào tạo hữu ích nhất dành cho xe tự hành do điều kiện đường và lái xe thay đổi.

  3. Bản đồ (Liên kết)

    Map Mao có hơn 750 triệu cảnh đường phố và biển báo giao thông trên toàn thế giới, rất hữu ích trong việc đào tạo các mô hình nhận thức thị giác trong máy học và thuật toán AI. Nó cho phép bạn phát triển các phương tiện tự hành phục vụ cho các điều kiện ánh sáng và thời tiết cũng như quan điểm.

Hình ảnh y tế:

  1. Tập dữ liệu nghiên cứu mở Covid-19 (Liên kết)

    Tập dữ liệu ban đầu này có khoảng 6500 pixel phân đoạn phổi đa giác về chụp X-quang ngực AP / PA. Ngoài ra, có 517 hình ảnh chụp X-quang của bệnh nhân Covid-19 với các thẻ chứa tên, vị trí, chi tiết nhập viện, kết quả và hơn thế nữa.

  2. Cơ sở dữ liệu NIH của 100,000 Tia X ở Ngực (Liên kết)

    Cơ sở dữ liệu NIH là một trong những bộ dữ liệu công khai rộng rãi nhất chứa 100,000 hình ảnh chụp X-quang ngực và các dữ liệu liên quan hữu ích cho cộng đồng khoa học và nghiên cứu. Nó thậm chí còn có hình ảnh của những bệnh nhân có tình trạng phổi tiên tiến.

  3. Atlas bệnh lý kỹ thuật số (Liên kết)

    Atlas of Digital Pathology cung cấp một số hình ảnh vá mô bệnh học, tổng cộng hơn 17,000, từ gần 100 slide chú thích của các cơ quan khác nhau. Bộ dữ liệu này rất hữu ích trong việc phát triển phần mềm nhận dạng mẫu và thị giác máy tính.

Nhận dạng cảnh:

Nhận dạng cảnh

  1. Nhận dạng cảnh trong nhà (Liên kết)

    Nhận dạng cảnh trong nhà là một tập dữ liệu được phân loại cao với gần 15620 hình ảnh về các vật thể và phong cảnh trong nhà sẽ được sử dụng trong học máy và đào tạo dữ liệu. Nó có hơn 65 danh mục và mỗi danh mục có tối thiểu 100 hình ảnh.

  2. xXem (Liên kết)

    Là một trong những tập dữ liệu có sẵn công khai nổi tiếng nhất, xView chứa hàng tấn hình ảnh trên đầu có chú thích từ nhiều cảnh phức tạp và lớn khác nhau. Có khoảng 60 lớp và hơn một triệu cá thể đối tượng, mục đích của tập dữ liệu này là cung cấp khả năng cứu trợ thảm họa tốt hơn bằng cách sử dụng hình ảnh vệ tinh.

  3. Nơi (Liên kết)

    Địa điểm, một tập dữ liệu do MIT đóng góp, có hơn 1.8 triệu hình ảnh từ 365 danh mục cảnh khác nhau. Có khoảng 50 hình ảnh trong mỗi danh mục này để xác nhận và 900 hình ảnh để thử nghiệm. Có thể học các tính năng cảnh sâu để thiết lập các nhiệm vụ nhận dạng cảnh hoặc nhận dạng hình ảnh.

Giải trí:

  1. Tập dữ liệu IMDB WIKI (Liên kết)

    IMDB - Wiki là một trong những cơ sở dữ liệu công khai phổ biến nhất về các khuôn mặt được gắn nhãn đầy đủ về tuổi, giới tính và tên. Nó cũng có khoảng 20 nghìn khuôn mặt của những người nổi tiếng và 62 nghìn từ Wikipedia.

  2. Khuôn mặt Người nổi tiếng (Liên kết)

    Celeb Faces là một cơ sở dữ liệu quy mô lớn với 200,000 hình ảnh được chú thích của những người nổi tiếng. Hình ảnh đi kèm với tiếng ồn xung quanh và các biến thể tư thế, làm cho chúng có giá trị cho các bộ thử nghiệm đào tạo trong các nhiệm vụ thị giác máy tính. Nó rất có lợi khi đạt được độ chính xác cao hơn trong nhận dạng khuôn mặt, chỉnh sửa, bản địa hóa bộ phận khuôn mặt, v.v.

Giờ đây, bạn đã có một danh sách khổng lồ các bộ dữ liệu hình ảnh mã nguồn mở để cung cấp năng lượng cho bộ máy trí tuệ nhân tạo của mình. Kết quả của mô hình AI và máy học của bạn phụ thuộc chủ yếu vào chất lượng của bộ dữ liệu mà bạn cung cấp và đào tạo chúng. Nếu bạn muốn mô hình AI của mình đưa ra các dự đoán chính xác, nó cần các bộ dữ liệu chất lượng được tổng hợp, gắn thẻ và dán nhãn để hoàn thiện. Để khuếch đại thành công của hệ thống thị giác máy tính, bạn phải sử dụng cơ sở dữ liệu hình ảnh chất lượng phù hợp với tầm nhìn dự án của bạn. Nếu bạn đang tìm kiếm thêm các bộ dữ liệu như vậy Bấm vào đây

Xã hội Chia sẻ

Bạn cũng có thể thích