Bộ dữ liệu tiếng phổ thông

Giới thiệu chung

Yêu sách

Bộ dữ liệu ngôn ngữ phổ thông

Loại tập dữ liệu

Thức tỉnh

Mô tả

Wake Words / Lệnh thoại / Từ kích hoạt / Thu thập dữ liệu cụm từ khóa

  • loa 50
  • 4 cụm từ khóa duy nhất cho mỗi người nói
  • 10 tệp âm thanh cho mỗi cụm từ khóa duy nhất
  • Tổng số 40 phát biểu được ghi lại cho mỗi người nói

Chi tiết tập dữ liệu

Tổng số giờ

2,000 âm thanh

Tỷ lệ mẫu

16 kHz

audio Channel

kênh 1

Nền tảng ghi âm

Điện thoại di động App

Định dạng âm thanh

. Wav

Định dạng phiên âm

.json

WER (%)

5

Nhân khẩu học tập dữ liệu

Quốc gia

Tiếng Quan thoại

Ngôn ngữ

Tiếng Quan thoại

Giới Tính

Nữ 50%, Nam 50%, Không xác định 10%

Số Loa

50

Độ tuổi

18-50

Khách hàng nổi bật

Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.

Shaip liên hệ với chúng tôi

Không thể tìm thấy những gì bạn đang tìm kiếm?

Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu

Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn

  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo vệ thông tinCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.
  • Trường này là dành cho mục đích xác nhận và phải được giữ nguyên.