Bộ dữ liệu tiếng Việt
Bộ dữ liệu tiếng Việt
Giới thiệu chung
Yêu sách
Việt Nam Tập dữ liệu ngôn ngữ
Loại tập dữ liệu
Cuộc trò chuyện chung
Mô tả
Cuộc trò chuyện qua điện thoại tổng hợp, không được mô tả giữa “đại lý” và “khách hàng”, Khoảng. Thời lượng âm thanh (Phạm vi) 5-15 phút, Miền Bắc (ví dụ: Hà Nội), Miền Trung và Miền Nam (ví dụ: Thành phố Hồ Chí Minh).
Trường hợp sử dụng
ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Chi tiết tập dữ liệu
Tổng số giờ
295
Tỷ lệ mẫu
8 kHz
audio Channel
Hai
Nền tảng ghi âm
Máy tính để bàn
Định dạng âm thanh
. Wav
Định dạng phiên âm
.json
WER (%)
5
Nhân khẩu học tập dữ liệu
Quốc gia
Việt Nam
Ngôn ngữ
Việt Nam
Giới Tính
Nữ 400, nam 380, Ẩn số 2
Số Loa
782
Độ tuổi
18-50
Giới thiệu chung
Yêu sách
Việt Nam Tập dữ liệu ngôn ngữ
Loại tập dữ liệu
Âm thanh phương tiện
Mô tả
Các tệp âm thanh/video thuộc phạm vi công cộng có thể cấp phép, chẳng hạn như các cuộc phỏng vấn, podcast, v.v. – 1 đến 5 người. Xấp xỉ Thời lượng âm thanh (Phạm vi) 15-60 phút
Trường hợp sử dụng
ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Chi tiết tập dữ liệu
Tổng số giờ
257
Tỷ lệ mẫu
16 kHz
audio Channel
Mono
Nền tảng ghi âm
Tìm nguồn cung ứng web
Định dạng âm thanh
. Wav
Định dạng phiên âm
.json
WER (%)
5
Nhân khẩu học tập dữ liệu
Quốc gia
Việt Nam
Ngôn ngữ
Việt Nam
Giới Tính
Nữ 249, nam 200, Ẩn số 45
Số Loa
494
Độ tuổi
18-50
Khách hàng nổi bật
Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.
Không thể tìm thấy những gì bạn đang tìm kiếm?
Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu
Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn