Bộ dữ liệu tiếng Trung
简体中文数据集
Bộ dữ liệu tiếng Trung chất lượng cao dành cho AI và mô hình giọng nói
Giới thiệu chung
Tiêu đề (Ngôn ngữ)
Bộ dữ liệu tiếng Trung
Các loại tập dữ liệu
Tổng đài, Âm nhạc, Độc thoại theo kịch bản, Dữ liệu phương tiện (Dữ liệu Podcast)
Địa chỉ
Trung Quốc
Mô tả Chi tiết
Bộ dữ liệu này bao gồm các cuộc trò chuyện qua điện thoại giữa tác nhân tổng hợp và khách hàng (5–15 phút), các cuộc trò chuyện qua điện thoại tự nhiên giữa người với người (15–60 phút) và âm thanh hát có bản ghi, cung cấp dữ liệu giọng nói đa dạng để đào tạo và đánh giá các công nghệ giọng nói và ngôn ngữ.
Trường hợp sử dụng
ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Chi tiết tập dữ liệu
| Ngôn ngữ | Loại tập dữ liệu | Sampling Rate | Diễn giả | Kênh | Tổng số giờ | Tổng số loa |
|---|---|---|---|---|---|---|
| Hát Trung Quốc | Âm nhạc | 48 kHz | Loa đơn | Mono | 06:11:32 | 10 |
| Tiếng Trung (Phồn Thể) | Độc thoại theo kịch bản | 48 kHz | Loa đơn | Mono | 1,499:00:00 | 1,805 |
| Tiếng Anh có giọng Trung Quốc | Dữ liệu phương tiện | 16 kHz | Nhiều loa | Mono | 306:04:58 | 2,130 |
| Trung Quốc giản thể (Chinese Simplified) | Độc thoại theo kịch bản | 48 kHz | Loa đơn | Mono | 2,761:00:00 | 3,725 |
| Tiếng Anh giọng Trung Mỹ | Trung tâm cuộc gọi | 8 kHz | Loa 2 | Hai | 152:18:33 | 2,058 |
| Tiếng Anh giọng Trung Mỹ | Dữ liệu phương tiện | 16 kHz | Nhiều loa | Mono | 245:55:15 | 468 |
Khách hàng nổi bật
Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.
Không thể tìm thấy những gì bạn đang tìm kiếm?
Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu
Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn