Bộ dữ liệu Ba Lan
Bộ dữ liệu Ba Lan
Dữ liệu truyền thông Ba Lan chất lượng cao và độc thoại theo kịch bản cho mô hình AI và giọng nói
Giới thiệu chung
Tiêu đề (Ngôn ngữ)
Bộ dữ liệu tiếng Ba Lan
Các loại tập dữ liệu
Phương tiện truyền thông (Podcast), Độc thoại có kịch bản
Địa chỉ
Ba Lan
Mô tả Chi tiết
Bộ dữ liệu này bao gồm các tệp âm thanh hoặc video thuộc phạm vi công cộng có thể cấp phép như các cuộc phỏng vấn và podcast với 1 đến 5 người tham gia (15–60 phút), cùng với các đoạn độc thoại có kịch bản trong đó một người nói duy nhất truyền tải nội dung được xác định trước để đào tạo và đánh giá các mô hình ngôn ngữ và lời nói.
Trường hợp sử dụng
ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Chi tiết tập dữ liệu
| Loại tập dữ liệu | Sampling Rate | Diễn giả | Kênh | Tổng số giờ | Tổng số loa |
|---|---|---|---|---|---|
| Dữ liệu phương tiện | 16 kHz | Loa đa năng | Mono | 268:56:51 | 532 |
| Độc thoại theo kịch bản | 48 kHz | Loa đơn | Mono | 2,348:00:00 | 2,699 |
Khách hàng nổi bật
Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.
Không thể tìm thấy những gì bạn đang tìm kiếm?
Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu
Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn