Bộ dữ liệu Ba Lan

Bộ dữ liệu Ba Lan

Dữ liệu truyền thông Ba Lan chất lượng cao và độc thoại theo kịch bản cho mô hình AI và giọng nói

Giới thiệu chung

Tiêu đề (Ngôn ngữ)

Bộ dữ liệu tiếng Ba Lan

Các loại tập dữ liệu

Phương tiện truyền thông (Podcast), Độc thoại có kịch bản

Địa chỉ

Ba Lan

Mô tả Chi tiết

Bộ dữ liệu này bao gồm các tệp âm thanh hoặc video thuộc phạm vi công cộng có thể cấp phép như các cuộc phỏng vấn và podcast với 1 đến 5 người tham gia (15–60 phút), cùng với các đoạn độc thoại có kịch bản trong đó một người nói duy nhất truyền tải nội dung được xác định trước để đào tạo và đánh giá các mô hình ngôn ngữ và lời nói.

Trường hợp sử dụng

ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Chi tiết tập dữ liệu

Loại tập dữ liệu Sampling Rate Diễn giả Kênh Tổng số giờ Tổng số loa
Dữ liệu phương tiện 16 kHz Loa đa năng Mono 268:56:51 532
Độc thoại theo kịch bản 48 kHz Loa đơn Mono 2,348:00:00 2,699

Khách hàng nổi bật

Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.

đàn bà gan dạ
Google
microsoft
Shaip liên hệ với chúng tôi

Không thể tìm thấy những gì bạn đang tìm kiếm?

Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu

Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn

  • Trường này là dành cho mục đích xác nhận và phải được giữ nguyên.
  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo mậtCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.