Bộ dữ liệu tiếng Hindi

हिंदी डेटासेट

Bộ dữ liệu tổng đài tiếng Hindi chất lượng cao, hội thoại chung và podcast cho các mô hình AI & ASR

Giới thiệu chung

Tiêu đề (Ngôn ngữ)

Bộ dữ liệu tiếng Hindi

Các loại tập dữ liệu

Tổng đài, Hội thoại chung, Phương tiện truyền thông (Podcast), Độc thoại theo kịch bản

Địa chỉ

Ấn Độ

Mô tả Chi tiết

Các cuộc trò chuyện điện thoại không có kịch bản giữa hai người có sẵn với thời lượng từ 15 đến 60 phút, cùng với các tệp âm thanh hoặc video thuộc phạm vi công cộng có thể cấp phép như phỏng vấn và podcast với 1 đến 5 người tham gia trong cùng phạm vi. Ngoài ra, các bản ghi âm lời thoại đơn lẻ thường kéo dài từ 5 đến 30 giây, và dữ liệu độc thoại có kịch bản cũng có sẵn.

Trường hợp sử dụng

ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Chi tiết tập dữ liệu

Loại tập dữ liệu Sampling Rate Diễn giả Kênh Tổng số giờ Tổng số loa
Trung tâm cuộc gọi 8 kHz Loa 2 Hai 70:45:51 Theo yêu cầu
Trung tâm cuộc gọi 8 kHz Loa 2 Mono 20,000:00:00 Theo yêu cầu
Trung tâm cuộc gọi 16 kHz Loa 2 Mono 29:17:20 261
Trung tâm cuộc gọi 16 kHz Loa 2 Hai 400:27:10 1200
Cuộc trò chuyện chung 8 kHz Loa 2 Hai 47:48:40 224
Dữ liệu phương tiện 16 kHz Nhiều loa Mono 227:57:43 438
Độc thoại theo kịch bản 48 kHz Loa đơn Mono 2,866:00:00 3,988
Độc thoại theo kịch bản 24 kHz Loa đơn Mono 29,000:00:00 Theo yêu cầu

Khách hàng nổi bật

Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.

đàn bà gan dạ
Google
microsoft
Shaip liên hệ với chúng tôi

Không thể tìm thấy những gì bạn đang tìm kiếm?

Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu

Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn

  • Trường này là dành cho mục đích xác nhận và phải được giữ nguyên.
  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo mậtCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.