Bộ dữ liệu tiếng Trung

简体中文数据集

Bộ dữ liệu tiếng Trung chất lượng cao dành cho AI và mô hình giọng nói

Giới thiệu chung

Tiêu đề (Ngôn ngữ)

Bộ dữ liệu tiếng Trung

Các loại tập dữ liệu

Tổng đài, Âm nhạc, Độc thoại theo kịch bản, Dữ liệu phương tiện (Dữ liệu Podcast)

Địa chỉ

Trung Quốc

Mô tả Chi tiết

Bộ dữ liệu này bao gồm các cuộc trò chuyện qua điện thoại giữa tác nhân tổng hợp và khách hàng (5–15 phút), các cuộc trò chuyện qua điện thoại tự nhiên giữa người với người (15–60 phút) và âm thanh hát có bản ghi, cung cấp dữ liệu giọng nói đa dạng để đào tạo và đánh giá các công nghệ giọng nói và ngôn ngữ.

Trường hợp sử dụng

ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Chi tiết tập dữ liệu

Ngôn ngữ Loại tập dữ liệu Sampling Rate Diễn giả Kênh Tổng số giờ Tổng số loa
Hát Trung Quốc Âm nhạc 48 kHz Loa đơn Mono 06:11:32 10
Tiếng Trung (Phồn Thể) Độc thoại theo kịch bản 48 kHz Loa đơn Mono 1,499:00:00 1,805
Tiếng Anh có giọng Trung Quốc Dữ liệu phương tiện 16 kHz Nhiều loa Mono 306:04:58 2,130
Trung Quốc giản thể (Chinese Simplified) Độc thoại theo kịch bản 48 kHz Loa đơn Mono 2,761:00:00 3,725
Tiếng Anh giọng Trung Mỹ Trung tâm cuộc gọi 8 kHz Loa 2 Hai 152:18:33 2,058
Tiếng Anh giọng Trung Mỹ Dữ liệu phương tiện 16 kHz Nhiều loa Mono 245:55:15 468

Khách hàng nổi bật

Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.

Shaip Liên hệ với chúng tôi

Không thể tìm thấy những gì bạn đang tìm kiếm?

Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu

Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn

  • Trường này là dành cho mục đích xác nhận và phải được giữ nguyên.
  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo mậtCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.