Bộ dữ liệu tiếng Ả Rập

مجموعة البيانات العربية

Bộ dữ liệu Podcast và hội thoại tiếng Ả Rập chất lượng cao dành cho AI và mô hình giọng nói

Giới thiệu chung

Yêu sách

Bộ dữ liệu ngôn ngữ Ả Rập

Loại tập dữ liệu

Cuộc trò chuyện chung

Mô tả

Cuộc trò chuyện qua điện thoại không được công bố giữa hai người. Xấp xỉ Thời lượng âm thanh (Phạm vi) – 15-60 phút, tiếng Ả Rập từ các nước vùng Vịnh.

Trường hợp sử dụng

ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Chi tiết tập dữ liệu

Tổng số giờ

292

Tỷ lệ mẫu

8 kHz

audio Channel

Hai

Nền tảng ghi âm

Máy tính để bàn

Định dạng âm thanh

. Wav

Định dạng phiên âm

.json

WER (%)

5

Nhân khẩu học tập dữ liệu

Quốc gia

Tiếng Ả Rập

Ngôn ngữ

Tiếng Ả Rập

Bình đẳng

Nữ 838 Nam 1209 Không biết 78

Số Loa

706

Độ tuổi

18-50

Giới thiệu chung

Yêu sách

Bộ dữ liệu ngôn ngữ Ả Rập

Loại tập dữ liệu

TTS

Mô tả

Bản ghi âm một lời nói, có xu hướng rơi vào khoảng từ 5 đến 30 giây.

Trường hợp sử dụng

ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Chi tiết tập dữ liệu

Tổng số giờ

1,947

Tỷ lệ mẫu

48 kHz

audio Channel

Mono

Nền tảng ghi âm

Điện thoại di động App

Định dạng âm thanh

. Wav

Định dạng phiên âm

.json

WER (%)

5

Nhân khẩu học tập dữ liệu

Quốc gia

Tiếng Ả Rập

Ngôn ngữ

Tiếng Ả Rập

Bình đẳng

Nữ 838 Nam 1209 Không biết 78

Số Loa

2,125

Độ tuổi

18-50

Khách hàng nổi bật

Trao quyền cho các nhóm xây dựng các sản phẩm AI hàng đầu thế giới.

đàn bà gan dạ
Google
microsoft
Shaip liên hệ với chúng tôi

Không thể tìm thấy những gì bạn đang tìm kiếm?

Các bộ dữ liệu mới có sẵn đang được thu thập trên tất cả các loại dữ liệu

Liên hệ với chúng tôi ngay bây giờ để loại bỏ những lo lắng về thu thập dữ liệu đào tạo âm thanh / giọng nói của bạn

  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo mậtCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.
  • Trường này là dành cho mục đích xác nhận và phải được giữ nguyên.