Dịch vụ thu thập dữ liệu giọng nói đáng tin cậy nhất cho AI của bạn

Đào tạo các mô hình NLP, VA, TTS, v.v. của bạn với dữ liệu đàm thoại chất lượng, với các dịch vụ thu thập dữ liệu âm thanh và giọng nói của chúng tôi

Khám phá các đường dẫn dữ liệu âm thanh mà không bị tắc nghẽn

Liên hệ

Khách hàng nổi bật

Bất kỳ môn học nào. Bất kỳ kịch bản nào.

Tại Shaip, chuyên môn của chúng tôi nằm ở việc tạo ra các bộ dữ liệu giọng nói chất lượng cao được thiết kế cho các yêu cầu AI/ML khác nhau. Chúng tôi cung cấp nhiều ngôn ngữ và ghi lại trong các cài đặt đa dạng giúp cho bộ dữ liệu của chúng tôi trở nên toàn diện và có thể thích ứng. ồtrọng tâm của bạn là cung cấp các mô hình có khối lượng dữ liệu giọng nói tùy chỉnh cao nhất trong thời gian ít nhất có thể. Với sự đồng hành của chúng tôi, bạn có thể mong đợi:

Dữ liệu âm thanh / giọng nói đa ngôn ngữ chất lượng cao được quản lý để cải thiện độ chính xác
Mức độ đặc hiệu miền cao nhất có thể đối với tkịch bản đa dạng thiết lập

Quy mô mô hình ML của bạn để phù hợp với nhân khẩu học và ngành dọc đa dạng
Môi trường ghi âm: Chất lượng phòng thu, có âm thanh trong trẻo với tiếng ồn xung quanh tối thiểu, & Môi trường tự nhiên, trong đó các bản ghi kết hợp âm thanh xung quanh để mô phỏng các tình huống trong thế giới thực.

100 +

Các quốc gia

55K +

Dữ liệu giờ nói

250 +

Dự án

60 +

Ngôn ngữ (Hơn 100 phương ngữ)

8 / 16 / 44 / 48 kHz

tỷ lệ lấy mẫu

Thế mạnh của PHATBEE

Căn chỉnh dữ liệu âm thanh cho các mô hình NLP thông minh hơn

Shaip cung cấp các dịch vụ thu thập dữ liệu âm thanh / giọng nói từ đầu đến cuối bằng hơn 100 ngôn ngữ để cho phép các công nghệ hỗ trợ giọng nói phục vụ cho nhiều đối tượng khác nhau trên toàn cầu. Chúng tôi có thể làm việc trên các dự án ở bất kỳ phạm vi và quy mô nào; từ cấp phép cho các tập dữ liệu âm thanh có sẵn hiện có, đến quản lý thu thập dữ liệu âm thanh tùy chỉnh, đến phiên âm và chú thích âm thanh. Bất kể dự án thu thập dữ liệu giọng nói của bạn lớn đến mức nào, chúng tôi có thể tùy chỉnh các dịch vụ thu thập âm thanh cho phù hợp với nhu cầu của bạn để xây dựng bộ dữ liệu NLP chất lượng cao nhắm mục tiêu đến phương ngữ, âm và ngôn ngữ. Chọn từ nhiều bộ dữ liệu giọng nói và tài nguyên thu thập dữ liệu âm thanh của chúng tôi, để thiết lập thông minh hỗ trợ giọng nói.

Text-to-Speech
(TTS)

Xây dựng mô hình đa ngôn ngữ chuyển văn bản thành giọng nói (TTS) với sự trợ giúp của lực lượng lao động toàn cầu của chúng tôi, những người giúp bạn thu thập dữ liệu giọng nói ở hơn 150 ngôn ngữ và phương ngữ để nâng cao mô hình AI của bạn từ điều khiển trong ô tô đến chatbot và các giải pháp học tập với hiệu suất cao dữ liệu âm thanh chất lượng.

Câu chuyện thành công

Bộ dữ liệu AI đàm thoại với hơn 3 nghìn giờ dữ liệu trên 8 ngôn ngữ

Với mong muốn xây dựng một nền tảng đa ngôn ngữ cho các ngôn ngữ Ấn Độ, khách hàng đã hợp tác với Shaip để thu thập, phân đoạn và phiên âm các tập dữ liệu lớn bằng nhiều ngôn ngữ Ấn Độ. Điều này sẽ giúp phát triển các mẫu giọng nói hiệu quả có thể hỗ trợ nền tảng mới mang tính đổi mới của khách hàng.

Vấn đề: Hơn 3,000 giờ dữ liệu âm thanh được thu thập bằng 8 ngôn ngữ Ấn Độ, được phân đoạn và phiên âm để phát triển tính năng nhận dạng giọng nói tự động.

Giải pháp: Chúng tôi đã cung cấp tính năng thu thập, phân đoạn, sao chép dữ liệu và phân phối các tệp JSON cùng với siêu dữ liệu. Chúng tôi đã thu thập 3000 giờ dữ liệu âm thanh bằng 8 ngôn ngữ Ấn Độ trên quy mô lớn cho dự án công nghệ giọng nói của khách hàng.

Lý do chọn Shaip làm Đối tác thu thập dữ liệu giọng nói đáng tin cậy của bạn

người

Đội ngũ tận tâm và được đào tạo:

Hơn 30,000 cộng tác viên để Tạo dữ liệu, Ghi nhãn và Chất lượng
Nhóm quản lý dự án được chứng nhận
Nhóm phát triển sản phẩm có kinh nghiệm
Nhóm Tìm nguồn & Giới thiệu Talent Pool

Quy trình xét duyệt

Đảm bảo hiệu quả quy trình cao nhất với:

Quy trình cổng giai đoạn 6 Sigma mạnh mẽ
Đội ngũ chuyên dụng gồm 6 đai đen Sigma - Chủ sở hữu quy trình chính & Tuân thủ chất lượng
Cải tiến liên tục & Vòng lặp phản hồi

Nền tảng

Nền tảng được cấp bằng sáng chế cung cấp các lợi ích:

Nền tảng end-to-end dựa trên web
Chất lượng hoàn hảo
TAT nhanh hơn
Giao hàng liền mạch

người

Đội ngũ tận tâm và được đào tạo:

Hơn 30,000 cộng tác viên để Tạo dữ liệu, Ghi nhãn và Chất lượng
Nhóm quản lý dự án được chứng nhận
Nhóm phát triển sản phẩm có kinh nghiệm
Nhóm Tìm nguồn & Giới thiệu Talent Pool

Quy trình xét duyệt

Đảm bảo hiệu quả quy trình cao nhất với:

Quy trình cổng giai đoạn 6 Sigma mạnh mẽ
Đội ngũ chuyên dụng gồm 6 đai đen Sigma - Chủ sở hữu quy trình chính & Tuân thủ chất lượng
Cải tiến liên tục & Vòng lặp phản hồi

Nền tảng

Nền tảng được cấp bằng sáng chế cung cấp các lợi ích:

Nền tảng end-to-end dựa trên web
Chất lượng hoàn hảo
TAT nhanh hơn
Giao hàng liền mạch

Bộ dữ liệu âm thanh / giọng nói ngoài kệ

Corpus ID (Duy nhất)	Từ khóa	Tập dữ liệu ngôn ngữ	Mật ngữ	Tỷ lệ mẫu	Loại tập dữ liệu	Tổng số giờ âm thanh	Mô tả ngắn	Mô tả tập dữ liệu	audio Channel	Nền tảng ghi âm	WER (%)	Định dạng âm thanh	Định dạng phiên âm	Trường hợp sử dụng	Số Loa	Cố vấn trưởng
vi_US_CC_8	Người Mỹ gốc Phi	Người Mỹ gốc Phi	en_US	8 kHz	Trung tâm cuộc gọi	211	Dữ liệu trung tâm cuộc gọi bản ngữ người Mỹ gốc Phi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 612, Nam: 1242, và Không xác định: 12	Liên hệ
vi_US_MA_16	Người Mỹ gốc Phi	Người Mỹ gốc Phi	en_US	16 kHz	Âm thanh phương tiện	154	Dữ liệu truyền thông bản ngữ người Mỹ gốc Phi	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 151, Nam: 150, và Không xác định: 10	Liên hệ
Tiếng Nam Phi_GC_8	Afrikaans	Afrikaans	af_ZA	8 kHz	Cuộc trò chuyện chung	368	Dữ liệu hội thoại chung tiếng Afrikaans	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, nói tiếng Afrikaans ở Châu Phi	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 502, Nam: 390, và Không xác định: 2	Liên hệ
Tiếng Nam Phi_MA_16	Afrikaans	Afrikaans	af_ZA	16 kHz	Âm thanh phương tiện	658	Tệp phương tiện tiếng Afrikaans	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 750, Nam: 1278, và Không xác định: 52	Liên hệ
tiếng ả rập_GC_8	Tiếng Ả Rập	Tiếng Ả Rập	ar_AE	8 kHz	Cuộc trò chuyện chung	292	Dữ liệu Hội thoại chung tiếng Ả Rập	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Ả Rập từ các nước vùng Vịnh	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 171, Nam: 534, và Không xác định: 1	Liên hệ
Tiếng Ả Rập_SM_48	Tiếng Ả Rập	Tiếng Ả Rập	ar-SA	48 kHz	Độc thoại theo kịch bản	1,947	Độc thoại theo kịch bản tiếng Ả Rập	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 838 Nam 1209 Không xác định 78	Liên hệ
Tiếng Assam_CC_8	Assamese	Tiếng Assam (Trong đường ống)	như_IN		Trung tâm cuộc gọi	60	Dữ liệu Trung tâm cuộc gọi của Assamese (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Assam_GC	Assamese	Tiếng Assam (Trong đường ống)	như_IN		Cuộc trò chuyện chung	100	Dữ liệu hội thoại chung tiếng Assam (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Assam_MA	Assamese	Tiếng Assam (Trong đường ống)	như_IN		Âm thanh phương tiện	40	Dữ liệu âm thanh phương tiện truyền thông tiếng Assam (Trong đường ống)	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Bengal_CC_8	tiếng Bengali	Tiếng Bengali (Trong đường ống)	bn_IN		Trung tâm cuộc gọi	60	Dữ liệu trung tâm cuộc gọi tiếng Bengali (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Bengal_GC	tiếng Bengali	Tiếng Bengali (Trong đường ống)	bn_IN		Cuộc trò chuyện chung	100	Dữ liệu hội thoại chung bằng tiếng Bengali (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Bengal_MA	tiếng Bengali	Tiếng Bengali (Trong đường ống)	bn_IN		Âm thanh phương tiện	40	Tiếng Bengali (Trong đường ống) Dữ liệu âm thanh đa phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Boston_CC_8	Anh ngữ Boston	Anh ngữ Boston	en_US	8 kHz	Trung tâm cuộc gọi	177	Dữ liệu trung tâm cuộc gọi Boston	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 605, Nam: 711, và Không xác định: 0	Liên hệ
Boston_GC_8	Anh ngữ Boston	Anh ngữ Boston	en_US	8 kHz	Cuộc trò chuyện chung	32	Dữ liệu hội thoại chung Boston	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 53, Nam: 83, và Không xác định: 0	Liên hệ
Boston_MA_16	Anh ngữ Boston	Anh ngữ Boston	en_US	16 kHz	Âm thanh phương tiện	93	Dữ liệu âm thanh Boston Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 43, Nam: 181, và Không xác định: 2	Liên hệ
Canada_SM_48	Canada tiếng Pháp	Canada tiếng Pháp	fr-CA	48 kHz	Độc thoại theo kịch bản	1,222	Canada tiếng Pháp	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 974 Nam 631 Không xác định 1	Liên hệ
Tiếng Trung_CC_8	Tiếng anh trung quốc	Tiếng anh trung quốc	en_US	8 kHz	Trung tâm cuộc gọi	169	Dữ liệu trung tâm cuộc gọi Trung Quốc	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 1790, Nam: 523 và Không xác định: 13	Liên hệ
Tiếng Trung_MA_16	Tiếng anh trung quốc	Tiếng anh trung quốc	en_US	16 kHz	Âm thanh phương tiện	249	Dữ liệu âm thanh phương tiện truyền thông Trung Quốc	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 126, Nam: 346 và Không xác định: 6	Liên hệ
Tiếng Trung Giản Thể_SM_48	Trung Quốc giản thể (Chinese Simplified)	Trung Quốc giản thể (Chinese Simplified)	zh-CN	48 kHz	Độc thoại theo kịch bản	2,762	Trung Quốc giản thể (Chinese Simplified)	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1920 Nam 1535 Không xác định 270	Liên hệ
Tiếng Trung phồn thể_SM_48	Trung Quốc truyền thống	Trung Quốc truyền thống	zh-TW	48 kHz	Độc thoại theo kịch bản	1,028	Trung Quốc truyền thống	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1069 Nam 262 Không xác định 3	Liên hệ
Đan Mạch_GC_8	Tiếng Đan Mạch	Tiếng Đan Mạch	da_DK	8 kHz	Cuộc trò chuyện chung	372	Dữ liệu đàm thoại chung của Đan Mạch	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 311, Nam: 417, Không xác định: 0	Liên hệ
tiếng Đan Mạch_MA_16	Tiếng Đan Mạch	Tiếng Đan Mạch	da_DK	16 kHz	Âm thanh phương tiện	664	Dữ liệu âm thanh Media của Đan Mạch	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ: 369, Nam: 864, Không xác định: 27	Liên hệ
Đan Mạch_SM_48	Tiếng Đan Mạch	Tiếng Đan Mạch	da-DK	48 kHz	Độc thoại theo kịch bản	2,579	Độc thoại theo kịch bản Đan Mạch	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây, tiếng Đan Mạch từ Đan Mạch	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1551 Nam 1233 Không xác định 42	Liên hệ
Tiếng Anh Deep South_CC_8	Tiếng Anh Deep South	Tiếng Anh Deep South	en_US	8 kHz	Trung tâm cuộc gọi	151	Tiếng Anh Deep South Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 221 , Nam 1004 , Không rõ 7	Liên hệ
Tiếng Anh Deep South_GC_8	Tiếng Anh Deep South	Tiếng Anh Deep South	en_US	8 kHz	Cuộc trò chuyện chung	56	Dữ liệu hội thoại chung tiếng Anh Deep South	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 99, Nam 31, Không rõ 0	Liên hệ
Tiếng Anh Deep South_MA_16	Tiếng Anh Deep South	Tiếng Anh Deep South	en_US	16 kHz	Âm thanh phương tiện	266	Tiếng Anh Dữ liệu âm thanh Deep South Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 204, Nam 356, Không rõ 21	Liên hệ
tiếng Đức_CC_8	Tiếng Đức	Tiếng Đức	de-de	8 kHz	Trung tâm cuộc gọi	64	Dữ liệu trung tâm cuộc gọi của Đức	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Mono	Máy tính để bàn		. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 478 Nam 1440 Không biết 0	Liên hệ
tiếng Đức_IVR_8	Tiếng Đức	Tiếng Đức	de-de	8 kHz	IVR	200	Dữ liệu IVR của Đức	Con người đến Máy móc. Một loại luồng IVR trong đó có lời nhắc TTS (ví dụ: “Tôi có thể giúp gì cho bạn”) theo sau là phản hồi tự phát của con người	Mono	Máy tính để bàn		. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 10115 Nam 8750 Không xác định 0	Liên hệ
Gujarati_CC_8	tiếng gujarat	Gujarati (Trong đường ống)	gu_IN		Trung tâm cuộc gọi	60	Dữ liệu Trung tâm cuộc gọi Gujarati (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Gujarati_GC	tiếng gujarat	Gujarati (Trong đường ống)	gu_IN		Cuộc trò chuyện chung	100	Gujarati (Trong đường ống) Dữ liệu hội thoại chung	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Gujarati_MA	tiếng gujarat	Gujarati (Trong đường ống)	gu_IN		Âm thanh phương tiện	40	Gujarati (Trong đường ống) Dữ liệu âm thanh phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Do Thái_Hội thoại chung_8	Hebrew	Hebrew	anh_IL	8 kHz	Cuộc trò chuyện chung	399	Dữ liệu Hội thoại chung tiếng Do Thái	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Do Thái ở Israel	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 414 , Nam 399 , Không xác định 1	Liên hệ
tiếng Do Thái_MA_16	Hebrew	Hebrew	anh_IL	16 kHz	Âm thanh phương tiện	427	Dữ liệu âm thanh tiếng Do Thái Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 361 , Nam 513, Không biết 13	Liên hệ
Tiếng Hin-ddi_MA_16	Tiếng Hin-ddi	Tiếng Hin-ddi	chào_IN	16 kHz	Âm thanh phương tiện	219	Dữ liệu âm thanh Hindi Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 83 , Nam 309, Không biết 0	Liên hệ
Tiếng Hindi_SM_48	Tiếng Hin-ddi	Tiếng Hin-ddi	hi-IN	48 kHz	Độc thoại theo kịch bản	2,867	Độc thoại theo kịch bản tiếng Hindi	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1977 Nam 1864 Không xác định 147	Liên hệ
HINGLISH_CC_8	Bản lề	Bản lề	hg_IN	8 kHz	Trung tâm cuộc gọi	208	HINGLISH Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 822, Nam 1262 , Không xác định 0	Liên hệ
HINGLISH_MA_16	Bản lề	Bản lề	hg_IN	16 kHz	Âm thanh phương tiện	216	Dữ liệu âm thanh phương tiện HINGLISH	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 75, Nam 380, Không rõ 0	Liên hệ
Tây Ban Nha_CC_8	Tiếng Anh gốc Tây Ban Nha	Tiếng Anh gốc Tây Ban Nha	en_US	8 kHz	Trung tâm cuộc gọi	212	Dữ liệu trung tâm cuộc gọi Tây Ban Nha	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 822, Nam 1262, Không rõ 0	Liên hệ
Tây Ban Nha_MA_16	Tiếng Anh gốc Tây Ban Nha	Tiếng Anh gốc Tây Ban Nha	en_US	16 kHz	Âm thanh phương tiện	155	Âm thanh phương tiện cuộc gọi Tây Ban Nha	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 140, Nam 219, Không rõ 5	Liên hệ
Indonesia_GC_8	Tiếng Indonesia	Tiếng Indonesia	tôi đã làm	8 kHz	Cuộc trò chuyện chung	496	Dữ liệu Hội thoại chung Indonesia	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Bahasa Indonesia	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 524, Nam 454, Không rõ 2	Liên hệ
Tiếng Indonesia_MA_16	Tiếng Indonesia	Tiếng Indonesia	tôi đã làm	16 kHz	Âm thanh phương tiện	643	Dữ liệu âm thanh Truyền thông Indonesia	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 746, Nam 1507, Không rõ 129	Liên hệ
Ailen_GC_8	Ireland	Ireland	vi_IE	8 kHz	Cuộc trò chuyện chung	192	Dữ liệu hội thoại chung tiếng Ireland	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 213 , Nam 153 , Không biết 0	Liên hệ
Tiếng Nhật_SM_48	Tiếng Nhật	Tiếng Nhật	ja-JP	48 kHz	Độc thoại theo kịch bản	2,335	Độc thoại theo kịch bản tiếng Nhật	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1460 Nam 1221 Không xác định 194	Liên hệ
Tiếng Kannada_CC_8	kannada	Kannada (Trong đường ống)	kn_IN		Trung tâm cuộc gọi	60	Kannada (Trong đường ống) Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Kannada_GC	kannada	Kannada (Trong đường ống)	kn_IN		Cuộc trò chuyện chung	100	Dữ liệu hội thoại chung tiếng Kannada (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Kannada_MA	kannada	Kannada (Trong đường ống)	kn_IN		Âm thanh phương tiện	40	Kannada (Trong đường ống) Dữ liệu âm thanh đa phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Hàn_CC_8	Tiếng Hàn	Tiếng Hàn	ko_KR	8 kHz	Trung tâm cuộc gọi	107	Dữ liệu tổng đài Hàn Quốc	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1086, Nam 210 , Không rõ 4	Liên hệ
Tiếng Hàn_MA_16	Tiếng Hàn	Tiếng Hàn	ko_KR	16 kHz	Âm thanh phương tiện	204	Dữ liệu âm thanh truyền thông Hàn Quốc	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 70 Nam 303, Không rõ 25	Liên hệ
Hàn Quốc_SM_48	Tiếng Hàn	Tiếng Hàn	ko-KR	48 kHz	Độc thoại theo kịch bản	1,955	Độc thoại theo kịch bản tiếng Hàn	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1195 Nam 1134 Không xác định 122	Liên hệ
Mã Lai_GC_8	Người Malay	Người Malay	ms_MY	8 kHz	Cuộc trò chuyện chung	266	Dữ liệu hội thoại chung tiếng Malay	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Malay ở Malaysia	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 316, Nam 176 , Không rõ 0	Liên hệ
tiếng Mã Lai_MA_16	Người Malay	Người Malay	ms_MY	16 kHz	Âm thanh phương tiện	344	Dữ liệu âm thanh Malay Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 236, Nam 626, Không rõ 47	Liên hệ
Tiếng Malayalam_CC_8	Malayalam	Malayalam (Trong đường ống)	ml_IN		Trung tâm cuộc gọi	60	Dữ liệu Trung tâm cuộc gọi Malayalam (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Malayalam_GC	Malayalam	Malayalam (Trong đường ống)	ml_IN		Cuộc trò chuyện chung	100	Malayalam (Trong đường ống) Dữ liệu hội thoại chung	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Malayalam_MA	Malayalam	Malayalam (Trong đường ống)	ml_IN		Âm thanh phương tiện	40	Dữ liệu âm thanh phương tiện truyền thông Malayalam (Trong đường ống)	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Marathi_CC_8	Marathi	Marathi (Trong đường ống)	ông_IN		Trung tâm cuộc gọi	60	Marathi (Trong đường ống) Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Marathi_GC	Marathi	Marathi (Trong đường ống)	ông_IN		Cuộc trò chuyện chung	100	Marathi (Trong đường ống) Dữ liệu hội thoại chung	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Marathi_MA	Marathi	Marathi (Trong đường ống)	ông_IN		Âm thanh phương tiện	40	Marathi (Trong đường ống) Dữ liệu âm thanh đa phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Mexico_SM_48	Tiếng Tây Ban Nha (Mexico)	Tiếng Tây Ban Nha (Mexico)	es-MX	48 kHz	Độc thoại theo kịch bản	1,492	Độc thoại theo kịch bản tiếng Tây Ban Nha Mexico	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1016 Nam 1069 Không xác định 95	Liên hệ
Hà Lan_SM_48	Tiếng Hà Lan	Tiếng Hà Lan	nl-NL	48 kHz	Độc thoại theo kịch bản	1,205	Độc thoại theo kịch bản tiếng Hà Lan	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1285 Nam 531 Không xác định 3	Liên hệ
New York Tiếng Anh_CC_8	Tiếng Anh ở New York	Tiếng Anh ở New York	en_US	8 kHz	Trung tâm cuộc gọi	103	Dữ liệu trung tâm cuộc gọi tiếng Anh New York	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 610, Nam 532, Không biết 0	Liên hệ
New York Tiếng Anh_GC_8	Tiếng Anh ở New York	Tiếng Anh ở New York	en_US	8 kHz	Cuộc trò chuyện chung	107	Dữ liệu đàm thoại tiếng Anh tổng quát ở New York	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 118, Nam 114, Không rõ 0	Liên hệ
New York Tiếng Anh_MA_16	Tiếng Anh ở New York	Tiếng Anh ở New York	en_US	16 kHz	Âm thanh phương tiện	140	Dữ liệu âm thanh New York English Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 66, Nam 230, Không rõ 11	Liên hệ
New Zealand_GC_8	Tiếng Anh ở New Zealand	Tiếng Anh ở New Zealand	vi_NZ	8 kHz	Cuộc trò chuyện chung	148	Dữ liệu đàm thoại tiếng Anh tổng quát của New Zealand	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 167, nam 121, Không rõ 4	Liên hệ
New Zealand_MA_16	Tiếng Anh ở New Zealand	Tiếng Anh ở New Zealand	vi_NZ	16 kHz	Âm thanh phương tiện	400	Âm thanh truyền thông tiếng Anh New Zealand	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 367, nam 678, Không rõ 26	Liên hệ
Oriya_CC_8	Oriya	Oriya (Trong đường ống)	hoặc_IN		Trung tâm cuộc gọi	60	Oriya (Trong đường ống) Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Oriya_GC	Oriya	Oriya (Trong đường ống)	hoặc_IN		Cuộc trò chuyện chung	100	Oriya (Trong đường ống) Dữ liệu hội thoại chung	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Oriya_MA	Oriya	Oriya (Trong đường ống)	hoặc_IN		Âm thanh phương tiện	40	Oriya (Trong đường ống) Dữ liệu âm thanh đa phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Ba Lan_MA_16	Tiếng Ba Lan	Tiếng Ba Lan	pl_PL	16 kHz	Âm thanh phương tiện	269	Âm thanh truyền thông Ba Lan	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 173 Nam 354 Không biết 6	Liên hệ
Ba Lan Ba Lan_SM_48	Tiếng Ba Lan (Ba Lan)	Tiếng Ba Lan (Ba Lan)	pl-PL	48 kHz	Độc thoại theo kịch bản	1,482	Ba Lan Ba Lan - Độc thoại theo kịch bản	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1324 Nam 701 Không xác định 24	Liên hệ
Tiếng Ba Tư_CC_8	punjabi	Tiếng Ba Tư (Trong đường ống)	punjabi		Trung tâm cuộc gọi	60	Dữ liệu trung tâm cuộc gọi Punjabi (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Ba Tư_GC	punjabi	Tiếng Ba Tư (Trong đường ống)	punjabi		Cuộc trò chuyện chung	100	Dữ liệu cuộc trò chuyện chung của Punjabi (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Ba Tư_MA	punjabi	Tiếng Ba Tư (Trong đường ống)	punjabi		Âm thanh phương tiện	40	Tiếng Ba Tư (Trong đường ống) Dữ liệu âm thanh phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Nga_SM_48	Tiếng Nga	Tiếng Nga	ru-RU	48 kHz	Độc thoại theo kịch bản	2,398	Độc thoại theo kịch bản tiếng Nga	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1689 Nam 1937 Không xác định 214	Liên hệ
Scotland_GC_8	Scotland (Giọng Anh)	Scotland (Giọng Anh)	vi_AB	8 kHz	Cuộc trò chuyện chung	292	Dữ liệu hội thoại chung Scotland	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 285 , Nam 260, Không biết 3	Liên hệ
Singapore_CC_8	Singapore tiếng Anh	Singapore tiếng Anh	vi_SG	8 kHz	Trung tâm cuộc gọi	218	Dữ liệu tổng đài Singapore	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 2139 , Nam 884, Không xác định 21	Liên hệ
Singapore_MA_16	Singapore tiếng Anh	Singapore tiếng Anh	vi_SG	16 kHz	Âm thanh phương tiện	247	Dữ liệu âm thanh phương tiện truyền thông Singapore	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 160, Nam 455, Không rõ 37	Liên hệ
Tiếng Anh Nam Phi_CC_8	Tiếng Anh Nam Phi	Tiếng Anh Nam Phi	vi_ZA	8 kHz	Trung tâm cuộc gọi	261	Dữ liệu tổng đài tiếng Anh Nam Phi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1274 , Nam 935 , Không biết 1	Liên hệ
Tiếng Anh Nam Phi_MA_16	Tiếng Anh Nam Phi	Tiếng Anh Nam Phi	vi_ZA	16 kHz	Âm thanh phương tiện	251	Dữ liệu âm thanh phương tiện tiếng Anh Nam Phi	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 235, Nam 432, Không rõ 36	Liên hệ
tiếng Swahili_CC_8	Swahili	Swahili	sw_KE	8 kHz	Trung tâm cuộc gọi	230	Dữ liệu trung tâm cuộc gọi tiếng Swahili	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 611, Nam 833, Không rõ 0	Liên hệ
Tiếng Swahili_MA_16	Swahili	Swahili	sw_KE	16 kHz	Âm thanh phương tiện	265	Dữ liệu âm thanh Swahili Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 118, Nam 493, Không rõ 25	Liên hệ
Thụy Điển_CC_8	Tiếng Thụy Điển	Tiếng Thụy Điển	sv_SE	8 kHz	Trung tâm cuộc gọi	250	Dữ liệu Call-Center của Thụy Điển	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1581, nam 727, Không rõ 2	Liên hệ
tiếng Thụy Điển_MA_16	Tiếng Thụy Điển	Tiếng Thụy Điển	sv_SE	16 kHz	Âm thanh phương tiện	278	Dữ liệu âm thanh của Truyền thông Thụy Điển	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 195, nam 500, Không rõ 21	Liên hệ
Tamil_CC_8	tamil	Tiếng Tamil (Trong đường ống)	ta_IN		Trung tâm cuộc gọi	60	Dữ liệu Trung tâm cuộc gọi Tamil (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tamil_GC	tamil	Tiếng Tamil (Trong đường ống)	ta_IN		Cuộc trò chuyện chung	100	Dữ liệu hội thoại chung tiếng Tamil (Trong đường ống)	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tamil_MA	tamil	Tiếng Tamil (Trong đường ống)	ta_IN		Âm thanh phương tiện	40	Dữ liệu âm thanh phương tiện Tamil (Trong đường ống)	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Telugu_GC_8	telugu	telugu	te_IN	8 kHz	Cuộc trò chuyện chung	553	Dữ liệu hội thoại chung Telugu	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 574 , Nam 564, Không xác định 0	Liên hệ
Tiếng Telugu_MA_16	telugu	telugu	te_IN	16 kHz	Âm thanh phương tiện	648	Dữ liệu âm thanh Telugu Media	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 207, Nam 963, Không rõ 2	Liên hệ
Tiếng Telugu_CC_8	telugu	Telugu (Trong đường ống)	te_IN		Trung tâm cuộc gọi	30	Telugu (Trong đường ống) Dữ liệu trung tâm cuộc gọi	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Telugu_GC	telugu	Telugu (Trong đường ống)	te_IN		Cuộc trò chuyện chung	50	Telugu (Trong đường ống) Dữ liệu hội thoại chung	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,		Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
Tiếng Telugu_MA	telugu	Telugu (Trong đường ống)	te_IN		Âm thanh phương tiện	20	Telugu (Trong đường ống) Dữ liệu âm thanh đa phương tiện	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút		Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ		Liên hệ
tiếng Thái_GC_8	Tiếng Thái	Tiếng Thái	th_TH	8 kHz	Cuộc trò chuyện chung	183	Hội thoại tiếng Thái tổng hợp	Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, Đăng ký không chính thức được sử dụng giữa bạn bè	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 338, Nam 96, Không rõ 8	Liên hệ
tiếng Thái_MA_8	Tiếng Thái	Tiếng Thái	th_TH	16 kHz	Âm thanh phương tiện	173	Âm thanh truyền thông Thái Lan	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 143, Nam 502, Không rõ 26	Liên hệ
Thổ Nhĩ Kỳ Thổ Nhĩ Kỳ_SM_48	Thổ Nhĩ Kỳ Thổ Nhĩ Kỳ	Thổ Nhĩ Kỳ Thổ Nhĩ Kỳ	tr-TR	48 kHz	Độc thoại theo kịch bản	2,027	Thổ Nhĩ Kỳ Thổ Nhĩ Kỳ	Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây	Mono	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 1561 Nam 1241 Không xác định 31	Liên hệ
Tiếng Việt_GC_8	Tiếng Việt	Tiếng Việt	vi_VN	8 kHz	Cuộc trò chuyện chung	295	Dữ liệu Hội thoại chung tiếng Việt	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút, miền Bắc (ví dụ: Hà Nội), miền Trung và miền Nam (ví dụ: Thành phố Hồ Chí Minh).	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 400, nam 380, Ẩn số 2	Liên hệ
Tiếng Việt_MA_16	Tiếng Việt	Tiếng Việt	vi_VN	16 kHz	Âm thanh phương tiện	257	Dữ liệu âm thanh Media Việt Nam	Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phút	Mono	Tìm nguồn cung ứng web	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 249, nam 200, Ẩn số 45	Liên hệ
tiếng Wales_GC_8	Tiếng Wales (Giọng Anh)	Tiếng Wales (Giọng Anh)	vi_WL	8 kHz	Cuộc trò chuyện chung	278	Dữ liệu hội thoại chung tiếng Wales	Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,	Hai	Máy tính để bàn	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Nữ 270, Nam 324, Không rõ 0	Liên hệ
Anh Anh_WW_16	Anh Anh	Anh Anh	en_uk	16 kHz	Thức tỉnh	Loa 200	Wake Word Vương quốc Anh	thu thập dữ liệu từ khóa loa 200 4 cụm từ khóa duy nhất cho mỗi người nói 25-30 bản ghi cụm từ khóa lặp lại cho mỗi cụm từ khóa duy nhất 25-30 tệp âm thanh cho mỗi cụm từ khóa duy nhất Tổng số 120 phát biểu được ghi lại cho mỗi người nói	kênh 1	Điện thoại di động App	5.0	. Wav	.json	ASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ	Giới tính: 50% nam, 50% nữ, +/-10%.	Liên hệ

Các dịch vụ được cung cấp

Thu thập dữ liệu âm thanh chuyên nghiệp không phải là tất cả mọi thứ để thiết lập AI toàn diện. Tại Shaip, bạn thậm chí có thể xem xét các dịch vụ sau để làm cho các mô hình trở nên phổ biến hơn bình thường:

Tài nguyên đề xuất

Cung cấp

Chú thích âm thanh cho AI thông minh

Dịch vụ chú thích âm thanh đã là một sở trường của Shaip ngay từ những ngày đầu thành lập. Phát triển, đào tạo và cải thiện AI, chatbots & công cụ nhận dạng giọng nói đàm thoại với các dịch vụ chú thích âm thanh hiện đại của chúng tôi.

Hướng dẫn người mua

Hướng dẫn của người mua: Hướng dẫn đầy đủ về AI hội thoại

Chatbot mà bạn trò chuyện chạy trên hệ thống AI đàm thoại tiên tiến được đào tạo, thử nghiệm và xây dựng bằng cách sử dụng rất nhiều bộ dữ liệu nhận dạng giọng nói.

Danh mục dữ liệu

Cấp phép và danh mục dữ liệu giọng nói không có sẵn

Có rất nhiều ứng dụng phổ biến cho dữ liệu giọng nói trong các dự án AI. Chúng tôi cung cấp cho bạn lượng lớn dữ liệu chất lượng cao sẵn sàng cho nhận dạng giọng nói của bạn.

Bạn muốn xây dựng tập dữ liệu âm thanh của riêng mình?

Kết nối với chuyên gia thu thập dữ liệu giọng nói nội bộ của chúng tôi để thiết lập kho lưu trữ âm thanh phù hợp nhất với yêu cầu của bạn

Tên*
Họ*
E-mail*
Điện thoại*
Công ty*
Quốc gia*
Quốc gia
Nhận xét*
Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo vệ thông tin cá nhân của người tiêu dùng và Các Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.
CAPTCHA

Những câu hỏi thường gặp (FAQ)

1. Thu thập dữ liệu giọng nói là gì?

Thu thập dữ liệu giọng nói cho Mô hình ML đề cập đến quá trình thu thập bản ghi âm của ngôn ngữ nói. Bộ sưu tập này hỗ trợ đào tạo và tinh chỉnh các thuật toán học máy, đặc biệt là các thuật toán tập trung vào việc hiểu và xử lý giọng nói của con người.

2. Làm cách nào để thu thập dữ liệu âm thanh cho ASR (Nhận dạng giọng nói tự động)?

Khi muốn thu thập dữ liệu âm thanh cho Nhận dạng giọng nói tự động (ASR), bạn nên bắt đầu bằng cách xác định nhu cầu cụ thể của dự án, bao gồm ngôn ngữ, giọng nói và loại giọng nói mong muốn. Sau khi thiết lập các tham số này, hãy đảm bảo bạn có được tất cả các quyền cần thiết để tôn trọng quyền riêng tư của người dùng. Sau đó, sử dụng thiết bị hoặc phần mềm ghi âm thích hợp để ghi lại các mẫu âm thanh rõ ràng. Mỗi bản ghi phải được chú thích tỉ mỉ bằng bản ghi âm hoặc siêu dữ liệu thích hợp khác và được lưu trữ một cách có hệ thống để dễ dàng truy cập.

3. Sử dụng Bộ dữ liệu giọng nói cho Machine Learning

Tập dữ liệu giọng nói trong học máy có vai trò then chốt trong việc đào tạo, thử nghiệm và xác thực các mô hình được điều chỉnh để nhận dạng, phiên âm hoặc diễn giải ngôn ngữ nói. Những bộ dữ liệu như vậy mở đường cho vô số ứng dụng, từ trợ lý giọng nói và dịch vụ phiên âm đến sinh trắc học giọng nói.

4. Cách thu thập dữ liệu chính xác từ nhiều ngôn ngữ và giọng nói

Để thu thập dữ liệu chính xác từ các ngôn ngữ và giọng điệu đa dạng, việc cộng tác với người bản ngữ có nền tảng ngôn ngữ mong muốn là rất quan trọng. Hãy nhắm đến một mẫu đa dạng và mang tính đại diện để bao quát nhiều sắc thái nhân khẩu học. Sử dụng thiết bị ghi âm được tiêu chuẩn hóa trong môi trường đồng nhất để đảm bảo tính nhất quán của âm thanh. Và quan trọng là chú thích từng phần dữ liệu bằng bản ghi và siêu dữ liệu chi tiết, biểu thị ngôn ngữ và giọng nói cụ thể.

Dịch vụ thu thập dữ liệu giọng nói đáng tin cậy nhất cho AI của bạn

Khám phá các đường dẫn dữ liệu âm thanh mà không bị tắc nghẽn

Khách hàng nổi bật

Dịch vụ thu thập dữ liệu âm thanh/giọng nói chuyên nghiệp

Bất kỳ môn học nào. Bất kỳ kịch bản nào.

100 +

55K +

250 +

60 +

8 / 16 / 44 / 48 kHz

Thế mạnh của PHATBEE

Căn chỉnh dữ liệu âm thanh cho các mô hình NLP thông minh hơn

Bộ sưu tập lời nói độc thoại

Bài phát biểu đối thoại Bộ sưu tập

Nhóm/Đảng Muti Cuộc trò chuyện

Bộ sưu tập Utterance Ngôn ngữ Tự nhiên

Dữ liệu âm thanh Bộ sưu tập

Nhận dạng giọng nói tự động (ASR)

Dữ liệu đào tạo về giọng nói / âm thanh đa ngôn ngữ

Text-to-Speech (TTS)

Trung tâm cuộc gọi Ghi chép

Câu chuyện thành công

Lý do chọn Shaip làm Đối tác thu thập dữ liệu giọng nói đáng tin cậy của bạn

người

Quy trình xét duyệt

Nền tảng

người

Quy trình xét duyệt

Nền tảng

Bộ dữ liệu âm thanh / giọng nói ngoài kệ

Các dịch vụ được cung cấp

Thu thập dữ liệu văn bản DỊCH VỤ

Dịch vụ thu thập dữ liệu hình ảnh

Dịch vụ thu thập dữ liệu video

Tài nguyên đề xuất

Cung cấp

Chú thích âm thanh cho AI thông minh

Hướng dẫn người mua

Hướng dẫn của người mua: Hướng dẫn đầy đủ về AI hội thoại

Danh mục dữ liệu

Cấp phép và danh mục dữ liệu giọng nói không có sẵn

Bạn muốn xây dựng tập dữ liệu âm thanh của riêng mình?

Những câu hỏi thường gặp (FAQ)

Dịch vụ dữ liệu AI

Đặc biệt

Công nghiệp

Sản phẩm

Công ty

Thông tin

Liên hệ

Bài phát biểu đối thoại
Bộ sưu tập

Nhóm/Đảng Muti
Cuộc trò chuyện

Dữ liệu âm thanh
Bộ sưu tập

Text-to-Speech
(TTS)

Trung tâm cuộc gọi
Ghi chép

Thu thập dữ liệu văn bản
DỊCH VỤ