Dịch vụ thu thập dữ liệu giọng nói đáng tin cậy nhất cho AI của bạn

Đào tạo các mô hình NLP, VA, TTS, v.v. của bạn với dữ liệu đàm thoại chất lượng, với các dịch vụ thu thập dữ liệu âm thanh và giọng nói của chúng tôi

Thu thập dữ liệu âm thanh

Khám phá các đường dẫn dữ liệu âm thanh mà không bị tắc nghẽn

Khách hàng nổi bật

Dịch vụ thu thập dữ liệu âm thanh/giọng nói chuyên nghiệp

Bất kỳ môn học nào. Bất kỳ kịch bản nào.

Tại Shaip, chuyên môn của chúng tôi nằm ở việc tạo ra các bộ dữ liệu giọng nói chất lượng cao được thiết kế cho các yêu cầu AI/ML khác nhau. Chúng tôi cung cấp nhiều ngôn ngữ và ghi lại trong các cài đặt đa dạng giúp cho bộ dữ liệu của chúng tôi trở nên toàn diện và có thể thích ứng. ồtrọng tâm của bạn là cung cấp các mô hình có khối lượng dữ liệu giọng nói tùy chỉnh cao nhất trong thời gian ít nhất có thể. Với sự đồng hành của chúng tôi, bạn có thể mong đợi: 

Bộ sưu tập bài phát biểu
  • Dữ liệu âm thanh / giọng nói đa ngôn ngữ chất lượng cao được quản lý để cải thiện độ chính xác
  • Mức độ đặc hiệu miền cao nhất có thể đối với tkịch bản đa dạng thiết lập
  •  Quy mô mô hình ML của bạn để phù hợp với nhân khẩu học và ngành dọc đa dạng
  • Môi trường ghi âm: Chất lượng phòng thu, có âm thanh trong trẻo với tiếng ồn xung quanh tối thiểu, & Môi trường tự nhiên, trong đó các bản ghi kết hợp âm thanh xung quanh để mô phỏng các tình huống trong thế giới thực.

100 +

Các quốc gia

55K +

Dữ liệu giờ nói

250 +

Dự án

60 +

Ngôn ngữ (Hơn 100 phương ngữ)

8 / 16 / 44 / 48 kHz

tỷ lệ lấy mẫu

Thế mạnh của PHATBEE

Căn chỉnh dữ liệu âm thanh cho các mô hình NLP thông minh hơn

Shaip cung cấp các dịch vụ thu thập dữ liệu âm thanh / giọng nói từ đầu đến cuối bằng hơn 100 ngôn ngữ để cho phép các công nghệ hỗ trợ giọng nói phục vụ cho nhiều đối tượng khác nhau trên toàn cầu. Chúng tôi có thể làm việc trên các dự án ở bất kỳ phạm vi và quy mô nào; từ cấp phép cho các tập dữ liệu âm thanh có sẵn hiện có, đến quản lý thu thập dữ liệu âm thanh tùy chỉnh, đến phiên âm và chú thích âm thanh. Bất kể dự án thu thập dữ liệu giọng nói của bạn lớn đến mức nào, chúng tôi có thể tùy chỉnh các dịch vụ thu thập âm thanh cho phù hợp với nhu cầu của bạn để xây dựng bộ dữ liệu NLP chất lượng cao nhắm mục tiêu đến phương ngữ, âm và ngôn ngữ. Chọn từ nhiều bộ dữ liệu giọng nói và tài nguyên thu thập dữ liệu âm thanh của chúng tôi, để thiết lập thông minh hỗ trợ giọng nói.

Lời độc thoại

Lời nói độc thoại có kịch bản và tự phát

Nó tập trung vào việc xử lý lời nói từ một người nói. Sử dụng lời nhắc theo kịch bản để đưa vào các tệp âm thanh một kênh, đảm bảo ghi lại các mẫu giọng nói, âm sắc và sắc thái riêng dành riêng cho cá nhân đó.

Bài phát biểu đối thoại

Đối thoại theo kịch bản và lời nói tự phát

Tương tác giữa hai người, tái tạo các cuộc trò chuyện và đối thoại trong thế giới thực với khả năng hiển thị đa ngôn ngữ thông qua các tệp kênh đôi và tài nguyên được phiên âm.

Đối thoại nhiều bên

Nhóm/Đảng Muti
Cuộc trò chuyện

Thảo luận nhiều người, nắm bắt động lực nhóm, sự chồng chéo và giọng điệu đa dạng để huấn luyện chính xác các mẫu giọng nói.

Bộ sưu tập các câu nói đánh thức

Bộ sưu tập Wake-word / Cụm từ chính / Lời nói​

Huấn luyện AI để xác định các cụm từ chính hoặc đánh thức các từ hoặc cách phát âm có ý nghĩa tương tự bằng cách sử dụng các cách phát âm đa dạng, phong phú và xác thực để xử lý và hiểu ngôn ngữ tự nhiên nâng cao.

Lời nói âm thanh

Dữ liệu âm thanh
Bộ sưu tập

Chúng tôi có thể ghi lại dữ liệu âm thanh chất lượng phòng thu một cách chuyên nghiệp, có thể là nhà hàng, văn phòng, gia đình hoặc từ nhiều môi trường và ngôn ngữ khác nhau, đồng thời bao phủ phạm vi âm thanh rộng hơn (Bộ dữ liệu âm thanh toàn diện).

Tự động nhận dạng giọng nói

Nhận dạng giọng nói tự động (ASR)

Cải thiện độ chính xác của hệ thống nhận dạng giọng nói tự động (ASR) của bạn bằng cách có quyền truy cập vào bộ dữ liệu âm thanh / giọng nói đa dạng hiện đại, từ nhiều loại nhân khẩu học.

Phát ngôn ngôn ngữ tự nhiên

Dữ liệu đào tạo về giọng nói / âm thanh đa ngôn ngữ

Các chuyên gia ngôn ngữ lành nghề của chúng tôi trên toàn cầu cung cấp dữ liệu âm thanh/lời nói đa ngôn ngữ bằng nhiều ngôn ngữ và phương ngữ khác nhau. Nỗ lực này thúc đẩy giao tiếp toàn cầu và xóa bỏ rào cản ngôn ngữ, góp phần tạo ra các giải pháp AI toàn diện và hiệu quả hơn.

Trợ lý ảo kỹ thuật số

Text-to-Speech
(TTS)

Xây dựng mô hình đa ngôn ngữ chuyển văn bản thành giọng nói (TTS) với sự trợ giúp của lực lượng lao động toàn cầu của chúng tôi, những người giúp bạn thu thập dữ liệu giọng nói ở hơn 150 ngôn ngữ và phương ngữ để nâng cao mô hình AI của bạn từ điều khiển trong ô tô đến chatbot và các giải pháp học tập với hiệu suất cao dữ liệu âm thanh chất lượng.

Bản ghi trung tâm cuộc gọi

Trung tâm cuộc gọi
Cuộc trò chuyện

Trao đổi chân thực giữa đại lý và khách hàng, hỗ trợ nhiều ngôn ngữ như tiếng Tây Ban Nha, tiếng Đức, tiếng Anh Mỹ, tiếng Bengali, tiếng Nhật, tiếng Trung và tiếng Hindi.

Câu chuyện thành công

Bộ dữ liệu AI đàm thoại với hơn 3 nghìn giờ dữ liệu trên 8 ngôn ngữ

Với mong muốn xây dựng một nền tảng đa ngôn ngữ cho các ngôn ngữ Ấn Độ, khách hàng đã hợp tác với Shaip để thu thập, phân đoạn và phiên âm các tập dữ liệu lớn bằng nhiều ngôn ngữ Ấn Độ. Điều này sẽ giúp phát triển các mẫu giọng nói hiệu quả có thể hỗ trợ nền tảng mới mang tính đổi mới của khách hàng.

Vấn đề: Hơn 3,000 giờ dữ liệu âm thanh được thu thập bằng 8 ngôn ngữ Ấn Độ, được phân đoạn và phiên âm để phát triển tính năng nhận dạng giọng nói tự động.

Giải pháp: Chúng tôi đã cung cấp tính năng thu thập, phân đoạn, sao chép dữ liệu và phân phối các tệp JSON cùng với siêu dữ liệu. Chúng tôi đã thu thập 3000 giờ dữ liệu âm thanh bằng 8 ngôn ngữ Ấn Độ trên quy mô lớn cho dự án công nghệ giọng nói của khách hàng.

Nghiên cứu trường hợp thu thập dữ liệu giọng nói

Lý do chọn Shaip làm Đối tác thu thập dữ liệu giọng nói đáng tin cậy của bạn

Người nổi tiếng

Người nổi tiếng

Đội ngũ tận tâm và được đào tạo:

  • Hơn 30,000 cộng tác viên để Tạo dữ liệu, Ghi nhãn và Chất lượng
  • Nhóm quản lý dự án được chứng nhận
  • Nhóm phát triển sản phẩm có kinh nghiệm
  • Nhóm Tìm nguồn & Giới thiệu Talent Pool
Quy trình xét duyệt

Quy trình xét duyệt

Đảm bảo hiệu quả quy trình cao nhất với:

  • Quy trình cổng giai đoạn 6 Sigma mạnh mẽ
  • Đội ngũ chuyên dụng gồm 6 đai đen Sigma - Chủ sở hữu quy trình chính & Tuân thủ chất lượng
  • Cải tiến liên tục & Vòng lặp phản hồi
Nền tảng

Nền tảng

Nền tảng được cấp bằng sáng chế cung cấp các lợi ích:

  • Nền tảng end-to-end dựa trên web
  • Chất lượng hoàn hảo
  • TAT nhanh hơn
  • Giao hàng liền mạch

Bộ dữ liệu âm thanh / giọng nói ngoài kệ

Chi tiếtTập dữ liệu ngôn ngữTỷ lệ mẫuLoại tập dữ liệuTổng số giờ âm thanhMô tả ngắnMô tả tập dữ liệuaudio ChannelNền tảng ghi âmWER (%)Định dạng âm thanhĐịnh dạng phiên âmTrường hợp sử dụngSố LoaCố vấn trưởng
Phát biểuNew York Tiếng Anh_GC_8Tiếng Anh ở New YorkTiếng Anh ở New Yorken_US8 kHzCuộc trò chuyện chung107Dữ liệu đàm thoại tiếng Anh tổng quát ở New YorkCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 118, Nam 114, Không rõ 0
Phát biểuNga_SM_48Tiếng NgaTiếng Ngaru-RU48 kHzĐộc thoại theo kịch bản2,398Độc thoại theo kịch bản tiếng NgaCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1689 Nam 1937 Không xác định 214
Phát biểuTiếng Ba Tư_MApunjabiTiếng Ba Tư (Trong đường ống) punjabi Âm thanh phương tiện40Tiếng Ba Tư (Trong đường ống) Dữ liệu âm thanh phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Ba Tư_GCpunjabiTiếng Ba Tư (Trong đường ống) punjabiCuộc trò chuyện chung100Dữ liệu cuộc trò chuyện chung của Punjabi (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Ba Tư_CC_8punjabiTiếng Ba Tư (Trong đường ống) punjabiTrung tâm cuộc gọi60Dữ liệu trung tâm cuộc gọi Punjabi (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBa Lan Ba ​​Lan_SM_48Tiếng Ba Lan (Ba Lan)Tiếng Ba Lan (Ba Lan)pl-PL48 kHzĐộc thoại theo kịch bản1,482Ba Lan Ba ​​Lan - Độc thoại theo kịch bảnCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1324 Nam 701 Không xác định 24
Phát biểuBa Lan_MA_16Tiếng Ba LanTiếng Ba Lanpl_PL16 kHzÂm thanh phương tiện269Âm thanh truyền thông Ba LanCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 173 Nam 354 Không biết 6
Phát biểuOriya_MAOriyaOriya (Trong đường ống) hoặc_INÂm thanh phương tiện40Oriya (Trong đường ống) Dữ liệu âm thanh đa phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuOriya_GCOriyaOriya (Trong đường ống) hoặc_INCuộc trò chuyện chung100Oriya (Trong đường ống) Dữ liệu hội thoại chungCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuOriya_CC_8OriyaOriya (Trong đường ống) hoặc_INTrung tâm cuộc gọi60Oriya (Trong đường ống) Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuNew Zealand_MA_16Tiếng Anh ở New Zealand Tiếng Anh ở New Zealand vi_NZ16 kHzÂm thanh phương tiện400Âm thanh truyền thông tiếng Anh New ZealandCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 367, nam 678, Không rõ 26
Phát biểuNew Zealand_GC_8Tiếng Anh ở New Zealand Tiếng Anh ở New Zealand vi_NZ8 kHzCuộc trò chuyện chung148Dữ liệu đàm thoại tiếng Anh tổng quát của New ZealandCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 167, nam 121, Không rõ 4
Phát biểuNew York Tiếng Anh_MA_16Tiếng Anh ở New YorkTiếng Anh ở New Yorken_US16 kHzÂm thanh phương tiện140Dữ liệu âm thanh New York English MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 66, Nam 230, Không rõ 11
Phát biểuScotland_GC_8Scotland (Giọng Anh)Scotland (Giọng Anh)vi_AB8 kHzCuộc trò chuyện chung292Dữ liệu hội thoại chung ScotlandCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 285 , Nam 260, Không biết 3
Phát biểuNew York Tiếng Anh_CC_8Tiếng Anh ở New YorkTiếng Anh ở New Yorken_US8 kHzTrung tâm cuộc gọi103Dữ liệu trung tâm cuộc gọi tiếng Anh New YorkCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 610, Nam 532, Không biết 0
Phát biểuHà Lan_SM_48Tiếng Hà LanTiếng Hà Lannl-NL48 kHzĐộc thoại theo kịch bản1,205Độc thoại theo kịch bản tiếng Hà LanCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1285 Nam 531 Không xác định 3
Phát biểuMexico_SM_48Tiếng Tây Ban Nha (Mexico)Tiếng Tây Ban Nha (Mexico)es-MX48 kHzĐộc thoại theo kịch bản1,492Độc thoại theo kịch bản tiếng Tây Ban Nha MexicoCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1016 Nam 1069 Không xác định 95
Phát biểuTiếng Marathi_MAMarathiMarathi (Trong đường ống) ông_INÂm thanh phương tiện40Marathi (Trong đường ống) Dữ liệu âm thanh đa phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Marathi_GCMarathiMarathi (Trong đường ống) ông_INCuộc trò chuyện chung100Marathi (Trong đường ống) Dữ liệu hội thoại chungCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Marathi_CC_8MarathiMarathi (Trong đường ống) ông_INTrung tâm cuộc gọi60Marathi (Trong đường ống) Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMalayalam_MAMalayalamMalayalam (Trong đường ống) ml_INÂm thanh phương tiện40Dữ liệu âm thanh phương tiện truyền thông Malayalam (Trong đường ống)Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMalayalam_GCMalayalamMalayalam (Trong đường ống) ml_INCuộc trò chuyện chung100Malayalam (Trong đường ống) Dữ liệu hội thoại chungCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Malayalam_CC_8MalayalamMalayalam (Trong đường ống) ml_INTrung tâm cuộc gọi60Dữ liệu Trung tâm cuộc gọi Malayalam (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutiếng Mã Lai_MA_16Người MalayNgười Malayms_MY16 kHzÂm thanh phương tiện344Dữ liệu âm thanh Malay MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 236, Nam 626, Không rõ 47
Phát biểuMã Lai_GC_8Người MalayNgười Malayms_MY8 kHzCuộc trò chuyện chung266Dữ liệu hội thoại chung tiếng MalayCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Malay ở MalaysiaHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 316, Nam 176 , Không rõ 0
Phát biểuTiếng Telugu_GC_8telugutelugute_IN8 kHzCuộc trò chuyện chung553Dữ liệu hội thoại chung TeluguCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 574 , Nam 564, Không xác định 0
Phát biểuAnh Anh_WW_16Anh AnhAnh Anhen_uk16 kHzThức tỉnhLoa 200Wake Word Vương quốc Anhthu thập dữ liệu từ khóa
  • loa 200
  • 4 cụm từ khóa duy nhất cho mỗi người nói
  • 25-30 bản ghi cụm từ khóa lặp lại cho mỗi cụm từ khóa duy nhất
  • 25-30 tệp âm thanh cho mỗi cụm từ khóa duy nhất
  • Tổng số 120 phát biểu được ghi lại cho mỗi người nói
kênh 1Điện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữGiới tính: 50% nam, 50% nữ, +/-10%.
Phát biểutiếng Wales_GC_8Tiếng Wales (Giọng Anh)Tiếng Wales (Giọng Anh)vi_WL8 kHzCuộc trò chuyện chung278Dữ liệu hội thoại chung tiếng WalesCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 270, Nam 324, Không rõ 0
Phát biểuTiếng Việt_MA_16Tiếng ViệtTiếng Việtvi_VN16 kHzÂm thanh phương tiện257Dữ liệu âm thanh Media Việt NamCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 249, nam 200, Ẩn số 45
Phát biểuTiếng Việt_GC_8Tiếng ViệtTiếng Việtvi_VN8 kHzCuộc trò chuyện chung295Dữ liệu Hội thoại chung tiếng ViệtCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút, miền Bắc (ví dụ: Hà Nội), miền Trung và miền Nam (ví dụ: Thành phố Hồ Chí Minh).HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 400, nam 380, Ẩn số 2
Phát biểuThổ Nhĩ Kỳ Thổ Nhĩ Kỳ_SM_48Thổ Nhĩ Kỳ Thổ Nhĩ KỳThổ Nhĩ Kỳ Thổ Nhĩ Kỳtr-TR48 kHzĐộc thoại theo kịch bản2,027Thổ Nhĩ Kỳ Thổ Nhĩ KỳCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1561 Nam 1241 Không xác định 31
Phát biểutiếng Thái_MA_8Tiếng TháiTiếng Tháith_TH16 kHzÂm thanh phương tiện173Âm thanh truyền thông Thái LanCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 143, Nam 502, Không rõ 26
Phát biểutiếng Thái_GC_8Tiếng TháiTiếng Tháith_TH8 kHzCuộc trò chuyện chung183Hội thoại tiếng Thái tổng hợpCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, Đăng ký không chính thức được sử dụng giữa bạn bèHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 338, Nam 96, Không rõ 8
Phát biểuTiếng Telugu_MAteluguTelugu (Trong đường ống) te_INÂm thanh phương tiện20Telugu (Trong đường ống) Dữ liệu âm thanh đa phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Telugu_GCteluguTelugu (Trong đường ống) te_INCuộc trò chuyện chung50Telugu (Trong đường ống) Dữ liệu hội thoại chungCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Telugu_CC_8teluguTelugu (Trong đường ống) te_INTrung tâm cuộc gọi30Telugu (Trong đường ống) Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Telugu_MA_16telugutelugute_IN16 kHzÂm thanh phương tiện648Dữ liệu âm thanh Telugu MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 207, Nam 963, Không rõ 2
Phát biểuHàn Quốc_SM_48Tiếng HànTiếng Hànko-KR48 kHzĐộc thoại theo kịch bản1,955Độc thoại theo kịch bản tiếng HànCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1195 Nam 1134 Không xác định 122
Phát biểuTamil_MAtamil Tiếng Tamil (Trong đường ống) ta_INÂm thanh phương tiện40Dữ liệu âm thanh phương tiện Tamil (Trong đường ống)Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTamil_GCtamilTiếng Tamil (Trong đường ống) ta_INCuộc trò chuyện chung100Dữ liệu hội thoại chung tiếng Tamil (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTamil_CC_8tamilTiếng Tamil (Trong đường ống) ta_INTrung tâm cuộc gọi60Dữ liệu Trung tâm cuộc gọi Tamil (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutiếng Thụy Điển_MA_16Tiếng Thụy ĐiểnTiếng Thụy Điểnsv_SE16 kHzÂm thanh phương tiện278Dữ liệu âm thanh của Truyền thông Thụy ĐiểnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 195, nam 500, Không rõ 21
Phát biểuThụy Điển_CC_8Tiếng Thụy ĐiểnTiếng Thụy Điểnsv_SE8 kHzTrung tâm cuộc gọi250Dữ liệu Call-Center của Thụy ĐiểnCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1581, nam 727, Không rõ 2
Phát biểuTiếng Swahili_MA_16SwahiliSwahilisw_KE16 kHzÂm thanh phương tiện265Dữ liệu âm thanh Swahili MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 118, Nam 493, Không rõ 25
Phát biểutiếng Swahili_CC_8SwahiliSwahilisw_KE8 kHzTrung tâm cuộc gọi230Dữ liệu trung tâm cuộc gọi tiếng SwahiliCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 611, Nam 833, Không rõ 0
Phát biểuTiếng Anh Nam Phi_MA_16Tiếng Anh Nam PhiTiếng Anh Nam Phivi_ZA16 kHzÂm thanh phương tiện251Dữ liệu âm thanh phương tiện tiếng Anh Nam PhiCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 235, Nam 432, Không rõ 36
Phát biểuTiếng Anh Nam Phi_CC_8Tiếng Anh Nam PhiTiếng Anh Nam Phivi_ZA8 kHzTrung tâm cuộc gọi261Dữ liệu tổng đài tiếng Anh Nam PhiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1274 , Nam 935 , Không biết 1
Phát biểuSingapore_MA_16Singapore tiếng AnhSingapore tiếng Anhvi_SG16 kHzÂm thanh phương tiện247Dữ liệu âm thanh phương tiện truyền thông SingaporeCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 160, Nam 455, Không rõ 37
Phát biểuSingapore_CC_8Singapore tiếng AnhSingapore tiếng Anhvi_SG8 kHzTrung tâm cuộc gọi218Dữ liệu tổng đài SingaporeCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 2139 , Nam 884, Không xác định 21
Phát biểuBoston_CC_8Anh ngữ BostonAnh ngữ Bostonen_US8 kHzTrung tâm cuộc gọi177Dữ liệu trung tâm cuộc gọi BostonCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 605, Nam: 711, và Không xác định: 0
Phát biểuTiếng Anh Deep South_CC_8Tiếng Anh Deep SouthTiếng Anh Deep Southen_US8 kHzTrung tâm cuộc gọi151Tiếng Anh Deep South Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 221 , Nam 1004 , Không rõ 7
Phát biểuĐan Mạch_SM_48Tiếng Đan MạchTiếng Đan Mạchda-DK48 kHzĐộc thoại theo kịch bản2,579Độc thoại theo kịch bản Đan MạchCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây, tiếng Đan Mạch từ Đan MạchMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1551 Nam 1233 Không xác định 42
Phát biểutiếng Đan Mạch_MA_16Tiếng Đan MạchTiếng Đan Mạchda_DK16 kHzÂm thanh phương tiện664Dữ liệu âm thanh Media của Đan MạchCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 369, Nam: 864, Không xác định: 27
Phát biểuĐan Mạch_GC_8Tiếng Đan MạchTiếng Đan Mạchda_DK8 kHzCuộc trò chuyện chung372Dữ liệu đàm thoại chung của Đan MạchCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 311, Nam: 417, Không xác định: 0
Phát biểuTiếng Trung phồn thể_SM_48Trung Quốc truyền thốngTrung Quốc truyền thốngzh-TW48 kHzĐộc thoại theo kịch bản1,028Trung Quốc truyền thốngCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1069 Nam 262 Không xác định 3
Phát biểuTiếng Trung Giản Thể_SM_48Trung Quốc giản thể (Chinese Simplified)Trung Quốc giản thể (Chinese Simplified)zh-CN48 kHzĐộc thoại theo kịch bản2,762Trung Quốc giản thể (Chinese Simplified)Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1920 Nam 1535 Không xác định 270
Phát biểuTiếng Trung_MA_16Tiếng anh trung quốcTiếng anh trung quốcen_US16 kHzÂm thanh phương tiện249Dữ liệu âm thanh phương tiện truyền thông Trung QuốcCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 126, Nam: 346 và Không xác định: 6
Phát biểuTiếng Trung_CC_8Tiếng anh trung quốcTiếng anh trung quốcen_US8 kHzTrung tâm cuộc gọi169Dữ liệu trung tâm cuộc gọi Trung QuốcCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 1790, Nam: 523 và Không xác định: 13
Phát biểuCanada_SM_48Canada tiếng PhápCanada tiếng Phápfr-CA48 kHzĐộc thoại theo kịch bản1,222Canada tiếng PhápCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 974 Nam 631 Không xác định 1
Phát biểuBoston_MA_16Anh ngữ BostonAnh ngữ Bostonen_US16 kHzÂm thanh phương tiện93Dữ liệu âm thanh Boston MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 43, Nam: 181, và Không xác định: 2
Phát biểuBoston_GC_8Anh ngữ BostonAnh ngữ Bostonen_US8 kHzCuộc trò chuyện chung32Dữ liệu hội thoại chung BostonCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 53, Nam: 83, và Không xác định: 0
Phát biểuTiếng Anh Deep South_GC_8Tiếng Anh Deep SouthTiếng Anh Deep Southen_US8 kHzCuộc trò chuyện chung56Dữ liệu hội thoại chung tiếng Anh Deep SouthCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 99, Nam 31, Không rõ 0
Phát biểuTiếng Bengal_MAtiếng BengaliTiếng Bengali (Trong đường ống) bn_INÂm thanh phương tiện40Tiếng Bengali (Trong đường ống) Dữ liệu âm thanh đa phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Bengal_GCtiếng BengaliTiếng Bengali (Trong đường ống) bn_INCuộc trò chuyện chung100Dữ liệu hội thoại chung bằng tiếng Bengali (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Bengal_CC_8tiếng BengaliTiếng Bengali (Trong đường ống) bn_INTrung tâm cuộc gọi60Dữ liệu trung tâm cuộc gọi tiếng Bengali (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Assam_MAAssameseTiếng Assam (Trong đường ống) như_INÂm thanh phương tiện40Dữ liệu âm thanh phương tiện truyền thông tiếng Assam (Trong đường ống)Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Assam_GCAssameseTiếng Assam (Trong đường ống) như_INCuộc trò chuyện chung100Dữ liệu hội thoại chung tiếng Assam (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Assam_CC_8AssameseTiếng Assam (Trong đường ống) như_INTrung tâm cuộc gọi60Dữ liệu Trung tâm cuộc gọi của Assamese (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Ả Rập_SM_48Tiếng Ả RậpTiếng Ả Rậpar-SA48 kHzĐộc thoại theo kịch bản1,947Độc thoại theo kịch bản tiếng Ả RậpCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 838 Nam 1209 Không xác định 78
Phát biểutiếng ả rập_GC_8Tiếng Ả RậpTiếng Ả Rậpar_AE8 kHzCuộc trò chuyện chung292Dữ liệu Hội thoại chung tiếng Ả RậpCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Ả Rập từ các nước vùng VịnhHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 171, Nam: 534, và Không xác định: 1
Phát biểuTiếng Nam Phi_MA_16AfrikaansAfrikaansaf_ZA16 kHzÂm thanh phương tiện658Tệp phương tiện tiếng AfrikaansCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 750, Nam: 1278, và Không xác định: 52
Phát biểuTiếng Nam Phi_GC_8AfrikaansAfrikaansaf_ZA8 kHzCuộc trò chuyện chung368Dữ liệu hội thoại chung tiếng AfrikaansCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, nói tiếng Afrikaans ở Châu PhiHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 502, Nam: 390, và Không xác định: 2
Phát biểuvi_US_MA_16Người Mỹ gốc PhiNgười Mỹ gốc Phien_US16 kHzÂm thanh phương tiện154Dữ liệu truyền thông bản ngữ người Mỹ gốc PhiCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 151, Nam: 150, và Không xác định: 10
Phát biểuHINGLISH_MA_16Bản lềBản lềhg_IN16 kHzÂm thanh phương tiện216Dữ liệu âm thanh phương tiện HINGLISHCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 75, Nam 380, Không rõ 0
Phát biểuTiếng Hàn_MA_16Tiếng HànTiếng Hànko_KR16 kHzÂm thanh phương tiện204Dữ liệu âm thanh truyền thông Hàn QuốcCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 70 Nam 303, Không rõ 25
Phát biểuTiếng Hàn_CC_8Tiếng HànTiếng Hànko_KR8 kHzTrung tâm cuộc gọi107Dữ liệu tổng đài Hàn QuốcCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1086, Nam 210 , Không rõ 4
Phát biểuTiếng Kannada_MAkannadaKannada (Trong đường ống) kn_INÂm thanh phương tiện40Kannada (Trong đường ống) Dữ liệu âm thanh đa phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Kannada_GCkannadaKannada (Trong đường ống) kn_INCuộc trò chuyện chung100Dữ liệu hội thoại chung tiếng Kannada (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Kannada_CC_8kannadaKannada (Trong đường ống) kn_INTrung tâm cuộc gọi60Kannada (Trong đường ống) Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Nhật_SM_48Tiếng NhậtTiếng Nhậtja-JP48 kHzĐộc thoại theo kịch bản2,335Độc thoại theo kịch bản tiếng NhậtCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1460 Nam 1221 Không xác định 194
Phát biểuAilen_GC_8IrelandIrelandvi_IE8 kHzCuộc trò chuyện chung192Dữ liệu hội thoại chung tiếng IrelandCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 213 , Nam 153 , Không biết 0
Phát biểuTiếng Indonesia_MA_16Tiếng IndonesiaTiếng Indonesiatôi đã làm16 kHzÂm thanh phương tiện643Dữ liệu âm thanh Truyền thông IndonesiaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 746, Nam 1507, Không rõ 129
Phát biểuIndonesia_GC_8Tiếng IndonesiaTiếng Indonesiatôi đã làm8 kHzCuộc trò chuyện chung496Dữ liệu Hội thoại chung IndonesiaCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Bahasa IndonesiaHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 524, Nam 454, Không rõ 2
Phát biểuTây Ban Nha_MA_16Tiếng Anh gốc Tây Ban NhaTiếng Anh gốc Tây Ban Nhaen_US16 kHzÂm thanh phương tiện155Âm thanh phương tiện cuộc gọi Tây Ban NhaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 140, Nam 219, Không rõ 5
Phát biểuTây Ban Nha_CC_8Tiếng Anh gốc Tây Ban NhaTiếng Anh gốc Tây Ban Nhaen_US8 kHzTrung tâm cuộc gọi212Dữ liệu trung tâm cuộc gọi Tây Ban NhaCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 822, Nam 1262, Không rõ 0
Phát biểuvi_US_CC_8Người Mỹ gốc PhiNgười Mỹ gốc Phien_US8 kHzTrung tâm cuộc gọi211Dữ liệu trung tâm cuộc gọi bản ngữ người Mỹ gốc PhiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ: 612, Nam: 1242, và Không xác định: 12
Phát biểuHINGLISH_CC_8Bản lềBản lềhg_IN8 kHzTrung tâm cuộc gọi208HINGLISH Dữ liệu trung tâm cuộc gọiCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 822, Nam 1262 , Không xác định 0
Phát biểuTiếng Hindi_SM_48Tiếng Hin-ddiTiếng Hin-ddihi-IN48 kHzĐộc thoại theo kịch bản2,867Độc thoại theo kịch bản tiếng HindiCác bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 1977 Nam 1864 Không xác định 147
Phát biểuTiếng Hin-ddi_MA_16Tiếng Hin-ddiTiếng Hin-ddichào_IN16 kHzÂm thanh phương tiện219Dữ liệu âm thanh Hindi MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 83 , Nam 309, Không biết 0
Phát biểutiếng Do Thái_MA_16HebrewHebrewanh_IL16 kHzÂm thanh phương tiện427Dữ liệu âm thanh tiếng Do Thái MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 361 , Nam 513, Không biết 13
Phát biểuTiếng Do Thái_Hội thoại chung_8HebrewHebrewanh_IL8 kHzCuộc trò chuyện chung399Dữ liệu Hội thoại chung tiếng Do TháiCuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Do Thái ở IsraelHaiMáy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 414 , Nam 399 , Không xác định 1
Phát biểuGujarati_MAtiếng gujaratGujarati (Trong đường ống) gu_INÂm thanh phương tiện40Gujarati (Trong đường ống) Dữ liệu âm thanh phương tiệnCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuGujarati_GCtiếng gujaratGujarati (Trong đường ống) gu_INCuộc trò chuyện chung100Gujarati (Trong đường ống) Dữ liệu hội thoại chungCuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuGujarati_CC_8tiếng gujaratGujarati (Trong đường ống) gu_INTrung tâm cuộc gọi60Dữ liệu Trung tâm cuộc gọi Gujarati (Trong đường ống)Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,Máy tính để bàn5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutiếng Đức_IVR_8Tiếng ĐứcTiếng Đứcde-de8 kHz IVR200Dữ liệu IVR của ĐứcCon người đến Máy móc. Một loại luồng IVR trong đó có lời nhắc TTS (ví dụ: “Tôi có thể giúp gì cho bạn”) theo sau là phản hồi tự phát của con ngườiMonoMáy tính để bàn. Wav .jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ Nữ 10115 Nam 8750 Không xác định 0
Phát biểutiếng Đức_CC_8Tiếng ĐứcTiếng Đứcde-de8 kHzTrung tâm cuộc gọi64Dữ liệu trung tâm cuộc gọi của Đức Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,MonoMáy tính để bàn. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 478 Nam 1440 Không biết 0
Phát biểuTiếng Anh Deep South_MA_16Tiếng Anh Deep SouthTiếng Anh Deep Southen_US16 kHzÂm thanh phương tiện266Tiếng Anh Dữ liệu âm thanh Deep South MediaCác tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoTìm nguồn cung ứng web5.0. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữNữ 204, Nam 356, Không rõ 21

Các dịch vụ được cung cấp

Thu thập dữ liệu âm thanh chuyên nghiệp không phải là tất cả mọi thứ để thiết lập AI toàn diện. Tại Shaip, bạn thậm chí có thể xem xét các dịch vụ sau để làm cho các mô hình trở nên phổ biến hơn bình thường:

Thu thập dữ liệu văn bản

Thu thập dữ liệu văn bản
DỊCH VỤ

Giá trị thực sự của các dịch vụ thu thập dữ liệu nhận thức của Shaip là nó cung cấp cho các tổ chức chìa khóa để mở khóa thông tin quan trọng được tìm thấy trong dữ liệu phi cấu trúc

Thu thập dữ liệu hình ảnh

Dịch vụ thu thập dữ liệu hình ảnh

Đảm bảo rằng mô hình thị giác máy tính của bạn xác định chính xác mọi hình ảnh, để đào tạo liền mạch các mô hình AI thế hệ tiếp theo của tương lai

Thu thập dữ liệu video

Dịch vụ thu thập dữ liệu video

Bây giờ hãy tập trung vào thị giác máy tính cùng với NLP để đào tạo mô hình của bạn để xác định các đối tượng, cá nhân, vật cản và các yếu tố hình ảnh khác để hoàn thiện

Shaip liên hệ với chúng tôi

Bạn muốn xây dựng tập dữ liệu âm thanh của riêng mình?

Kết nối với chuyên gia thu thập dữ liệu giọng nói nội bộ của chúng tôi để thiết lập kho lưu trữ âm thanh phù hợp nhất với yêu cầu của bạn

  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo vệ thông tin cá nhân của người tiêu dùngCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.

Thu thập dữ liệu giọng nói cho Mô hình ML đề cập đến quá trình thu thập bản ghi âm của ngôn ngữ nói. Bộ sưu tập này hỗ trợ đào tạo và tinh chỉnh các thuật toán học máy, đặc biệt là các thuật toán tập trung vào việc hiểu và xử lý giọng nói của con người.

Khi muốn thu thập dữ liệu âm thanh cho Nhận dạng giọng nói tự động (ASR), bạn nên bắt đầu bằng cách xác định nhu cầu cụ thể của dự án, bao gồm ngôn ngữ, giọng nói và loại giọng nói mong muốn. Sau khi thiết lập các tham số này, hãy đảm bảo bạn có được tất cả các quyền cần thiết để tôn trọng quyền riêng tư của người dùng. Sau đó, sử dụng thiết bị hoặc phần mềm ghi âm thích hợp để ghi lại các mẫu âm thanh rõ ràng. Mỗi bản ghi phải được chú thích tỉ mỉ bằng bản ghi âm hoặc siêu dữ liệu thích hợp khác và được lưu trữ một cách có hệ thống để dễ dàng truy cập.

Tập dữ liệu giọng nói trong học máy có vai trò then chốt trong việc đào tạo, thử nghiệm và xác thực các mô hình được điều chỉnh để nhận dạng, phiên âm hoặc diễn giải ngôn ngữ nói. Những bộ dữ liệu như vậy mở đường cho vô số ứng dụng, từ trợ lý giọng nói và dịch vụ phiên âm đến sinh trắc học giọng nói.

Để thu thập dữ liệu chính xác từ các ngôn ngữ và giọng điệu đa dạng, việc cộng tác với người bản ngữ có nền tảng ngôn ngữ mong muốn là rất quan trọng. Hãy nhắm đến một mẫu đa dạng và mang tính đại diện để bao quát nhiều sắc thái nhân khẩu học. Sử dụng thiết bị ghi âm được tiêu chuẩn hóa trong môi trường đồng nhất để đảm bảo tính nhất quán của âm thanh. Và quan trọng là chú thích từng phần dữ liệu bằng bản ghi và siêu dữ liệu chi tiết, biểu thị ngôn ngữ và giọng nói cụ thể.