Thu thập dữ liệu âm thanh / giọng nói tùy chỉnh cho AI thông minh

Đào tạo các mô hình NLP, VA, TTS, v.v. của bạn với dữ liệu đàm thoại chất lượng, với các dịch vụ thu thập dữ liệu âm thanh và giọng nói của chúng tôi

Thu thập dữ liệu âm thanh

Khám phá các đường ống dẫn dữ liệu âm thanh mà không bị tắc nghẽn.

Khách hàng nổi bật

Tại sao Bộ dữ liệu Luyện nói lại cần thiết cho Xử lý Ngôn ngữ Tự nhiên?

Bạn đã bao giờ nhận thấy điện thoại thông minh VA của mình, tức là Siri, Bixby hoặc bất kỳ thứ gì khác, đang tương tác chưa? Cách họ trả lời mọi câu hỏi và phân tích, trình bày kết quả theo yêu cầu của bạn!

Chà, các VA này càng khiến chúng ta tò mò, thì các chương trình và tài nguyên thông minh này cần được đào tạo dần dần để có thể phản hồi một cách chính xác nhất. Đây là lý do tại sao bạn nên cân nhắc việc thuê ngoài thu thập dữ liệu giọng nói / âm thanh và giọng nói cho các công ty thu thập dữ liệu chuyên biệt, có chuyên môn nghiệp vụ xác nhận.

Đầu tư vào thu thập dữ liệu âm thanh chuẩn bị cho NLP có mục đích của bạn để phục vụ cho khán giả đa ngôn ngữ. Không chỉ vậy, việc thu thập dữ liệu giọng nói cho NLP, và khi được xử lý bởi một chuyên gia, thậm chí còn tính đến việc thu thập tại hiện trường, phân tích ngữ nghĩa và phiên âm âm thanh. Với các giải pháp thu thập dữ liệu giọng nói chuyên nghiệp, bạn có thể:

  • Mua bộ dữ liệu âm thanh chất lượng cao để cải thiện độ chính xác
  • Nhắm mục tiêu thiết lập kịch bản đa dạng
  • Thu thập dữ liệu đào tạo AI đa ngôn ngữ
  • Quy mô mô hình ML của bạn để phù hợp với nhân khẩu học và ngành dọc đa dạng

Dịch vụ thu thập dữ liệu âm thanh / giọng nói chuyên nghiệp cho NLP

Bất kỳ môn học nào. Bất kỳ kịch bản nào.

Hệ thống NLP thông minh là bất cứ thứ gì ngoại trừ chung chung. Tùy thuộc vào chức năng của chương trình, bạn có thể phải tập trung vào các dịch vụ dữ liệu âm thanh không gian và đa ngôn ngữ, những dịch vụ này chỉ có thể được cung cấp bởi các công ty thu thập dữ liệu âm thanh / giọng nói có uy tín. Đây là lúc Shaip tham gia vào kế hoạch của mọi thứ với tư cách là một nhà cung cấp dịch vụ kết nối dữ liệu có độ tin cậy cao, tự hào trong việc thực hiện công việc nặng nhọc cho các AI được cho là thông minh của bạn.

Tại Shaip, trọng tâm chính của chúng tôi là cung cấp cho các mô hình với khối lượng mẫu giọng nói tùy chỉnh cao nhất có thể, trong thời gian ít nhất có thể. Với chúng tôi trên tàu, bạn có thể mong đợi:

Bộ sưu tập bài phát biểu
  • Thu thập dữ liệu âm thanh / giọng nói được tuyển chọn cho NLP
  • Các chương trình được thiết kế riêng đáp ứng theo các trường hợp sử dụng cụ thể
  • Chuẩn bị khai thác tập dữ liệu âm thanh
  • Xử lý dữ liệu tự động và cụ thể theo mẫu
  • Mức độ cụ thể của miền cao nhất có thể
  • Thời gian tiếp thị nhanh hơn với các mô hình AI được tăng tốc

Chuyên môn của chúng tôi

Căn chỉnh dữ liệu âm thanh để chuẩn bị mô hình NLP thông minh

Shaip cung cấp các dịch vụ thu thập dữ liệu âm thanh / giọng nói từ đầu đến cuối bằng hơn 100 ngôn ngữ để cho phép các công nghệ hỗ trợ giọng nói phục vụ cho nhiều đối tượng khác nhau trên toàn cầu. Chúng tôi có thể làm việc trên các dự án ở bất kỳ phạm vi và quy mô nào; từ cấp phép cho các tập dữ liệu âm thanh có sẵn hiện có, đến quản lý thu thập dữ liệu âm thanh tùy chỉnh, đến phiên âm và chú thích âm thanh. Bất kể dự án thu thập dữ liệu giọng nói của bạn lớn đến mức nào, chúng tôi có thể tùy chỉnh các dịch vụ thu thập âm thanh cho phù hợp với nhu cầu của bạn để xây dựng bộ dữ liệu NLP chất lượng cao nhắm mục tiêu đến phương ngữ, âm và ngôn ngữ. Chọn từ nhiều bộ dữ liệu giọng nói và tài nguyên thu thập dữ liệu âm thanh của chúng tôi, để thiết lập thông minh hỗ trợ giọng nói.

Bài phát biểu độc thoại

Bộ sưu tập lời nói độc thoại

Xử lý các yêu cầu dựa trên giọng nói liên quan đến một người nói độc lập cho nguyên mẫu Chuyển văn bản đến Tốc độ của bạn và các yêu cầu cụ thể về bản ghi bằng cách cung cấp lời nhắc theo tập lệnh, thông qua các tệp kênh đơn.

Bài phát biểu đối thoại

Bài phát biểu đối thoại
Bộ sưu tập

Thiết lập Trợ lý ảo thông minh, chatbot theo tốc độ cụ thể và các mô hình Nhận dạng giọng nói tự động với khả năng hiển thị đa ngôn ngữ thông qua các tệp kênh đôi và tài nguyên được phiên âm.

Bài phát biểu âm thanh

Dữ liệu âm thanh
Bộ sưu tập

Chúng tôi có thể ghi lại dữ liệu âm thanh chất lượng phòng thu một cách chuyên nghiệp có thể là nhà hàng, văn phòng, nhà riêng hoặc từ các môi trường và ngôn ngữ khác nhau, thông qua mạng lưới cộng tác viên toàn cầu của chúng tôi, đồng thời phủ sóng âm thanh rộng hơn

Ngôn ngữ tự nhiên Utterance

Bộ sưu tập Utterance Ngôn ngữ Tự nhiên

Đào tạo các thiết lập thương mại thông minh để xác định các cụm từ khách hàng được thốt ra khác nhau với ý nghĩa tương tự, để làm cho AI tự chủ hơn về thời gian

Trợ lý ảo kỹ thuật số

Kỹ thuật số / Ảo
Trợ lý

Tập trung vào việc xây dựng Trợ lý ảo sắp ra mắt của bạn bằng cách đào tạo các mô hình có cảnh báo về giọng nói của con người, khả năng tiếp xúc đa ngôn ngữ, phân tích theo ngữ cảnh và NLU.

Nhận dạng giọng nói tự động

Nhận dạng giọng nói tự động (ASR)

Cải thiện độ chính xác của hệ thống nhận dạng giọng nói tự động (ASR) của bạn bằng cách có quyền truy cập vào bộ dữ liệu âm thanh / giọng nói đa dạng hiện đại, từ nhiều loại nhân khẩu học.

Ngôn ngữ tự nhiên Utterance

Dữ liệu đào tạo về giọng nói / âm thanh đa ngôn ngữ

Các chuyên gia ngôn ngữ có tay nghề cao của chúng tôi trên toàn cầu, cung cấp dữ liệu đào tạo đa ngôn ngữ âm thanh / giọng nói bằng nhiều ngôn ngữ và phương ngữ bao gồm tiếng Ả Rập, tiếng Đan Mạch, tiếng Trung, tiếng Afrikaans, Singapore, New Zealand, tiếng Do Thái, tiếng Indonesia, tiếng Ireland, tiếng Hàn, tiếng Mã Lai, tiếng Ba Lan, tiếng Scotland, tiếng Thụy Điển , Tiếng Pháp, tiếng Đức, tiếng Việt, tiếng Thái, tiếng Ý, tiếng Tây Ban Nha và hơn thế nữa.

Trợ lý ảo kỹ thuật số

Text-to-Speech
(TTS)

Để mang lại trải nghiệm người dùng tốt hơn với TTS, việc phát triển một hệ thống để có âm thanh tự nhiên là rất quan trọng. Xây dựng mô hình đa ngôn ngữ chuyển văn bản thành giọng nói (TTS) với sự trợ giúp của lực lượng lao động toàn cầu của chúng tôi, những người giúp bạn thu thập dữ liệu giọng nói bằng hơn 150 ngôn ngữ và phương ngữ để nâng cao mô hình AI của bạn từ điều khiển trong ô tô đến chatbot và các giải pháp học tập với- dữ liệu âm thanh chất lượng.

Lý do chọn Shaip làm Đối tác thu thập dữ liệu giọng nói đáng tin cậy của bạn

người

người

Đội ngũ tận tâm và được đào tạo:

  • Hơn 30,000 cộng tác viên để Tạo dữ liệu, Ghi nhãn và Chất lượng
  • Nhóm quản lý dự án được chứng nhận
  • Nhóm phát triển sản phẩm có kinh nghiệm
  • Nhóm Tìm nguồn & Giới thiệu Talent Pool
Quy trình xét duyệt

Quy trình xét duyệt

Đảm bảo hiệu quả quy trình cao nhất với:

  • Quy trình cổng giai đoạn 6 Sigma mạnh mẽ
  • Đội ngũ chuyên dụng gồm 6 đai đen Sigma - Chủ sở hữu quy trình chính & Tuân thủ chất lượng
  • Cải tiến liên tục & Vòng lặp phản hồi
Nền tảng

Nền tảng

Nền tảng được cấp bằng sáng chế cung cấp các lợi ích:

  • Nền tảng end-to-end dựa trên web
  • Chất lượng hoàn hảo
  • TAT nhanh hơn
  • Giao hàng liền mạch

Ngôn ngữ: Tập dữ liệu âm thanh được thu thập

Bộ dữ liệu âm thanh / giọng nói ngoài kệ

Chi tiếtTập dữ liệu ngôn ngữTỷ lệ mẫuLoại tập dữ liệuTổng số giờ âm thanhTổng số giờ phát biểuMô tả tập dữ liệuaudio ChannelNền tảng ghi âmWER (%)Định dạng âm thanhĐịnh dạng phiên âmTrường hợp sử dụngCố vấn trưởng
Phát biểuNgười Mỹ gốc PhiNgười Mỹ gốc Phi8 kHzTrung tâm cuộc gọi214211Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuNgười Mỹ gốc PhiNgười Mỹ gốc Phi16 kHzÂm thanh phương tiện159149Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAfrikaansAfrikaans8 kHzCuộc trò chuyện chung368404Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, nói tiếng Afrikaans ở Châu PhiHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAfrikaansAfrikaans16 kHzÂm thanh phương tiện658615Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutiếng Ả Rậptiếng Ả Rập8 kHzCuộc trò chuyện chung293297Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Ả Rập từ các nước vùng VịnhHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBài năm mươi hai láBài năm mươi hai lá8 kHzTrung tâm cuộc gọi177175Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBài năm mươi hai láBài năm mươi hai lá8 kHzCuộc trò chuyện chung3232Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBài năm mươi hai láBài năm mươi hai lá16 kHzÂm thanh phương tiện9393Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng anh trung quốcTiếng anh trung quốc8 kHzTrung tâm cuộc gọi169130Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng anh trung quốcTiếng anh trung quốc16 kHzÂm thanh phương tiện249236Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Đan MạchTiếng Đan Mạch8 kHzCuộc trò chuyện chung372395Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Đan MạchTiếng Đan Mạch16 kHzÂm thanh phương tiện664603Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng AnhTiếng Anh16 kHzÂm thanh phương tiện109Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuEnglish Deep SouthEnglish Deep South8 kHzTrung tâm cuộc gọi151149Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuEnglish Deep SouthEnglish Deep South8 kHzCuộc trò chuyện chung5656Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuEnglish Deep SouthEnglish Deep South16 kHzÂm thanh phương tiện266248Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuHebrewHebrew8 kHzCuộc trò chuyện chung399397Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Do Thái ở IsraelHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuHebrewHebrew16 kHzÂm thanh phương tiện427400Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBản lềBản lề8 kHzTrung tâm cuộc gọi208185Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBản lềBản lề16 kHzÂm thanh phương tiện216219Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh gốc Tây Ban NhaTiếng Anh gốc Tây Ban Nha8 kHzTrung tâm cuộc gọi212209Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh gốc Tây Ban NhaTiếng Anh gốc Tây Ban Nha16 kHzÂm thanh phương tiện155150Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh Ấn ĐộTiếng Anh Ấn Độ16 kHzÂm thanh phương tiện13787Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng IndonesiaTiếng Indonesia8 kHzCuộc trò chuyện chung496598Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Bahasa IndonesiaHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng IndonesiaTiếng Indonesia16 kHzÂm thanh phương tiện643610Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuIrelandIreland8 kHzCuộc trò chuyện chung192180Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng HànTiếng Hàn8 kHzTrung tâm cuộc gọi107103Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng HànTiếng Hàn16 kHzÂm thanh phương tiện204197Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuNgười MalayNgười Malay8 kHzCuộc trò chuyện chung266302Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, tiếng Malay ở MalaysiaHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuNgười MalayNgười Malay16 kHzÂm thanh phương tiện344305Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh ở New Zealand Tiếng Anh ở New Zealand 8 kHzCuộc trò chuyện chung148142Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh ở New Zealand Tiếng Anh ở New Zealand 16 kHzÂm thanh phương tiện400400Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh ở New YorkTiếng Anh ở New York8 kHzTrung tâm cuộc gọi103103Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh ở New YorkTiếng Anh ở New York8 kHzCuộc trò chuyện chung107106Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh ở New YorkTiếng Anh ở New York16 kHzÂm thanh phương tiện140140Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Ba LanTiếng Ba Lan16 kHzÂm thanh phương tiện269255Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuScotlandScotland8 kHzCuộc trò chuyện chung292267Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSingapore tiếng AnhSingapore tiếng Anh8 kHzTrung tâm cuộc gọi218194Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSingapore tiếng AnhSingapore tiếng Anh16 kHzÂm thanh phương tiện247240Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh Nam PhiTiếng Anh Nam Phi8 kHzTrung tâm cuộc gọi261204Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh Nam PhiTiếng Anh Nam Phi16 kHzÂm thanh phương tiện251245Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Tây Ban NhaTiếng Tây Ban Nha16 kHzÂm thanh phương tiện32Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSwahiliSwahili8 kHzTrung tâm cuộc gọi184165Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSwahiliSwahili8 kHzTrung tâm cuộc gọi4644Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSwahiliSwahili16 kHzÂm thanh phương tiện203191Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuSwahiliSwahili16 kHzÂm thanh phương tiện6258Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Thụy ĐiểnTiếng Thụy Điển8 kHzTrung tâm cuộc gọi250224Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Thụy ĐiểnTiếng Thụy Điển16 kHzÂm thanh phương tiện278255Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutelugutelugu8 kHzCuộc trò chuyện chung553582Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutelugutelugu16 kHzÂm thanh phương tiện648599Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng TháiTiếng Thái8 kHzCuộc trò chuyện chung183201Cuộc trò chuyện qua điện thoại không lời giữa hai người. Khoảng Thời lượng âm thanh (Phạm vi) - 15-60 phút, Đăng ký không chính thức được sử dụng giữa bạn bèHaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng TháiTiếng Thái16 kHzÂm thanh phương tiện173167Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng ViệtTiếng Việt8 kHzCuộc trò chuyện chung295293Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút, miền Bắc (ví dụ: Hà Nội), miền Trung và miền Nam (ví dụ: Thành phố Hồ Chí Minh).HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng ViệtTiếng Việt16 kHzÂm thanh phương tiện257248Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuWelshWelsh8 kHzCuộc trò chuyện chung278299Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Anh Ấn ĐộTiếng Anh Ấn Độ8 kHzTrung tâm cuộc gọi200200Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,MonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutelugu telugu NATrung tâm cuộc gọi3030Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutamil tamil NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểukannada kannada NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMalayalam Malayalam NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBengali Bengali NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuGujarati Gujarati NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMarathi Marathi NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAssamese Assamese NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuOriya Oriya NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểupunjabi punjabi NATrung tâm cuộc gọi6060Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutelugu telugu NACuộc trò chuyện chung5050Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutamil tamil NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểukannada kannada NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMalayalam Malayalam NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBengali Bengali NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuGujarati Gujarati NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMarathi Marathi NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAssamese Assamese NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuOriya Oriya NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểupunjabi punjabi NACuộc trò chuyện chung100100Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,NAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutelugu telugu NAÂm thanh phương tiện2020Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutamil tamil NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểukannada kannada NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMalayalam Malayalam NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBengali Bengali NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuGujarati Gujarati NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMarathi Marathi NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAssamese Assamese NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuOriya Oriya NAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểupunjabipunjabiNAÂm thanh phương tiện4040Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútNAMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuAnh MỹAnh Mỹ48 kHzĐộc thoại theo kịch bản54Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTây ban nha tây ban nhaTây ban nha tây ban nha48 kHzĐộc thoại theo kịch bản108Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuMexicoMexico48 kHzĐộc thoại theo kịch bản1,4921,228Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuCanadaCanada48 kHzĐộc thoại theo kịch bản1,2221,049Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuNước Hà LanNước Hà Lan48 kHzĐộc thoại theo kịch bản1,2051,021Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuBa Lan Ba ​​LanBa Lan Ba ​​Lan48 kHzĐộc thoại theo kịch bản1,4821,266Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuThổ Nhĩ Kỳ Thổ Nhĩ KỳThổ Nhĩ Kỳ Thổ Nhĩ Kỳ48 kHzĐộc thoại theo kịch bản2,0271,735Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTrung Quốc truyền thốngTrung Quốc truyền thống48 kHzĐộc thoại theo kịch bản1,028891Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểutiếng Ả Rậptiếng Ả Rập48 kHzĐộc thoại theo kịch bản1,9471,594Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Đan MạchTiếng Đan Mạch48 kHzĐộc thoại theo kịch bản2,5792,041Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giây, tiếng Đan Mạch từ Đan MạchMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Hin-ddiTiếng Hin-ddi8 kHzTrung tâm cuộc gọi122131Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Hin-ddiTiếng Hin-ddi16 kHzÂm thanh phương tiện219202Các tệp âm thanh / video miền công cộng được cấp phép như phỏng vấn, podcast, v.v. - 1 đến 5 người. Khoảng Thời lượng âm thanh (Phạm vi) 15-60 phútMonoMáy tính để bàn5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng Hin-ddiTiếng Hin-ddi48 kHzĐộc thoại theo kịch bản2,8672,105Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng NhậtTiếng Nhật48 kHzĐộc thoại theo kịch bản2,3352,029Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng HànTiếng Hàn48 kHzĐộc thoại theo kịch bản1,9551,548Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng NgaTiếng Nga48 kHzĐộc thoại theo kịch bản2,3982,046Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTrung Quốc giản thể (Chinese Simplified)Trung Quốc giản thể (Chinese Simplified)48 kHzĐộc thoại theo kịch bản2,7622,181Các bản ghi âm một lời, có xu hướng rơi vào khoảng từ 5 đến 30 giâyMonoĐiện thoại di động App5. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ
Phát biểuTiếng ĐứcTiếng Đức8 kHzTrung tâm cuộc gọi640Cuộc trò chuyện điện thoại tổng hợp, không có mô tả giữa "đại lý" và "khách hàng", Thời lượng âm thanh (Phạm vi) 5-15 phút,HaiMáy tính để bàn. Wav.jsonASR, Trợ lý ảo, Chatbot, AI hội thoại, Phân tích giọng nói, TTS, Lập mô hình ngôn ngữ

Các dịch vụ được cung cấp

Thu thập dữ liệu âm thanh chuyên nghiệp không phải là tất cả mọi thứ để thiết lập AI toàn diện. Tại Shaip, bạn thậm chí có thể xem xét các dịch vụ sau để làm cho các mô hình trở nên phổ biến hơn bình thường:

Thu thập dữ liệu văn bản

Thu thập dữ liệu văn bản
Dịch vụ

Giá trị thực sự của các dịch vụ thu thập dữ liệu nhận thức của Shaip là nó cung cấp cho các tổ chức chìa khóa để mở khóa thông tin quan trọng được tìm thấy trong dữ liệu phi cấu trúc

Thu thập dữ liệu hình ảnh

Dịch vụ thu thập dữ liệu hình ảnh

Đảm bảo rằng mô hình thị giác máy tính của bạn xác định chính xác mọi hình ảnh, để đào tạo liền mạch các mô hình AI thế hệ tiếp theo của tương lai

Thu thập dữ liệu video

Dịch vụ thu thập dữ liệu video

Bây giờ hãy tập trung vào thị giác máy tính cùng với NLP để đào tạo mô hình của bạn để xác định các đối tượng, cá nhân, vật cản và các yếu tố hình ảnh khác để hoàn thiện

Shaip Liên hệ với chúng tôi

Bạn muốn xây dựng tập dữ liệu âm thanh của riêng mình?

Kết nối với chuyên gia thu thập dữ liệu giọng nói nội bộ của chúng tôi để thiết lập kho lưu trữ âm thanh phù hợp nhất với yêu cầu của bạn

  • Bằng cách đăng ký, tôi đồng ý với Shaip Chính sách bảo mậtCác Điều Khoản của Dịch Vụ và cung cấp sự đồng ý của tôi để nhận thông tin tiếp thị B2B từ Shaip.