Bộ dữ liệu ngôn ngữ Ả Rập & Thái Lan & Việt Nam & Hindi & Anh & Trung Quốc

Hộp giới hạn + Văn bản

Bộ dữ liệu ngôn ngữ Ả Rập & Thái Lan & Việt Nam & Hindi & Anh & Trung Quốc

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 150k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu ngôn ngữ Ả Rập & Thái Lan & Việt Nam & Hindi & Anh & Trung Quốc

Bộ dữ liệu văn bản tiếng Ả Rập

Hộp giới hạn + Văn bản

Bộ dữ liệu văn bản tiếng Ả Rập

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 1k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu văn bản tiếng Ả Rập chứa một bộ sưu tập các mẫu văn bản được viết bằng tiếng Ả Rập. Nó bao gồm nhiều dạng nội dung khác nhau, chẳng hạn như bài báo, bài đăng trên mạng xã hội, văn học và đối thoại, trải dài trên nhiều chủ đề và phong cách viết khác nhau. Bộ dữ liệu này được sử dụng cho các tác vụ như xử lý ngôn ngữ tự nhiên (NLP), phân loại văn bản, phân tích tình cảm và dịch máy trong các ứng dụng tiếng Ả Rập.

Bộ dữ liệu ngôn ngữ Trung Quốc & Anh & Tây Tạng & Uyghur

Hộp giới hạn + Văn bản

Bộ dữ liệu ngôn ngữ Trung Quốc & Anh & Tây Tạng & Uyghur

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 38k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu ngôn ngữ Trung Quốc & Anh & Tây Tạng & Uyghur

Bộ dữ liệu thực đơn tiếng Trung và tiếng Anh

Hộp giới hạn + Văn bản

Bộ dữ liệu thực đơn tiếng Trung và tiếng Anh

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 60k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu thực đơn tiếng Trung và tiếng Anh chứa hình ảnh hoặc mẫu văn bản của thực đơn nhà hàng có cả tiếng Trung và tiếng Anh. Nó bao gồm nhiều phông chữ, bố cục và cấu trúc thực đơn, trình bày tên món ăn song ngữ, mô tả và giá cả. Bộ dữ liệu này hữu ích cho các tác vụ như nhận dạng ký tự quang học (OCR), dịch máy và số hóa thực đơn trong các thiết lập đa ngôn ngữ.

Bộ dữ liệu sáng tác chữ viết tay của Trung Quốc

Hộp giới hạn + Văn bản

Bộ dữ liệu sáng tác chữ viết tay của Trung Quốc

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 3k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu sáng tác chữ viết tay tiếng Trung chứa các mẫu văn bản tiếng Trung viết tay, bao gồm các bài luận, bài luận và các văn bản dài khác. Nó có nhiều kiểu chữ viết tay và mức độ phức tạp khác nhau và được sử dụng cho các tác vụ như nhận dạng chữ viết tay, phân tích văn bản và đào tạo mô hình học máy.

Bộ dữ liệu nhắc nhở WIFI của Trung Quốc

Hộp giới hạn + Văn bản

Bộ dữ liệu nhắc nhở WIFI của Trung Quốc

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 1k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu nhắc nhở WIFI Trung Quốc bao gồm các mẫu văn bản được tìm thấy trong các nhắc nhở WIFI và màn hình đăng nhập được viết bằng tiếng Trung Quốc. Nó thường bao gồm nhiều nhắc nhở, hướng dẫn và thông báo lỗi liên quan đến việc kết nối hoặc quản lý mạng WIFI. Bộ dữ liệu này được sử dụng cho các tác vụ như nhận dạng văn bản, xử lý ngôn ngữ tự nhiên và cải thiện giao diện người dùng để kết nối mạng.

Bộ dữ liệu chữ viết tay tiếng Anh và tiếng Trung

Hộp giới hạn + Văn bản

Bộ dữ liệu chữ viết tay tiếng Anh và tiếng Trung

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 12k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu chữ viết tay tiếng Anh và tiếng Trung chứa các mẫu chữ viết tay bằng cả tiếng Anh và tiếng Trung, giới thiệu nhiều phong cách viết và độ phức tạp của ký tự. Bộ dữ liệu này thường được sử dụng để đào tạo và đánh giá các mô hình nhận dạng chữ viết tay, hỗ trợ phân tích văn bản đa ngôn ngữ và các nghiên cứu liên quan khác. Bộ dữ liệu bao gồm nhiều loại ký tự, chữ số, từ và câu khác nhau ở cả hai ngôn ngữ.

Bộ dữ liệu Shopsign tiếng Anh và tiếng Trung

Hộp giới hạn + Văn bản

Bộ dữ liệu Shopsign tiếng Anh và tiếng Trung

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 30k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu Shopsign tiếng Anh và tiếng Trung bao gồm hình ảnh các biển hiệu cửa hàng có cả chữ tiếng Anh và tiếng Trung. Bộ dữ liệu này ghi lại nhiều yếu tố biển báo khác nhau như tên cửa hàng, quảng cáo, khuyến mại và chỉ dẫn, được hiển thị bằng nhiều phông chữ, kiểu dáng và định dạng khác nhau. Bộ dữ liệu này được sử dụng cho các tác vụ như phát hiện và nhận dạng văn bản, hiểu bối cảnh đa ngôn ngữ và cải thiện các mô hình thị giác máy tính để diễn giải biển báo song ngữ.

Bộ dữ liệu văn bản góc đặc biệt tiếng Anh và tiếng Trung

Hộp giới hạn + Văn bản

Bộ dữ liệu văn bản góc đặc biệt tiếng Anh và tiếng Trung

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 50k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu văn bản góc đặc biệt tiếng Anh và tiếng Trung chứa hình ảnh văn bản hiển thị ở nhiều góc độ và hướng khác nhau bằng cả tiếng Anh và tiếng Trung. Bộ dữ liệu này bao gồm văn bản từ các nguồn như biển báo, quảng cáo và tài liệu không được trình bày theo định dạng ngang chuẩn. Bộ dữ liệu này được sử dụng để đào tạo và đánh giá các mô hình phát hiện và nhận dạng văn bản, đặc biệt là các mô hình có khả năng xử lý văn bản theo hướng và góc nhìn không theo truyền thống.

Bộ dữ liệu Menu tiếng Anh

Hộp giới hạn + Văn bản

Bộ dữ liệu Menu tiếng Anh

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 20k

Chú thích:

X

Sự miêu tả: English Menu Dataset bao gồm hình ảnh hoặc mẫu văn bản của thực đơn nhà hàng được viết bằng tiếng Anh. Nó có nhiều phông chữ, bố cục và kiểu định dạng, với nội dung từ tên món ăn đến mô tả và giá cả. Bộ dữ liệu này thường được sử dụng cho các tác vụ như nhận dạng ký tự quang học (OCR), trích xuất văn bản và số hóa thực đơn trong các ứng dụng liên quan đến thực phẩm.

Bộ dữ liệu văn bản cảnh tiếng Anh

Hộp giới hạn + Văn bản

Bộ dữ liệu văn bản cảnh tiếng Anh

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 33k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu văn bản cảnh tiếng Anh bao gồm các hình ảnh chứa cảnh thiên nhiên có nhúng văn bản tiếng Anh. Văn bản xuất hiện ở nhiều dạng khác nhau, chẳng hạn như biển báo, bảng quảng cáo và áp phích, thường có nhiều phông chữ, kích thước và hướng khác nhau. Bộ dữ liệu này thường được sử dụng để đào tạo và thử nghiệm các mô hình trong các nhiệm vụ phát hiện, nhận dạng và hiểu cảnh văn bản.

Tập dữ liệu văn bản viết tay

Tập dữ liệu văn bản viết tay

Ca sử dụng: Tài liệu AI

Định dạng: HEIC (hình ảnh) & .mov (video)

Đếm: 94053

Chú thích: Không

X

Sự miêu tả: Ảnh trực tiếp với văn bản viết tay cho tiếng Nhật, tiếng Hàn và tiếng Nga

Thiết bị ghi: Máy ảnh iPhone & iPad

Điều kiện ghi âm: - Ánh sáng linh hoạt / Độ chói - Đèn flash máy ảnh bật - Ánh sáng màu - Ánh sáng yếu, Không có đèn flash máy ảnh - Bình thường

Bộ dữ liệu tiếng Nhật và tiếng Hàn

Hộp giới hạn + Văn bản

Bộ dữ liệu tiếng Nhật và tiếng Hàn

Ca sử dụng: OCR

Định dạng: Hình ảnh

Đếm: 40k

Chú thích:

X

Sự miêu tả: Bộ dữ liệu ngôn ngữ Nhật Bản và Hàn Quốc bao gồm các mẫu văn bản bằng cả tiếng Nhật và tiếng Hàn. Bộ dữ liệu này có nhiều nội dung như câu, cụm từ và từ, bao gồm nhiều ngữ cảnh và phong cách khác nhau. Bộ dữ liệu này được sử dụng cho các tác vụ như xử lý ngôn ngữ tự nhiên (NLP), dịch máy và phân tích văn bản trong các ứng dụng đa ngôn ngữ.