Mô hình VietOCR có tính tổng quát cực tốt, thậm chí có độ chính xác khá cao trên một bộ dataset mới mặc dù mô hình chưa được huấn luyện bao giờ.
Để cài đặt các bạn gõ lệnh sau
pip install vietocr
Các bạn tham khảo notebook này để biết cách sử dụng nhé.
Mô hình này được huấn luyện trên tập dữ liệu gồm 10m ảnh, bao gồm nhiều loại ảnh khác nhau như ảnh tự phát sinh, chữ viết tay, các văn bản scan thực tế. Pretrain model các bạn download tại đây.
Đồng thời mình cũng thử nghiệm kết quả của mô hình trên tập dữ liệu synth 90k mô hình transformerocr cho có độ chính xác full_sequence là 96% trong khi đó một cài đặt khá phổ biến khác dữ trên cơ chế attention cho kết quả là 93%.
Backbone | Config | Precision |
---|---|---|
VGG19-bn | download | |
VGG11-bn | download | |
Resnet50 | download | |
Resnet50-fpn | download |
Mình phát hành thư viện này dưới các điều khoản của Apache 2.0 license.
Nếu bạn có bất kì vấn đề gì, vui lòng tạo issue hoặc liên hệ mình tại [email protected]