tôi xin giới thiệu với các bạn phần mềm nhận dạng tiếng hoa từ các bãn scan ,tôi đã thử và thấy cũng tương đối tốt, tuy hơi lâu . lại miễn phí, có khả năng nhận dạng khỏang 10000 chữ Hoa (giản, phồn thể), độ chính xác có thể đạt 99% hay hơn nữa tùy theo chất lượng ảnh scan.

Do chưa phải phần mềm thương mại, còn mang tính thử nghiệm nên việc sử dụng chưa có mức độ tự động cao : chỉ nhận dạng riêng biệt từng chữ một.

Link tải : COCR2 : A Small Experimental Chinese OCR.
bạn vào trang trên để tải và có mục tutorial hướng dẫn sử dụng. chúc các bạn thử nghiệm thành công