Nếu sách ở dạng scan thì khó chuyển qua text lắm vì phần mềm nhận dạng chủ yếu nhận được 1 số loại font chính thôi, mà chữ Tàu thì nhiều loại font quá ko làm nổi đâu.
Printable View
có vẻ hay đấy
hi,
các bro dùng thử phần mềm này xem (có thể convert file .pdf dạng scan sang word ở dạng text)
Able2Extract Professional:
link download: Able2Extract Professional version 6.0Trích dẫn:
Get quick, accurate, transfer of native and image (scanned) PDFs into editable MS Word and formatted MS Excel spreadsheets for editing, analysis and other reversioning. Other conversions include PDF to PowerPoint (PPT), PDF to AutoCad (DWG & DXF), HTML and Text.
(có thể font tiếng Trung khó hiển thị được, các bro thử cài thêm bộ font tiếng Trung ???, nên cài bộ full cho đủ font... nhưng ko sure có good ko ??? )
ngoài Able2Extract Professional, có thể sử dụng soft Able2Doc
link download: Able2Doc
mình nghĩ chúng ta nên tạo một chủ đề chuyên về dịch thuật sách cờ tướng tiếng trung để mọi người cùng gắng sức. thanglongkydao sẽ có thêm nhiều những cuối sách hay qua chủ đề này mọi người thấy thế nào. về phần mình thời gian dỗi nhiều có việc làm cảm thấy cũng rất hay
Các bạn đang hình thành một ý tưởng tuyệt vời đó. Mong ý tưởng đó sẽ sớm được thực hiện.Chúc các bạn thành công!
Gì cũng được , miễn là Tiểu Y copy sang dạng tẽt được thì sẽ dịch được tất tần tật <:-P<:-P<:-P
Nếu có thể thì TLKD nên lập một box dịch tiếng trung .
Tiểu Y có thể hướng dẫn cách làm ebook dạng prc , pdf hoặc chm ( đây mới đúng nghĩa là sách , là ebook . Còn các kiểu xem bằng cách click mouse di chuyển xem từng nước hoặc ấn auto xem tự động chỉ là một dạng SW , nên phân biệt lưu ý )
Góp ý thêm : xem ebook định dạng chm rất tiện lợi , không rườm rà như pdf , có thể xem là một trang web ofice.
Mọi người nói rất đúng bây giờ mấu chốt người nào đó trên diễn đàn chuyển sang định dạng text để mọi người cùng dịch và up lên thường xuyên là hợp lý nhất
tôi xin giới thiệu với các bạn phần mềm nhận dạng tiếng hoa từ các bãn scan ,tôi đã thử và thấy cũng tương đối tốt, tuy hơi lâu . lại miễn phí, có khả năng nhận dạng khỏang 10000 chữ Hoa (giản, phồn thể), độ chính xác có thể đạt 99% hay hơn nữa tùy theo chất lượng ảnh scan.
Do chưa phải phần mềm thương mại, còn mang tính thử nghiệm nên việc sử dụng chưa có mức độ tự động cao : chỉ nhận dạng riêng biệt từng chữ một.
Link tải : COCR2 : A Small Experimental Chinese OCR.
bạn vào trang trên để tải và có mục tutorial hướng dẫn sử dụng. chúc các bạn thử nghiệm thành công