Kết quả 11 đến 15 của 15
-
03-12-2009, 08:14 AM #11
Cho Tôi hỏi chút: Phần mềm này có làm việc tốt với tiếng Việt (có dấu) không bạn?. Tôi toàn "mổ cò" nên rất thích nhưng thấy có mấy cái không làm việc được với chử có dấu, Tôi đoán:
- Hoặc là nó không làm việc tốt với tiếng có dấu
- Hoặc là tôi chưa biết cách sử dụng (tôi kém vi tính lắm)
Bạn nào biết cách hướng dẫn tôi với. CHÂN THÀNH CẢM ƠN MỌI SỰ GIÚP ĐỠ CỦA CÁC BẠN. CHÀO
-
03-12-2009, 08:36 PM #12
Tôi xin góp ý với các bạn về vấn đề chuyển đổi hoặc nhân dạng văn bản.
-trước tiên chúng ta cần phân biệt rõ thế nào là văn bản(có định dạng text,doc,docx,rft....) và file hình(bản scan hoặc file hinh chụp từ máy KTS, cả 2 đều là file hinh, tuy có thể khác nhau về định dạng jpg, bitmap,tiff, png,raw....)
-File pdf thông thường có 2 loại
1)loại được tạo ra từ các file văn bản, chúng ta có thể copy chữ và hình thủ công rồi dán qua word, hoặc dùng phần mềm để convert qua word rồi chỉnh sửa.có rất nhiều phần mềm làm việc này từ có phí hoặc miễn phí, hoặc dạng portable, tuy nhiên với tiếng việt có dấu thì tỉ lệ đạt thấp, vì sẽ bị lỗi font, định dạng.....đòi hỏi chúng ta fải có 1 số kiến thức nhất định về nhiều lĩnh vực liên quan.
2) Loại được tạo ra từ các file hình ảnh(image) bao gồm file được quét vào bằng máy scanner và chụp từ máy ảnh KTS, cả 2 đều là 1.với loại này chúng ta cần phải có 1 phần mềm chuyên dụng để nhận dạng chữ từ những file hình ảnh.
như vậy khi đã fân biệt rõ ràng như vậy các bạn sẽ dễ dàng trong công việc của mình hơn.
-về loại file pdf làm từ văn bản, có rất nhiều fần mềm để convert sang word để chỉnh sửa nhưng đa số rất tốt với tiếng anh, nhưng với tiếng việt thì tỉ lệ lỗi rất cao, công sửa rất nặng, ví dụ như adobe reader,PDF zilla,PDF tiger, nitro.....,solid.....,able Extract v.v.....
-về nhận dạng chữ trong file pdf từ dạng scan hoặc hình chụp từ máy KTS cũng có rất nhiều phần mềm nhưng hầu như không hổ trợ tiếng tiếng việt hoặc rất ít, còn với tiếng tàu thì bó tay ngoài phần mềm COCR.2mà tôi đã giới thiệu,
nếu là tiếng việt thì các bạn nên dùng VNDOCR 4.0, các bạn tải về và nghiên cứu thử theo link sau:
Nhận dạng chữ.rar-28mb
nhan dang chu.rar dang chu.rar
HDSD VNDOCR 4.0-pdf-745kb
HDSD_VNDOCR_4.pdf
- ngaòi ra còn có 1 số trang web cho phép chúng ta chuyển đổi, trích xuất trực tuyến tuy nhiên cũng chưa hổ trợ tiếng việt bao nhiêu. xin góp chút ý kiến để các bạn cùng tham khảo nhằm cho công việc dịch thuật sách được lẹ làng hơn, chào thân ái
-
03-12-2009, 11:01 PM #13
Bac DucKhai2691 nói hết cả rồi, giờ mình có ý kiến chuyển sang phương pháp thủ công, hơi vất vả. Tuy nhiên nếu bạn có 1 nhóm bạn cùng làm sách, thì nên chia sách ra từng phần nhỏ rồi làm thì đỡ mệt hơn nhiều. Nếu sách mỏng mỏng thì bạn cứ chụp ảnh rồi gửi mình
mình vừa làm vừa sửa vừa học luôn.
Chào các bạn mới, chào những người cũ ! Mình trở lại sau gần 2 năm vắng mặt!
Nói không với ngôn ngữ chát !
-
06-12-2009, 11:32 AM #14Buồn buồn chơi cờ tướng giải khuây...
Ai ngờ mê thật... buồn ơi là buồn !!!
Lòng tin là tin vào những điều không nhìn thấy... phần thưởng của nó là kết quả nhìn thấy được của cái mà bạn đã tin vào
-
07-01-2010, 12:34 PM #15
Hehe he!
Em tưởng các bác muốn gì!
Chuyển đổi ảnh sang text chớ gì? Dễ ẹt! Các bác vào trang Số hóa - Trang chủ nhé. Trang này cho phép chuyển đổi tất các các tài liệu dạng ảnh JPEG, TIFF, PDF, PNG PMP... sang văn bản dạng text - trực tiếp trên internet.
Hệ thống này xử lý hầu hết tất cả các loại ngôn ngữ, tiếng Việt là cực ngon vì họ sử dụng công nghệ nhận dạng của hãng ABBYY - Nga, hãng số 1 thế giới trong ngành nhận dạng.(Cái này chắc ăn đứt cái Vndocr 4.0 của anh Duckhai mất).
Vào thử nhé: Số hóa - Trang chủ, đăng kí tài khoản và đăng nhập, sau đó chỉ việc upload ảnh lên và chờ nhận kết quả, quá đơn giản và nhè nhàng.
Mà hình như bây giờ họ vẫn đang cho dùng thử miễn phí hay sao ấy, mỗi người được 100 trang, nhanh chân lên kẻo hết hàng đấy!
Em dùng thử thấy đỉnh lắm, độ chính xác tới 99%, tiếng gì cũng chuyển đổi được, mà em cũng ko mất sửa lại tài liệu gì cả vì kết quả giống i xì đúc với tài liệu gốc, quá ngon!
Công ty này họ cũng bán cả phần mềm nhận dạng nữa đấy, bác nào muốn số hóa cả kho sách thì tham khảo luôn nhé.
Have a nice day!
Và đừng quên cảm ơn tui nhé!
chuyển đổi file ảnh sang file word
Đánh dấu