PDA

View Full Version : chuyển đổi file ảnh sang file word



tuantute
30-11-2009, 11:49 PM
chào các Pro: mình cũng là một người hâm mộ cờ tướng do vậy mình sưu tầm được một số lượng sách về cờ tướng. một số quyển sách chưa có trong diễn đàn mình đã phải mượn máy ảnh về chụp từng trang một. nay mình muốn chuyển đổi sang file word để có thể up lên cho mọi người bổ xung vào kho tàng của thanglongkydao mong mọi người giúp đỡ tìm cho mình một phần mềm chuyển đổi cho thuận tiện nhất. Thank mọi người trước nghe

ykentdo
01-12-2009, 12:12 AM
Thành thật mà nói thì việc chuyển từ 1 file ảnh sang 1 file word là chuyện... trước giờ chưa từng xảy ra !

Bạn có thể dùng cách khác, đó là chuyển những file ảnh đó sang một định dạng nhẹ nhất (jpeg hoặc gif chẳng hạn), sau đó đánh số thứ tự từng trang, đóng gói tất cả những file đó vào trong 1 thư mục nén (zip hoặc rar), rồi up lên Free File Hosting Made Simple - MediaFire (http://www.mediafire.com) :D

boyhnhp
01-12-2009, 11:21 AM
hình như là máy ảnh số, định dạng mặc định là .jpg rồi :), có thể tìm phần mềm để chuyển thành định dạng pdf (theo số thứ tự của file), chịu khó hỏi bác Gúc Gồ là sẽ kiếm ra :D

dark_blue
01-12-2009, 12:50 PM
Thành thật mà nói thì việc chuyển từ 1 file ảnh sang 1 file word là chuyện... trước giờ chưa từng xảy ra !


có nhiều phần mềm chuyển đổi hình ảnh (pdf, jpeg) thành dạng text (doc, rtf) như Convert PDF to Word, Convert Jpeg to Word... hoạt động khá tốt với tiếng Anh (tiếng Việt thì phức tạp hơn 1 chút). Còn với tiếng Trung thì chưa thử bao giờ ~:>

kemdau
01-12-2009, 01:18 PM
Cái nữa là phải file ảnh scan mới nhận dạng được chứ chụp từ máy ảnh thì ko thể nhận dạng được đâu.

ykentdo
01-12-2009, 01:50 PM
có nhiều phần mềm chuyển đổi hình ảnh (pdf, jpeg) thành dạng text (doc, rtf) như Convert PDF to Word, Convert Jpeg to Word... hoạt động khá tốt với tiếng Anh (tiếng Việt thì phức tạp hơn 1 chút). Còn với tiếng Trung thì chưa thử bao giờ ~:>

PDF không phải là file hình ảnh đâu bạn :D, nó là một file văn bản bình thường nên có thể chuyển đổi sang dạng text được, còn từ các loại file hình ảnh như jpeg mà chuyển sang text thì hiện tại chỉ có cách duy nhất là... ngồi gõ lại:(

dark_blue
01-12-2009, 02:42 PM
PDF không phải là file hình ảnh đâu bạn :D, nó là một file văn bản bình thường nên có thể chuyển đổi sang dạng text được
cái bạn nói là 1 dạng, còn nếu bạn scan 1 cuốn sách và chuyển thành file PDF → đâu có yếu tố nào là "văn bản" đâu bạn :D


còn từ các loại file hình ảnh như jpeg mà chuyển sang text thì hiện tại chỉ có cách duy nhất là... ngồi gõ lại:(
Convert Jpeg to Word đó bạn, hình jpg độ phân giải cao thì nhận diện tốt hơn

tuantute
02-12-2009, 11:41 AM
Sau thời gian tìm kiếm mình tìm được bản này có thể chuyển file ảnh thành file word để mọi người cùng sử dụng
http://fr7.abbyy.com/fr90/FR90PE_ESD.exe
keygen:
ABBYY.FineReader.KeyGen.rar (http://www.mediafire.com/download.php?mzgnyacltoz)

Truong_TienSinh
02-12-2009, 11:50 AM
hình như là máy ảnh số, định dạng mặc định là .jpg rồi :), có thể tìm phần mềm để chuyển thành định dạng pdf (theo số thứ tự của file), chịu khó hỏi bác Gúc Gồ là sẽ kiếm ra :D
Nếu đã có file hình ảnh dạng jpg thì việc đổi sang PDF dế dàng, có thể dùng Acrobat Professional 8.0 để combine các file này thành 1 tệp PDF chứa tất cả các hình ảnh theo ý muốn.

tuantute
02-12-2009, 03:51 PM
phần mềm Abbyy có thể chuyển đổi các dạng từ file ảnh sang word hoặc từ pdf sang doc và còn nhiều định dạng khác nữa nó là công cụ rất cần thiết cho công việc văn phòng

xuan2009
03-12-2009, 08:14 AM
phần mềm Abbyy có thể chuyển đổi các dạng từ file ảnh sang word hoặc từ pdf sang doc và còn nhiều định dạng khác nữa nó là công cụ rất cần thiết cho công việc văn phòng

Cho Tôi hỏi chút: Phần mềm này có làm việc tốt với tiếng Việt (có dấu) không bạn?. Tôi toàn "mổ cò" nên rất thích nhưng thấy có mấy cái không làm việc được với chử có dấu, Tôi đoán:
- Hoặc là nó không làm việc tốt với tiếng có dấu
- Hoặc là tôi chưa biết cách sử dụng (tôi kém vi tính lắm)
Bạn nào biết cách hướng dẫn tôi với. CHÂN THÀNH CẢM ƠN MỌI SỰ GIÚP ĐỠ CỦA CÁC BẠN. CHÀO

duckhai2691
03-12-2009, 08:36 PM
Tôi xin góp ý với các bạn về vấn đề chuyển đổi hoặc nhân dạng văn bản.
-trước tiên chúng ta cần phân biệt rõ thế nào là văn bản(có định dạng text,doc,docx,rft....) và file hình(bản scan hoặc file hinh chụp từ máy KTS, cả 2 đều là file hinh, tuy có thể khác nhau về định dạng jpg, bitmap,tiff, png,raw....)
-File pdf thông thường có 2 loại
1)loại được tạo ra từ các file văn bản, chúng ta có thể copy chữ và hình thủ công rồi dán qua word, hoặc dùng phần mềm để convert qua word rồi chỉnh sửa.có rất nhiều phần mềm làm việc này từ có phí hoặc miễn phí, hoặc dạng portable, tuy nhiên với tiếng việt có dấu thì tỉ lệ đạt thấp, vì sẽ bị lỗi font, định dạng.....đòi hỏi chúng ta fải có 1 số kiến thức nhất định về nhiều lĩnh vực liên quan.
2) Loại được tạo ra từ các file hình ảnh(image) bao gồm file được quét vào bằng máy scanner và chụp từ máy ảnh KTS, cả 2 đều là 1.với loại này chúng ta cần phải có 1 phần mềm chuyên dụng để nhận dạng chữ từ những file hình ảnh.
như vậy khi đã fân biệt rõ ràng như vậy các bạn sẽ dễ dàng trong công việc của mình hơn.
-về loại file pdf làm từ văn bản, có rất nhiều fần mềm để convert sang word để chỉnh sửa nhưng đa số rất tốt với tiếng anh, nhưng với tiếng việt thì tỉ lệ lỗi rất cao, công sửa rất nặng, ví dụ như adobe reader,PDF zilla,PDF tiger, nitro.....,solid.....,able Extract v.v.....
-về nhận dạng chữ trong file pdf từ dạng scan hoặc hình chụp từ máy KTS cũng có rất nhiều phần mềm nhưng hầu như không hổ trợ tiếng tiếng việt hoặc rất ít, còn với tiếng tàu thì bó tay ngoài phần mềm COCR.2mà tôi đã giới thiệu,
nếu là tiếng việt thì các bạn nên dùng VNDOCR 4.0, các bạn tải về và nghiên cứu thử theo link sau:
Nhận dạng chữ.rar-28mb
nhan dang chu.rar (http://www.mediafire.com/file/dtd2yerni43/nhan) dang chu.rar
HDSD VNDOCR 4.0-pdf-745kb
HDSD_VNDOCR_4.pdf (http://www.mediafire.com/file/4m05joicqzw/HDSD_VNDOCR_4.pdf)
- ngaòi ra còn có 1 số trang web cho phép chúng ta chuyển đổi, trích xuất trực tuyến tuy nhiên cũng chưa hổ trợ tiếng việt bao nhiêu. xin góp chút ý kiến để các bạn cùng tham khảo nhằm cho công việc dịch thuật sách được lẹ làng hơn, chào thân ái

xi_gfs
03-12-2009, 11:01 PM
chào các Pro: mình cũng là một người hâm mộ cờ tướng do vậy mình sưu tầm được một số lượng sách về cờ tướng. một số quyển sách chưa có trong diễn đàn mình đã phải mượn máy ảnh về chụp từng trang một. nay mình muốn chuyển đổi sang file word để có thể up lên cho mọi người bổ xung vào kho tàng của thanglongkydao mong mọi người giúp đỡ tìm cho mình một phần mềm chuyển đổi cho thuận tiện nhất. Thank mọi người trước nghe

Bac DucKhai2691 nói hết cả rồi, giờ mình có ý kiến chuyển sang phương pháp thủ công, hơi vất vả. Tuy nhiên nếu bạn có 1 nhóm bạn cùng làm sách, thì nên chia sách ra từng phần nhỏ rồi làm thì đỡ mệt hơn nhiều. Nếu sách mỏng mỏng thì bạn cứ chụp ảnh rồi gửi mình :D mình vừa làm vừa sửa vừa học luôn.

boyhnhp
06-12-2009, 11:32 AM
Cái nữa là phải file ảnh scan mới nhận dạng được chứ chụp từ máy ảnh thì ko thể nhận dạng được đâu.

hic,
đều là dạng số cả mà bác, nếu cùng format thì đều ok hết, nếu chụp bằng máy ảnh số thì có thể dùng tools để copy sang PC, sau đó dùng Acrobat 8.0 chuyển sang pdf bằng cách dùng công cụ create pdf file from Multiple Files.

khanhnh76
07-01-2010, 12:34 PM
Hehe he!

Em tưởng các bác muốn gì!

Chuyển đổi ảnh sang text chớ gì? Dễ ẹt! Các bác vào trang Số hóa - Trang chủ (http://www.sohoa.com.vn) nhé. Trang này cho phép chuyển đổi tất các các tài liệu dạng ảnh JPEG, TIFF, PDF, PNG PMP... sang văn bản dạng text - trực tiếp trên internet.

Hệ thống này xử lý hầu hết tất cả các loại ngôn ngữ, tiếng Việt là cực ngon vì họ sử dụng công nghệ nhận dạng của hãng ABBYY - Nga, hãng số 1 thế giới trong ngành nhận dạng.(Cái này chắc ăn đứt cái Vndocr 4.0 của anh Duckhai mất).

Vào thử nhé: Số hóa - Trang chủ (http://www.sohoa.com.vn), đăng kí tài khoản và đăng nhập, sau đó chỉ việc upload ảnh lên và chờ nhận kết quả, quá đơn giản và nhè nhàng.

Mà hình như bây giờ họ vẫn đang cho dùng thử miễn phí hay sao ấy, mỗi người được 100 trang, nhanh chân lên kẻo hết hàng đấy!

Em dùng thử thấy đỉnh lắm, độ chính xác tới 99%, tiếng gì cũng chuyển đổi được, mà em cũng ko mất sửa lại tài liệu gì cả vì kết quả giống i xì đúc với tài liệu gốc, quá ngon!

Công ty này họ cũng bán cả phần mềm nhận dạng nữa đấy, bác nào muốn số hóa cả kho sách thì tham khảo luôn nhé.

Have a nice day!

Và đừng quên cảm ơn tui nhé!:D