Kinh nghiệm dịch thuật Hoa ngữ
Close
Login to Your Account
Trang 1 của 2 12 CuốiCuối
Kết quả 1 đến 10 của 12
  1. #1
    Ngày tham gia
    Mar 2012
    Đang ở
    Bình Dương
    Bài viết
    1,981
    Post Thanks / Like

    Mặc định Kinh nghiệm dịch thuật Hoa ngữ

    Nhân khi rãnh rỗi tôi mạo phép chia sẻ các thành viên TLKĐ kinh nghiệm dịch thuật Hoa ngữ như một niềm vui để mọi người học tập loại ngoại ngữ này cũng như có thể dịch những tài liệu về cờ tướng nói riêng và các tài liệu khác bằng tiếng Hoa nói chung.

    Dịch thuật online tiếng Hoa trở nên quen thuộc nhờ những công cụ như Google, Thiều Chửu... nhưng có những nhược điểm như sau:

    1. Khi không có internet thì bó tay.

    2. Khi trang chủ bị die thì cũng bó tay.

    3. Không thể dịch được nếu không thể copy/paste text. Ví dụ text trong bộ SW cờ tướng, text trong file .CHM, .PDF., text trong một bức ảnh...

    Những công cụ trong bài viết này sẽ hoạt động offline do đó người dùng có thể dịch thuật bất cứ khi nào miễn là có điện và có máy tính . Một điều chú ý là người dịch phải có chút kinh nghiệm đối với loại ngoại ngữ mình cần dịch bởi vì kết quả dịch của máy tính thường không chính xác. Ngôn ngữ vốn phức tạp nhiều khi phải nhìn vào văn cảnh mà đoán nghĩa. Bài viết chỉ mang tính chất tham khảo xin các "tiền bối" (như bác Gà, bác Xuân, bác Phi Hương...) bỏ qua sai xót.

    Xin đa tạ tất cả mọi người!

    I. Từ điển tiếng Hoa (phồn thể + giản thể) offline:

    Phổ biến nhất là Neodict. Tải về và giải nén từ điển theo đường dẫn sau:

    https://dl.dropboxusercontent.com/u/...eoDict_0_6.rar

    Trước tiên, người dùng cần cài đặt Python 2.5.2 cho máy tính bằng cách bấm đúp vào file Python 2.5.2. Tiếp đó người dùng phải cài thêm font unicode cho Python bằng cách bấm đúp vào file wxPython2.8. Bây giờ người dùng có thể khởi động từ điển từ file NeoDict (từ đây về sau, mỗi lần cần dịch người dùng chỉ việc bấm đúp vào file NeoDict để khởi động từ điển).

    Giao diện chính của từ điển:



    Cách dịch một đoạn văn tiếng Hoa:


    1. Khởi động từ điển

    2. Copy đoạn văn bản tiếng Hoa

    3. Trở lại từ điển và bấm vào nút Get Clipboard hay bấm F1

    ---> Đoạn văn bản sẽ được dịch tự động.

    Quan sát giao diện của từ điển ta thấy có 5 phần chính:

    1. Phần tiếng Hoa gốc
    2. Phần tiếng Hán Việt
    3. Phần nghĩa của từ bằng tiếng Anh
    4. Phần nghĩa của từ bằng tiếng Việt
    5. Phần nghĩa của đoạn văn bằng tiếng Việt (gần đúng)

    Chú ý: Ở phần tiếng Hán Việt, người dùng có thể click chuột vào một từ Hán Việt nào đó, từ đó sẽ được tự động bôi đỏ. Tương ứng với từ đó bên phần tiếng Hoa gốc cũng được bôi đỏ theo. Nghĩa của từ đó cũng được thể hiện ở phần nghĩa tiếng Việt, nghĩa tiếng Anh. Tính năng này khá hay.

    II. Dịch tiếng Hoa từ hình ảnh, file .pdf...

    Như đã nói ở trên, đối với tiếng Hoa được "nhúng" vào chương trình phần mềm hoặc tranh ảnh thì làm sao dịch được? Khi ấy chúng ta cần dùng công cụ để "rút" chữ tiếng Hoa ra để dịch. Có rất nhiều công cụ làm được việc này nhưng tôi chọn gImagereader với những lý do sau:

    1. Chương trình tùy biến rất cao do phân chia ra 3 phần chính: Giao diện (GUI), Động cơ (Engine), Database (book). Với việc bổ sung database chương trình có thể "rút" bất kỳ ngôn ngữ nào ra khỏi tranh ảnh.

    2. Độ chính xác tương đối

    3. Hỗ trợ file PDF

    4. Hỗ trợ rất nhiều từ điển (trong bài viết này tôi không dùng từ điển)

    A. Cài đặt:

    Tải và giải nén chương trình từ đây:

    https://dl.dropboxusercontent.com/u/...ct/Extract.rar

    - Trước tiên cài đặt giao diện (GUI) cho chương trình bằng cách bấm đúp vào file gimagereader_0.9-1_win32 và làm các bước theo yêu cầu.

    - Tiếp theo người dùng cài đặt động cơ (Engine) cho chương trình bằng cách bấm đúp vào file tesseract-ocr-setup-3.02.02 và làm các bước theo yêu cầu.

    - Tiếp theo copy/paste cơ sở dữ liệu tiếng Hoa giản thể chi_sim.traineddata vào thư mục C:\Program Files\Tesseract-OCR\tessdata

    - Tiếp theo copy/paste cơ sở dữ liệu tiếng Hoa phồn thể chi_tra.traineddata vào thư mục C:\Program Files\Tesseract-OCR\tessdata

    Đến đây chương trình có thể quét chữ Hoa giản thể và phồn thể từ tranh ảnh, file PDF... để dịch. Muốn "rút" được ngôn ngữ khác như tiếng Việt, tiếng Thái... người dùng chỉ việc bổ sung datatabase vào đường dẫn C:\Program Files (x86)\Tesseract-OCR\tessdata.

    B. Sử dụng

    Giả sử tôi dịch những câu tiếng Hoa trong BH GUI như hình dưới:




    Còn tiếp...
    Lần sửa cuối bởi ChienKhuD, ngày 17-02-2014 lúc 08:47 AM. Lý do: cập nhật đường dẫn (links) phần mềm
    Bận lòng chi nắm bắt

  2. #2
    Ngày tham gia
    Mar 2012
    Đang ở
    Bình Dương
    Bài viết
    1,981
    Post Thanks / Like

    Mặc định Kinh nghiệm dịch thuật Hoa ngữ (tt)

    Như tên gọi của nó, gImagereader là software "trích chữ" từ file hình (và file PDF) do đó trước tiên ta phải có một file hình. Windows hoàn toàn support điều này thông qua chức năng chụp ảnh màn hình.

    1. Chụp ảnh màn hình:

    - Khởi động chương trình chúng ta cần chụp ảnh, ví dụ BH GUI.

    - Nhấn phím Print Screen trên bàn phím

    - Khởi động chương trình Paint của Windows bằng lệnh mspaint từ nút Start sau đó nhấn Enter:



    - Khi chương trình Paint được khởi động, nhấn tổ hợp phím Ctrl+V để paste hình vào Paint

    - Điều chỉnh kích thước file ảnh sao cho phù hợp vài Save file ảnh lại với định dạng thông dụng, ví dụ: .png hay .jpg. Trong ví dụ này tôi Save file ảnh với tên BHGUI theo định dạng .png.

    2. Trích text từ file ảnh:

    - Khởi động chương trình gImagereader đã cài đặt ở phần II.

    - Bấm Open và trỏ tới đường dẫn của file ảnh rồi bấm nút Open để mở file hình:



    - Khi hình đã được mở, dùng chuột quét khối chữ trên hình sau đó bấm Recognize seletion. Kết quả chữ sẽ được trích xuất ở khung bên phải theo hình:



    - Từ khung bên phải, người dùng có thể copy/paste text để cho vào từ điển để dịch.

    Tương tự với file PDF, người dùng chỉ cần Open file PDF, chọn text cần trích sau đó copy/paste vào từ điển. Để trích được ngôn ngữ non-latin khác, như tiếng Ả Rập, Thái, Hy Lạp, Hàn, Nhật..., người dùng chỉ cần cập nhật database sau đó làm tương tự.

    Chúc thành công.
    Bận lòng chi nắm bắt

  3. #3
    Ngày tham gia
    Apr 2011
    Bài viết
    1,192
    Post Thanks / Like

    Mặc định

    Quá tuyệt cú mèo D, dịch text từ hình ảnh quá good.

    Vote D 100 vé.

    Chúc D vui!

  4. Thích ChienKhuD, trung_cadan đã thích bài viết này
  5. #4
    Ngày tham gia
    Mar 2012
    Đang ở
    Bình Dương
    Bài viết
    1,981
    Post Thanks / Like

    Mặc định

    Mọi người vào trang này để download database cho chương trình nhận dạng ngôn ngữ. Có rất nhiều ngôn ngữ được hỗ trợ:

    Downloads - tesseract-ocr - An OCR Engine that was developed at HP Labs between 1985 and 1995... and now at Google. - Google Project Hosting
    Bận lòng chi nắm bắt

  6. Thích trung_cadan đã thích bài viết này
  7. #5
    Ngày tham gia
    Aug 2012
    Bài viết
    28
    Post Thanks / Like

    Mặc định

    "Bookmark this page", like bro Vịt D 1 cái, có kế bên thì ... Lý hun luôn 1 cái... hahaha... ^_^

  8. Thích trung_cadan đã thích bài viết này
  9. #6
    Ngày tham gia
    Jun 2009
    Bài viết
    34,230
    Post Thanks / Like

    Mặc định

    Rất hữu ích , hôm nay mới được xem , cám ơn bác ChienKhuD nhiều !!!

    Hãy bấm THÍCH BÀI VIẾT nếu bạn đã đọc và cảm thấy bài viết đó hữu ích , nó thể hiện sự trân trọng đối với tác giả và khuyến khích họ cống hiến hơn cho diễn đàn ...

    BẤM SUBCRIBE HOẶC ĐĂNG KÝ ĐỂ CẬP NHẬT LIÊN TỤC CÁC CLIP CỜ HAY NHẤT HIỆN NAY CỦA THĂNG LONG KỲ ĐẠO

    Có chỗ đứng , Cứng chỗ đó

    Học cờ cùng Thanglongkydao , không ngừng tư duy , không ngừng sáng tạo !!!

    Cách up biên bản cờ , chèn ảnh , chèn clip vào diễn đàn

    Like để theo dõi Facebook của chúng ta

    Núi cao ta trông, đường rộng ta đi, tuy đích chưa đến, nhưng lòng hướng về !!!

  10. Thích Thợ Điện đã thích bài viết này
  11. #7
    Ngày tham gia
    Jun 2009
    Đang ở
    Đơn Dương - Lâm Đồng
    Bài viết
    6,078
    Post Thanks / Like

    Mặc định

    Một bài viết rất hay từ ngày 28-2-2013 nhưng sao bữa nay mình mới được đọc nhỉ ? Quả là thiếu sót- cảm ơn ChienkhuD

  12. Thích trung_cadan, Thợ Điện đã thích bài viết này
  13. #8
    Ngày tham gia
    Apr 2012
    Bài viết
    105
    Post Thanks / Like

    Mặc định

    Cảm ơn bác ChienkhuD. Phần mềm này rất hữu ích những khi ko có internet và những khi ko copy được phần chữ cần dịch. Nhưng có một chút khó khăn là cá nhân em cảm thấy cách dịch Hán Việt hơi khó cho những người trẻ hoặc những người ít đọc sách như em. Ví dụ đọc đoạn dịch : ''án chiếu ngã đích tiêu phí thủy bình'' chắc ko nhiều người hiểu được là ''dựa trên bình quân chi phí tiêu dùng của tôi''. Còn nếu không thì cũng mất thời gian tìm hiểu nghĩa của từng từ một thì cũng mất khá nhiều thời gian bác nhỉ. Bản thân em cũng đang đi tìm 1 phần mềm dịch Hoa Việt dễ dùng dễ hiểu và miễn phí nữa thì càng tốt nên mong các bro chia sẻ thêm ạ
    Lần sửa cuối bởi MinhTommy, ngày 01-04-2013 lúc 05:42 PM.
    Em chợt đến bên anh, dịu dàng như cơn gió nhẹ
    Mà lòng anh để ngỏ, cho tình em mơn man
    Em là cánh én mỏng, chao xuống giữa đời anh
    Cho lòng anh xao động, thành mùa xuân ngọt ngào

  14. Thích ChienKhuD, trung_cadan, Thợ Điện đã thích bài viết này
  15. #9
    Ngày tham gia
    Nov 2011
    Bài viết
    18
    Post Thanks / Like

    Mặc định

    Bài viết chia sẽ của pro ChienKhuD rất hay và cần thiết cho những ae mê cờ như mìmh . Cảm ơn pro ChienKhuD rất nhiều !, chúc sức khỏe !.

  16. Thích ChienKhuD, trung_cadan, Thợ Điện đã thích bài viết này
  17. #10
    Ngày tham gia
    Mar 2016
    Bài viết
    2
    Post Thanks / Like

    Mặc định

    Các bác cho em hỏi: Sau khi em làm các bước thì OK. Tuy nhiên, khi copy phần text đã được trích xuất ra thì không thể paste được vào word để tra từ điển !!!!!!!

  18. Thích trung_cadan, ChienKhuD đã thích bài viết này
Kinh nghiệm dịch thuật Hoa ngữ
Trang 1 của 2 12 CuốiCuối

Đánh dấu

Đánh dấu

Quyền viết bài

  • Bạn Không thể gửi Chủ đề mới
  • Bạn Không thể Gửi trả lời
  • Bạn Không thể Gửi file đính kèm
  • Bạn Không thể Sửa bài viết của mình
  •  
.::Thăng Long Kỳ Đạo::.
  • Liên hệ quảng cáo: trung_cadan@yahoo.com - DĐ: 098 989 66 68