Hướng dẫn cách khắc phụ lỗi font chữ khi sử dụng google dịch

Liên hệ QC

Excel my love_1

Thành viên thường trực
Tham gia
12/11/19
Bài viết
321
Được thích
179
Mình có 1 văn bản tiếng Lào (file PDF), mình định sử dụng công cụ google dịch để dịch sang tiếng việt
Nhưng khi mình copy đoạn văn bản, và dán vào phần dịch của google, thì nó bị lỗi font tùm lum
Rất mong mọi người chỉ giúp
(Gửi kèm minh họa để mọi người tiện theo dõi)1.png
2.png
 
Thử đừng nhấn ctrl V mà nhấn chuột phải chọn paste as plain text.
 
Thử đừng nhấn ctrl V mà nhấn chuột phải chọn paste as plain text.
Hình như thớt bị từ cái văn bản pdf copy qua gú gô dịch.
Có lẽ do văn bản kia dùng loại phông chữ mà trình duyệt không xem được. Hoặc cái phần mềm xem pdf kia nó đòi hỏi thêm gì đó lúc copy.
 
Hình như thớt bị từ cái văn bản pdf copy qua gú gô dịch.
Có lẽ do văn bản kia dùng loại phông chữ mà trình duyệt không xem được. Hoặc cái phần mềm xem pdf kia nó đòi hỏi thêm gì đó lúc copy.
Tôi luôn tâm niệm là với những vấn đề kiểu này thì luôn có 2 nhóm người. Nhóm 1 gồm những người đã từng có vấn đề đó, và họ đã giải quyết được hoặc không. Nhóm 2 chưa từng gặp. Nếu người ta chỉ đính kèm ảnh thì nhóm 2 chỉ nhìn cho đã con mắt thôi. Làm sao từ ảnh có thể đoán mò được khi không được lanh lợi như "người ta". Nhưng cũng nhóm người không được lanh lợi như "người ta" ấy nếu họ được cung cấp tập tin dữ liệu thì rất có thể họ sẽ tò mò, thử xoay xở, thử kiểm tra cái này cái kia, và biết đâu một số trong họ tìm ra được nguyên nhân và cách khắc phục. Đính kèm tập tin là mở rộng thêm nhóm người có thể giúp mình. Đính kèm ảnh thì chỉ nhìn cho sướng mắt thôi. Ai biết được trong PDF kia dữ liệu thế nào, có chèn phông chữ không, người ta chọn phông chữ gì. Có tập tin là có dữ liệu thực để "VỌC". Không có thì bái bài bai.
 
Không được anh à.
Em gửi anh file PDF nhờ anh xem giúp ạ
Về lý thuyết thì bộ font dùng mã unicode sẽ chứa bộ mã tiếng Lào trong đó. File này tôi e là dùng bộ font riêng không phải font unicode vì mã ASCII của các ký tự của nó nhỏ hơn 255. Trong khi mã ASC của các ký tự chữ Lào trong Unicode trong khoảng 3700.
Nếu không phải font dùng mã Unicode thì không dịch bằng GG translate được
 
Thử đoán mò. Tất nhiên có tập tin nên việc đoán mò có cơ sở hơn.

Văn bản trong PDF 99% không ở dạng unicode. Nó giống như văn bản Việt nhưng không ở dạng unicode. Ta làm thí nghiệm. Mở bất kỳ tập tin nào đã có vd. trong A1 văn bản được gõ bằng Unikey, kiểu gõ telex, bảng mã VNI Windows. Nếu chưa có tập tin như thế thì tạo mới rồi gõ. Nếu ta chọn cho A1 phông chữ Times New Roman thì sẽ nhìn thấy "đầu trâu mặt ngựa", nếu chọn VN-Times thì văn bản nhìn "đẹp tuyệt vời".

Trong Google Dịch ta chọn nguồn là tiếng Việt, đích là tiếng Anh. Nếu ta copy A1 và dán vào cửa sổ google thì cả ở đích và nguồn đều có "đầu trâu mặt ngựa".

Nếu bây giờ dùng Unikey để chuyển text trong A1 về unicode rồi dán vào A2 (phông chữ cho A2 là Times New Roman) thì sau khi copy A2 rồi dán vào google thì có ở nguồn và đích văn bản "đẹp tuyệt vời".

Excel hiển thị A1 "đẹp tuyệt vời" vì ta chọn cho A1 VNI-Times. PDF hiển thị văn bản Lào "đẹp tuyệt vời" vì phông chữ dùng để hiển thị đã được chèn vào, nhúng vào tập tin PDF.

font.PNG

Có lẽ giống như text VNI Windows trong A1, phải convert sang unicode. Lúc đó copy và dán text unicode vào google Dịch mới thành công. PDF được tạo mấy chục năm trước (được tạo 31/05/2007 bằng Acrobat PDFMaker 7.0 for Word) nên nó không dùng bảng mã unicode là điều dễ hiểu. Hồi xưa thì Việt Nam cũng chỉ có VNI Windows, TCVN3, ... thôi.
 
Bạn chuyển thành file ảnh rồi thả file ảnh vào đây lèo cái xong.
(Chụp màn hình nhấn win + shift + s).


1640658109816.png
 
Web KT
Back
Top Bottom