Chia sẻ tool dịch tự động, tự động dịch và tạo sub phim

Liên hệ QC

khongtu19bk

Thành viên hoạt động
Tham gia
5/12/09
Bài viết
147
Được thích
69
Như đã giới thiệu ở đây: Link video giới thiệu.

Hôm nay mình chia sẻ tool tự động dịch phụ đề phim.
Chức năng của tool:
Nhận phụ đề phim là tiếng anh (có thể sửa trong code để dịch phụ đề ngôn ngữ khác) sang tiếng việt và tạo thành sub phim tiếng việt.
Tool sẽ đi qua hai bước:
Step 1:
Input: sub english
Output: Excel vietnamese
Step 2:
Do file excel do tool dịch ra có thể chưa nuột nà (máy dịch mà), nên cần bàn tay con người tinh chỉnh lại cho hay hơn. Sau khi đã chỉnh xong trên excel ta chạy tool.
Input: Excel
Ouput: File sub vietnamese.
Yêu cầu: Máy tính cài đặt IE phiên bản 11 hoặc cao hơn.
Link download: http://www.mediafire.com/file/2793zj8cfqq0880/Tool_Auto_Translate_sub.rar/file
Chú ý: Đây là bản tool chia sẻ, mọi người tùy ý chỉnh sửa code theo ý mọi người.
 
Em thử với file này thấy dịch được toàn bộ.
Đúng là cho phép nhiều thật. Tôi dán toàn bộ 134 KB vào trang web thì nó chỉ cho tới

57
00:07:30,276 --> 00:07:31,956
<font face="Tahoma">Buddy where's


Tức 5,10 KB
Bài đã được tự động gộp:

Chia nhỏ dữ liệu rồi ghép thì ai cũng biết thôi. Nếu nó không cho làm 1 lần thì phải chia làm nhiều lần. Cái này thì ai cũng bắt buộc phải biết thôi.

Về đọc văn bản thì có còn hơn không. Nhưng thực ra google dịch vẫn chưa thể chuẩn. Lấy làm nguồn để rồi tự chỉnh sửa thì được. Tôi từng thử dịch từ Ba Lan sang Việt và ngược lại. Có nhiều đoạn tương đối chuẩn nhưng có những đoạn hoặc là "rất buồn cười" hoặc nghĩa hoàn toàn khác. Đấy là văn bản, còn nếu nó đọc những chỗ "rất buồn cười" hoặc nghĩa hoàn toàn khác thì chỉ còn nước ôm bụng mà cười.
 
Lần chỉnh sửa cuối:
Upvote 0

File đính kèm

  • Fast Furious 7.RARBG.en.srt.vi.rar
    38.8 KB · Đọc: 4
Upvote 0
Bạn đã tham gia chủ đề này.


Ngay trên bài của bạn là bài của HeSanbi. Link tới bài có code với MSXML2.ServerXMLHTTP. Nhưng hình như code đó không chạy được nữa thì phải. Server trả về error thì phải. Google thay đổi liên tục.

Về việc dùng google translate thì trên GPE có nhiều bài rồi. Bạn có thể nhấn "Tìm kiếm" ở góc trên bên phải rồi nhập google translate
Trên mạng cũng nhiều, em đã tìm thử, có cái dùng được, có cái không.
Đảm bảo hai tiêu chí, miễn phí, và có thể dùng lâu dài, dễ chia sẻ thì em lựa chọn phương án dùng web ạ.
 
Upvote 0
Ngộ nhỉ. Đây là kết quả em test.
Thì ngay từ đầu tôi nói rõ về trường hợp tôi làm bằng tay dán vào trang web mà. Vì thế tôi mới tò mò là làm bằng code "kia" thì nó cho bao nhiêu.

Cụ thể tôi dán vào https://translate.google.com

Còn về thông tin của bạn thì tôi "mừng" cơ mà
Đúng là cho phép nhiều thật.
google.JPG
Bài đã được tự động gộp:

Đảm bảo hai tiêu chí, miễn phí, và có thể dùng lâu dài, dễ chia sẻ thì em lựa chọn phương án dùng web ạ.
Thôi được. Ứng dụng là của bạn, giải pháp do bạn chọn. Nhưng sao lại khởi động liên tục IE chỉ để dịch mỗi lần vd. "Bye.", "Ren!", "You see..."? Thử chia tập tin thành những đoạn khoảng 3 KB, 4 KB để gửi xem sao.
 
Lần chỉnh sửa cuối:
Upvote 0
Thì ngay từ đầu tôi nói rõ về trường hợp tôi làm bằng tay dán vào trang web mà. Vì thế tôi mới tò mò là làm bằng code "kia" thì nó cho bao nhiêu.

Cụ thể tôi dán vào https://translate.google.com

Còn về thông tin của bạn thì tôi "mừng" cơ mà

View attachment 221189
Bài đã được tự động gộp:


Thôi được. Ứng dụng là của bạn, giải pháp do bạn chọn. Nhưng sao lại khởi động liên tục IE chỉ để dịch mỗi lần vd. "Bye.", "Ren!", "You see..."? Thử chia tập tin thành những đoạn khoảng 3 KB, 4 KB để gửi xem sao.
Vâng, có nhiều chỗ có thể cái thiện lắm. Có thể cải thiện là không khởi động liên tục, khởi động một lần, rồi truyền string vào.
Còn về việc sao không cắt từng đoạn, để giảm thiểu số lần dịch về nhỏ nhất, thì vì em không biết trong tương lai, ông google ông sẽ hạn chế ra sao, cho nên cho nó nhặt từng câu cho chắc ăn.
Về việc, tại sao em để mở nhiều lần, vì như thế dễ quan sát là khi nào bắt đầu dịch một câu. Em muốn xem luôn để học ngoại ngữ thôi, không có lý do gì đặc biệt.
Trên hình ảnh anh minh họa dịch cả cụm là file srt có vẻ phần format tiếng anh không bị ảnh hưởng. Nhưng với file ass thì cũng cần tính, nó sẽ dịch cả format.
Mã:
Dialogue: 0,0:00:06.75,0:00:10.68,Default Italic,,0,0,0,,Khi tôi nghe Trưởng phòng Yashiro
Dialogue: 0,0:00:10.81,0:00:12.51,Default Italic,,0,0,0,,ở thị trấn ven biển xinh đẹp đó
Dialogue: 0,0:00:12.61,0:00:14.58,Default Italic,,0,0,0,,Tôi chúc mừng họ từ phía dưới
Dialogue: 0,0:00:15.41,0:00:18.18,Default Italic,,0,0,0,,Sau đó tôi tốt nghiệp
Dialogue: 0,0:00:18.28,0:00:21.38,Default Italic,,0,0,0,,từ trưởng Sangenya và trở thành một i
Dialogue: 0,0:00:22.31,0:00:26.51,Default Italic,,0,0,0,,Nhưng kể từ khi người đàn ông đó xuất hiện
Dialogue: 0,0:00:26.75,0:00:28.98,Default Italic,,0,0,0,,Tôi nhận ra một cái gì đó.
Dialogue: 0,0:00:29.91,0:00:33.28,Default Italic,,0,0,0,,Trưởng Sangenya và Rusudo đang hợp tác
Dialogue: 0,0:00:33.38,0:00:35.54,Default Italic,,0,0,0,,và làm việc cùng nhau vào thời điểm khác.
Dialogue: 0,0:00:35.68,0:00:39.21,Default Italic,,0,0,0,,Đó là bởi vì họ bằng nhau cả một
Dialogue: 0,0:00:40.81,0:00:44.51,Default Italic,,0,0,0,,Nhưng tôi ... tôi không bằng.
Dialogue: 0,0:00:44.58,0:00:47.31,Default Italic,,0,0,0,,Rusudo là một người bình đẳng, nhưng tôi ...
Dialogue: 0,0:00:51.18,0:00:53.61,Default,,0,0,0,,Niwano!
Dialogue: 0,0:00:51.18,0:00:53.61,Double Line,,0,0,0,,Vâng.
Dialogue: 0,0:00:53.75,0:00:55.18,Default,,0,0,0,,Có phải dạ dày của bạn bị đau?
Dialogue: 0,0:00:55.28,0:00:56.54,Default,,0,0,0,,Hoàn toàn không.
Dialogue: 0,0:00:56.68,0:00:58.78,Default,,0,0,0,,Vậy thì đừng làm cho tiếng động lạ đó!
Dialogue: 0,0:00:59.41,0:01:00.58,Default,,0,0,0,,Tôi xin lôi.
Đi qua google trans nó thành như thế này:
Mã:
Đối thoại: 0,0: 00: 06,75,0: 00: 10,68, Chữ nghiêng mặc định ,, 0,0,0, Khi tôi nghe là trò chơi Yashiro
Đối thoại: 0,0: 00: 10,81,0: 00: 12,51, Chữ nghiêng mặc định ,, 0,0,0, ở trong thị trường
Đối thoại: 0,0: 00: 12,61,0: 00: 14,58, Chữ nghiêng mặc định ,, 0,0,0,
Đối thoại: 0,0: 00: 15,41,0: 00: 18,18, Chữ nghiêng mặc định ,, 0,0,0 ,,
Đối thoại: 0,0: 00: 18,28,0: 00: 21,38, Chữ nghiêng mặc định ,, 0,0,0 ,, từ Sangenya và ngược lại một
Đối thoại: 0,0: 00: 22,31,0: 00: 26,51, Chữ nghiêng mặc định ,, 0,0,0,
Đối thoại: 0,0: 00: 26,75,0: 00: 28,98, Chữ nghiêng mặc định ,, 0,0,0 ,, Tôi nhận ra một điều gì đó.
Đối thoại: 0,0: 00: 29.91,0: 00: 33.28, Chữ nghiêng mặc định ,, 0,0,0 ,, Trưởng Sangenya và Rusudo trong tổng hợp
Đối thoại: 0,0: 00: 33,38,0: 00: 35,54, Chữ nghiêng mặc định ,, 0,0,0, và làm việc với nhau trong khi thay thế.
Đối thoại: 0,0: 00: 35,68,0: 00: 39,21, Chữ nghiêng mặc định ,, 0,0,0 ,, Cách là một trong những vấn đề của nhau
Đối thoại: 0,0: 00: 40.81,0: 00: 44.51, Chữ nghiêng mặc định ,, 0,0,0 ,, tôi luyện ... tôi không bằng.
Đối thoại: 0,0: 00: 44,58,0: 00: 47,31, Chữ nghiêng mặc định ,, 0,0,0 ,, Rusudo là một người bình thường, một ...
Đối thoại: 0,0: 00: 51,18,0: 00: 53,61, Mặc định ,, 0,0,0 ,, Niwano!
Đối thoại: 0,0: 00: 51,18,0: 00: 53,61, Đường đôi ,, 0,0,0 ,,,.
Đối thoại: 0,0: 00: 53,75,0: 00: 55,18, Mặc định ,, 0,0,0 ,, Có phải là con của bạn và không?
Đối thoại: 0,0: 00: 55,28,0: 00: 56,54, Mặc định ,, 0,0,0 ,, Hoàn không.
Đối thoại: 0,0: 00: 56,68,0: 00: 58,78, Mặc định ,, 0,0,0 ,, trong đó có thể làm cho tiếng ồn của trò chơi!
Đối thoại: 0,0: 00: 59,41,0: 01: 00.58, Mặc định ,, 0,0,0 ,, Tôi xin lỗi.
 
Upvote 0
Khi đã biết được cấu trúc từng loại file thì tùy vào loại file đầu vào mà viết code cho phù hợp.
Dịch 1 lần (hoặc chia ra từng đoạn để giảm số lần dịch) không có nghĩa là bê toàn bộ nội dung trong file gốc đi dịch (hoặc cắt ra đi dịch) mà nên trích phần cần dịch ra để dịch rồi ráp vào lại. Vừa tránh sai do dịch phần không cần dịch vừa giảm khối lượng công việc (độ dài chuỗi mà google phải dịch).
Ví dụ đối với file .srt tôi làm như sau:
  1. Tách chuỗi nguồn thành mảng (X) với mỗi dòng là 1 phần tử
  2. Duyệt mảng X để lấy dòng cần dịch
  3. Đối với dòng cần dịch, ghi chỉ số dòng vào mảng A, nội dung vào mảng B
  4. Nối mảng B thành chuỗi S
  5. Dịch chuỗi S được chuỗi S'
  6. Tách chuỗi S' thành mảng B'
  7. Ráp mảng B' vào mảng X dựa vào mảng A
  8. Nối mảng X được kết quả
Tất cả các loại sub nếu biết cấu trúc đều có thể dùng thuật toán trên.
 
Lần chỉnh sửa cuối:
Upvote 0
Trên hình ảnh anh minh họa dịch cả cụm là file srt có vẻ phần format tiếng anh không bị ảnh hưởng. Nhưng với file ass thì cũng cần tính, nó sẽ dịch cả format.
Tôi minh họa cho huuthang_bd chứ đâu có minh họa cho bạn? Chúng tôi nói về những vấn đề khác.
Thì ý tôi là bạn vẫn dịch lời thoại như bây giờ nhưng nên gom thành "gói" to rồi mới gửi đi chứ ai lại gửi từng tí một.

Trong bài trước tôi chỉ muốn kiểm tra xem trang web chấp nhận bao nhiêu nên gửi cả tập tin để kiểm nghiệm chứ tôi có nói là phải gửi cả những dòng không cần dịch đâu? Mà tôi nói với huuthang_bd về vấn đề hoàn toàn khác.
 
Upvote 0
Tôi minh họa cho huuthang_bd chứ đâu có minh họa cho bạn? Chúng tôi nói về những vấn đề khác.
Thì ý tôi là bạn vẫn dịch lời thoại như bây giờ nhưng nên gom thành "gói" to rồi mới gửi đi chứ ai lại gửi từng tí một.

Trong bài trước tôi chỉ muốn kiểm tra xem trang web chấp nhận bao nhiêu nên gửi cả tập tin để kiểm nghiệm chứ tôi có nói là phải gửi cả những dòng không cần dịch đâu? Mà tôi nói với huuthang_bd về vấn đề hoàn toàn khác.
Vậy xin phép cho em được dừng thảo luận tại đây.
 
Upvote 0
xin chào mọi người
Mình rất thích vụ dịch tự động sub
hôm trước có down về , nhưng không biết cách dùng
Phiền các cao nhân chỉ dạy mình với
xin chân thành cảm ơn
Bài đã được tự động gộp:

Như đã giới thiệu ở đây: Link video giới thiệu.

Hôm nay mình chia sẻ tool tự động dịch phụ đề phim.
Chức năng của tool:
Nhận phụ đề phim là tiếng anh (có thể sửa trong code để dịch phụ đề ngôn ngữ khác) sang tiếng việt và tạo thành sub phim tiếng việt.
Tool sẽ đi qua hai bước:
Step 1:
Input: sub english
Output: Excel vietnamese
Step 2:
Do file excel do tool dịch ra có thể chưa nuột nà (máy dịch mà), nên cần bàn tay con người tinh chỉnh lại cho hay hơn. Sau khi đã chỉnh xong trên excel ta chạy tool.
Input: Excel
Ouput: File sub vietnamese.
Yêu cầu: Máy tính cài đặt IE phiên bản 11 hoặc cao hơn.
Link download: http://www.mediafire.com/file/2793zj8cfqq0880/Tool_Auto_Translate_sub.rar/file
Chú ý: Đây là bản tool chia sẻ, mọi người tùy ý chỉnh sửa code theo ý mọi người.
bạn có thể chỉ mình cách sử dụng được không ?
cám ơn bạn rất nhiều
 
Lần chỉnh sửa cuối:
Upvote 0
Web KT

Bài viết mới nhất

Back
Top Bottom