Jump to content

Trợ giúp:Biên dịch nội dung/Dịch thuật/Chất lượng dịch thuật

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 100% complete.

Khi thêm một đoạn văn mới vào bản dịch, bạn có thể bắt đầu từ đầu hoặc sử dụng tính năng dịch tự động làm điểm khởi đầu. Khi có, bản dịch máy được sử dụng theo mặc định như một bản dịch ban đầu. Các lựa chọn khác nhau, chi tiết về khả năng có sẵn của chúng và các cân nhắc khi sử dụng bản dịch máy được mô tả dưới đây.

Giới hạn cho toàn bộ bản dịch

Tùy chọn "bản dịch ban đầu" trong cột công cụ cho phép bạn quyết định nội dung ban đầu sẽ sử dụng làm điểm bắt đầu cho mỗi đoạn văn. Các lựa chọn có sẵn là như sau:

  • Sử dụng dịch vụ dịch máy. Điều này cho phép bạn bắt đầu với một bản dịch tự động của đoạn văn gốc. Số và tên của các lựa chọn này sẽ khác nhau. Các tùy chọn như "Use Apertium" hoặc "Use Yandex" sẽ có tùy thuộc vào các ngôn ngữ được hỗ trợ cho các dịch vụ này (đối với thêm thông tin về điều này trong phần tiếp theo).
  • Sử dụng dịch vụ máy. Điều này cho phép bạn bắt đầu với phiên bản dịch tự động của đoạn văn bản gốc. Mặc dù nội dung sẽ vẫn ở trong ngôn ngữ gốc, một số yếu tố được điều chỉnh cho wiki mục tiêu. Ví dụ, các liên kết sẽ chỉ đến bài viết tương ứng trong ngôn ngữ mục tiêu, và các mẫu sẽ được chuyển đổi thành các bài viết tương đương. Các dịch giả vẫn phải viết lại nội dung hoàn toàn, nhưng các yếu tố được điều chỉnh có thể dễ sử dụng lại hơn.
  • Sử dụng dịch vụ máy. Điều này cho phép bạn bắt đầu với phiên bản dịch tự động của bản gốc văn bản.* Sử dụng dịch vụ máy dịch. Điều này cho phép bạn bắt đầu với phiên bản dịch tự động của bản gốc văn bản.

Bạn có thể nhanh chóng chuyển đổi giữa các phương pháp khác nhau độc lập trên mỗi đoạn, vì mỗi đoạn có thể làm việc tốt nhất trên các loại nội dung khác nhau. Thay đổi giữa các phương pháp tiếp cận khác nhau sẽ giữ lại những thay đổi bạn đã thực hiện trên đoạn văn. Bằng cách này, bạn có thể thử một cách tiếp cận khác ngay cả khi bạn bắt đầu chỉnh sửa bản gốc mà không sợ mất thay đổi của mình nếu cuối cùng bạn quyết định quay lại cách tiếp cận ban đầu. Hai lựa chọn bổ sung có ý nghĩa trong bối cảnh này:

  • Tùy chọn đặt lại bản dịch có sẵn khi bạn thực hiện sửa đổi đối với nội dung ban đầu được cung cấp. Nó cho phép bạn khôi phục lại nội dung ban đầu bằng cách loại bỏ những thay đổi bạn đã thực hiện.
  • Tùy chọn đánh dấu là mặc định có sẵn khi bạn chọn cách tiếp cận cho một đoạn văn không phải là mặc định. Nó cho phép bạn đặt cách tiếp cận mặc định cho các đoạn tiếp theo được thêm vào bản dịch. Điều này có thể rất thuận tiện nếu bạn thấy rằng dịch vụ dịch thuật cụ thể thường hoạt động tốt hơn dịch vụ mặc định.

Đánh giá chất lượng dịch thuật

Công cụ Biên dịch nội dung tích hợp một số dịch vụ dịch thuật, nhưng phạm vi và chất lượng ngôn ngữ khác nhau theo từng cặp ngôn ngữ. Các dịch vụ được hỗ trợ được liệt kê dưới đây với một liên kết đến danh sách các ngôn ngữ họ hỗ trợ:

Danh sách ngôn ngữ ở trên chỉ ra mã cấu hình để đảm bảo rằng thông tin đồng bộ với cách công cụ hiện hoạt động. Các danh sách cho thấy mã ngôn ngữ cho ngôn ngữ nguồn ở mức đầu tiên và mã của tất cả các ngôn ngữ mục tiêu được hỗ trợ dưới đó.

Bạn cũng có thể kiểm tra các dịch vụ có sẵn cho một cặp ngôn ngữ cụ thể bằng cách sử dụng API của chúng tôi. Trong ví dụ này cho cặp Tây Ban Nha-Catalan, bạn có thể thấy rằng Apertium là dịch vụ mặc định (đầu tiên trong danh sách) trong số các dịch vụ khác có sẵn.

Các ngôn ngữ được kích hoạt dần dần, dựa trên kết quả quan sát và phản hồi của cộng đồng. Có thể rằng bản dịch máy cho một số ngôn ngữ vẫn chưa được bật, ngay cả khi chúng được hỗ trợ bởi các dịch vụ cơ bản.

Cải thiện các dịch vụ dịch thuật hiện có

Khi bạn xuất bản một bản dịch với Content Translation bạn đang giúp cải thiện dịch vụ dịch vụ. Mọi chỉnh sửa bạn thực hiện đối với bản dịch máy ban đầu đều được hiển thị thông qua API và dữ liệu và có thể được sử dụng để cải thiện các dịch vụ hiện có. Ngoài ra, một số dịch vụ dịch thuật được liệt kê ở trên cung cấp những cách cụ thể bạn có thể đóng góp cho các dự án của họ.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT là một hệ thống dịch thuật máy thần kinh nguồn mở được đào tạo với tài liệu đa ngôn ngữ được cấp phép miễn phí và có sẵn trực tuyến. Bộ phận mở này được sử dụng để đào tạo hệ thống dịch, và mở rộng bộ phận sẽ dẫn đến dịch thuật tốt hơn. Nội dung được tạo bằng cách sử dụng Content Translation là được tích hợp tự động trong corpus, nhưng bạn có thể đóng góp để mở rộng corpus hơn nữa:

  • Đề xuất các nguồn mới được tích hợp vào các nguồn mở. Bạn có thể liên hệ với Jörg Tiedemann để đề xuất một nguồn dữ liệu mới để mở rộng cơ quan.
  • Đưa ra tài liệu trực tiếp (vẫn là một nguyên mẫu sơ bộ). Bạn có thể tải lên các tài liệu được dịch trong nhiều định dạng khác nhau bao gồm các trang web được dịch để được kết hợp vào bộ phận.
  • Hãy thử các mô hình ngôn ngữ tại địa phương với OPUS-CAT (được dùng cho Windows)
  • Tham gia vào các dự án khác đóng góp dịch của họ vào cơ quan mở này như Tatoeba, một cộng đồng trực tuyến mở thu thập dịch cho các câu trong nhiều ngôn ngữ.

OpusMT dựa trên MarianNMT cũng là một dự án nguồn mở. Những người có kiến thức kỹ thuật và quan tâm đến việc học máy cũng có thể đóng góp để cải thiện nó.

Khai mạc

Apertium là một hệ thống dịch thuật dựa trên quy tắc nguồn mở. Bạn có thể đóng góp vào dự án bằng cách mã hóa các quy tắc ngôn ngữ của ngôn ngữ của bạn. Quá trình này đòi hỏi cả kiến thức ngôn ngữ và kỹ thuật tiên tiến, nhưng bạn có thể nhận được sự hỗ trợ từ nhóm Apertium để mở rộng hỗ trợ dịch cho một cặp ngôn ngữ mới.

Google Dịch

Google Dịch không phải là một dự án nguồn mở, nhưng vẫn có nhiều cách để người dùng đóng góp:

Mở rộng hỗ trợ ngôn ngữ với các dịch vụ dịch thuật mới

Việc dịch nội dung đã được thiết kế như một nền tảng có thể mở rộng. Vì vậy, có thể phát triển các khách hàng mới để tích hợp các dịch vụ dịch thuật bổ sung. Một số cân nhắc về cách dịch vụ dịch thuật được tích hợp:

  • Bản dịch máy và các bản sửa lỗi của người dùng được công bố như một phần của dữ liệu về bản dịch đã công bố, có thể cung cấp nguồn tài nguyên hữu ích để tạo hoặc cải thiện dịch vụ dịch thuật của bạn.
  • Các dịch vụ bên ngoài tích hợp chỉ nhận nội dung wiki có sẵn công khai và trả lại phiên bản dịch của nội dung đó tương thích với các giấy phép được sử dụng trong wiki. Không có thông tin cá nhân được chia sẻ với các dịch vụ dịch vụ.

Những phản hồi về sự hỗ trợ cho mỗi ngôn ngữ rất hữu ích. Xin vui lòng cho chúng tôi biết nếu bạn thiếu hỗ trợ cho một số ngôn ngữ, hoặc nếu có các tùy chọn chất lượng cao hơn cho nó. Bạn có thể cung cấp phản hồi như vậy trên trang thảo luận dự án hoặc trong phiếu này.


Bản dịch máy ban đầu

Việc dịch máy không hoàn hảo khi được dự định là kết quả cuối cùng. Tuy nhiên, nhiều người dùng thấy nó rất hữu ích như một điểm khởi đầu. Xin đảm bảo xem lại nội dung từ những quan điểm khác nhau:

  • Hãy chắc chắn rằng ý nghĩa ban đầu vẫn được giữ vững.
  • Kiểm tra rằng không có thông tin nào thiếu, đặc biệt là đối với các yếu tố như liên kết, tham chiếu và mẫu bao gồm thông tin không phải lúc nào cũng hiển thị trên bề mặt.
  • Đọc nội dung được dịch để đảm bảo nó đọc tự nhiên như một trang độc lập.

Hạn chế với các phần tử phức tạp

Trong một số trường hợp, nội dung có thể không xuất hiện trong bản dịch như mong đợi:

  • Một số dịch vụ được hỗ trợ chỉ hoạt động với văn bản đơn giản. Điều này có nghĩa là định dạng và các yếu tố nội dung phong phú như liên kết và trích dẫn từ bài viết ban đầu bị mất trong bản dịch, và bản dịch nội dung cần đoán những yếu tố đó thuộc về văn bản được dịch. Việc thêm lại các yếu tố đó không phải lúc nào cũng hoàn hảo và một số yếu tố có thể ở vị trí sai hoặc được áp dụng cho phần sai của văn bản.
  • Các yếu tố phức tạp như tham chiếu hoặc mẫu có thể sử dụng cấu trúc khác nhau trong mỗi ngôn ngữ, khiến việc chuyển nội dung từ một ngôn ngữ sang ngôn ngữ khác trở nên khó khăn. Hãy chắc chắn xem xét nội dung bên trong các yếu tố đó để đảm bảo không có thông tin quan trọng bị thiếu.

Thực thi việc xem xét bản dịch máy

Có một số cơ chế tự động để thực thi việc xem xét nội dung ban đầu. Bằng cách này, công cụ này đảm bảo rằng bản dịch tự động đầu tiên được xem xét đủ trước khi các nội dung được xuất bản.