Trợ giúp:Biên dịch nội dung/Dịch thuật/Chất lượng dịch thuật

From mediawiki.org
Jump to navigation Jump to search
This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 96% complete.
Other languages:
Bahasa Indonesia • ‎Deutsch • ‎English • ‎Nederlands • ‎Tiếng Việt • ‎español • ‎français • ‎galego • ‎italiano • ‎português • ‎shqip • ‎svenska • ‎русский • ‎українська • ‎العربية • ‎中文 • ‎日本語

Khi tạo một bản dịch, nội dung của bản dịch cần được xem lại trước khi xuất bản. Bạn cần phải đảm bảo nội dung tạo ra không thay đổi ý nghĩa ban đầu của nó, và kiểm tra xem nó có tự nhiên trong ngôn ngữ mục tiêu hay không. Công cụ dịch máy ban đầu giúp đẩy nhanh quá trình dịch thuật bằng một điểm bắt đầu hết sức có ích, nhưng công cụ này khuyến khích người dùng xem lại và sửa đổi một cách đáng kể nội dung ban đầu.

Có những cơ chế khác nhau giúp đảm bảo rằng người dịch sửa đổi bản dịch ban đầu một cách thích hợp. Biên tập dịch thuật theo dõi xem bản dịch ban đầu được người dùng thay đổi bao nhiêu, và quyết định những giới hạn khác nhau để hoặc là ngăn chặn việc xuất bản, hoặc là cảnh báo người dùng để khuyến khích họ xem lại thêm nữa nội dung bản dịch.

Bằng cách này, công cụ giúp người dùng có thể sử dụng dịch máy khi họ biết cách tận dụng nó, trong khi đó ngăn chặn việc tạo ra những bản dịch chất lượng thấp được xem lại một cách cẩu thả. Chi tiết thêm về cách những giới hạn này hoạt động, cách chúng có thể được điều chỉnh theo từng ngôn ngữ, và cách để đo đếm chất lượng nội dung được sinh ra bởi công cụ thì được trình bày ở bên dưới.

Giới hạn giúp khuyến khích xem lại bản dịch

Biên dịch nội dung tính toán phần trăm sửa đổi của người dụng đối với bản dịch máy được cung cấp ban đầu. Theo cách này, hệ thống biết xem có bao nhiêu từ đã được thêm vào, xóa đi hoặc thay đổi trong bản dịch ban đầu. Những biện pháp này được thực hiện ở hai cấp bậc: đối với mỗi đoạn văn hoặc đối với cả bản dịch. Có những giới hạn khác nhau được áp dụng cho mỗi cấp bậc, được nêu chi tiết dưới đây.

Giới hạn cho toàn bộ bản dịch

Sẽ hiện lên lỗi khi cố xuất bản một bản dịch có quá nhiều phần dịch máy chưa chỉnh sửa. Ngưỡng này sẽ được điều chỉnh cho người Indonesia dựa trên các phản hồi từ biên tập viên của họ.

Bạn không thể xuất bản một bản dịch với 99% hoặc hơn những nội dung chưa thay đổi đối với toàn bản dịch. Giới hạn này nhằm để ngăn chặn những loại phá hoại rõ ràng nhất. Điều này ngăn người dùng cứ thế thêm những đoạn văn vào bản dịch rồi xuất bản chúng mà chẳng sửa đổi gì hết. Giới hạn này có thể được điều chỉnh tùy theo từng ngôn ngữ, như là được trình bày chi tiết dưới đây.

Giới hạn cho từng đoạn văn

Sẽ có cảnh báo khi một đoạn văn nhất định có lượng dịch máy không chỉnh sửa vượt quá giới hạn.

Đối với mỗi đoạn văn, phần trăm sửa đổi của người dùng cũng sẽ được tính toán. Một đoạn văn được coi là có vấn đề khi đoạn văn đó chứa hơn 85% dịch máy ban đầu (hoặc, khi copy nội dung từ văn bản nguồn mà chứa trên 60% nội dung không chỉnh sửa).

Biên tập dịch thuật sẽ cho hiện một cảnh báo đối với mỗi đoạn văn được coi là có vấn đề, khuyến khích người dùng sửa đổi nó thêm. Trong một vài trường hợp người dùng vẫn sẽ có thể xuất bản, nhưng trang thành phẩm có thể được thêm một thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng có thể xem lại. Trong các trường hợp khác, người dùng có thể không được cho phép xuất bản.

Dưới đây là một trong những yếu tố cần cân nhắc khi quyết định liệu cho nên cho phép người dùng xuất bản hay không (một vài trong số đó vẫn đang trong quá trình phát triển):

  • Số lượng đoạn văn có vấn đề. Người dùng sẽ không được xuất bản bản dịch có hơn 50 hoặc hơn số đoạn văn có vấn đề. Người dùng vẫn có thể xuất bản bản dịch có ít hơn 50 đoạn văn có vấn đề, nhưng những bản dịch với 10-49 đoạn văn có vẫn đề vẫn sẽ được thêm thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng xem lại.
  • Bản dịch trước đó đã bị xóa. Đối với người dùng mà 30 ngày qua có bản dịch bị xóa thì giới hạn sẽ trở nên nghiêm khắc hơn để ngăn chặn việc tái diễn. Trong trường hợp đó, các bản dịch với 10 đoạn văn có vấn đề hoặc hơn thì sẽ không được xuất bản, trong khi đó có ít hơn 9 đoạn văn có vấn đề thì sẽ được thêm thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng xem lại.
  • Xác nhận từ người dùng. Một ngưỡng ít nghiêm khắc hơn sẽ được cân nhắc đối với những đoạn văn mà người dùng đánh dấu là đã giải quyết, như là một tín hiệu thông báo rằng người dùng đã xem lại và xác nhận tình trạng của bản dịch. Đối với những đoạn văn mà cảnh báo nội dung chưa chỉnh sửa hiện lên nhưng người dùng lại đánh dấu là đã giải quyết thì chúng tôi áp dụng một ngưỡng ít nghiêm khắc hơn (chấp nhận 95% Dịch máy hoặc 75% nội dung nguồn). Điều này sẽ cung cấp một cách để điều tiết các trường hợp mà dịch tự động tốt một cách cá biệt, nhưng vẫn ngăn chặn được khả năng lạm dụng tính năng này (ví dụ như không theo xác nhận của người dùng một cách mù quáng).

Những nội dung không bị ảnh hưởng bởi các giới hạn

Sẽ có những nội dung không cần phải sửa đổi một cách đáng kể, và chúng sẽ không được cân nhắc khi áp dụng các giới hạn được mô tả ở trên. Những tiêu đề đoạn cực ngắn, trích dẫn, hoặc danh sách tham khảo sẽ được loại bỏ khỏi cuộc kiểm tra. Nếu không thì, người dùng có thể sẽ nhận được những cảnh báo gây hiểu nhầm vì những nội dung ví dụ như là tiêu đề sách trong danh sách tham khảo mà họ không nên dịch.

Điều chỉnh các giới hạn

Những giới hạn mô tả ở trên cung cấp một bộ cơ chế chung, nhưng chúng có thể sẽ cần điều chỉnh để phù hợp với từng wiki. Dựa trên những đánh giá ban đầu, lượng sửa đổi cần đối với bản dịch máy ban đầu có thể dao động từ 10% đến 70% tùy thuộc vào cặp ngôn ngữ. Trên một số wiki, giới hạn mặc định có thể quá nghiêm khắc, gây ra những khó chịu không cần thiết hoặc ngăn cản việc xuất bản những bản dịch đúng nghĩa. Tại những wiki khác, giới hạn có thể lại không đủ nghiêm khắc, cho phép việc xuất bản những bạn dịch chưa được sửa đổi đủ.

Điều chỉnh những ngưỡng khác nhau cho phép khiến những giới hạn này thêm hoặc bớt nghiêm khắc tùy theo nhu cầu của mỗi wiki. Phản hồi từ người bản địa là cần thiết trong việc điều chỉnh những giới hạn một cách thích đáng. Nếu các giới hạn hiện tại dường như không hoạt động tốt dựa trên kinh nghiệm của bạn khi tạo hoặc xem xét bản dịch, vui lòng chia sẻ phản hồi của bạn và chúng tôi có thể khám phá cách điều chỉnh chúng tốt hơn.

Khi cung cấp phản hồi về việc điều chỉnh, chúng tôi khuyên bạn nên thử tạo một số bản dịch mẫu (đảm bảo kiểm tra các tùy chọn xuất bản nếu thử nghiệm của bạn không có ý định xuất bản dưới dạng nội dung thông thường). Khi kiểm tra cách các giới hạn hoạt động cho ngôn ngữ của bạn, sẽ hữu ích khi ghi nhớ những điều sau:

  • Kiểm tra cả hai trường hợp. Nhớ kiểm tra xem giới hạn hoạt động như thế nào cho các bản dịch mà nội dung chưa được sửa đổi đủ và đồng thời cả những bản dịch mà phần dịch ban đầu đã được sửa đổi đủ. Bằng cách này bạn có thể dễ dàng tìm ra được điểm cân bằng đúng cho các giới hạn. Chỉ kiểm tra một loại vấn đề có thể dẫn tới việc di chuyển ngưỡng ra quá xa về hướng ngược lại.
  • Kiểm tra những nội dung khác nhau. Nội dung trên một wiki thì rất đa dạng, và dịch máy có thể tốt hơn trong trường hợp này so với trường hợp khác. Ví dụ, nội dung có nhiều dữ liệu số hoặc tên kĩ thuật có thể sẽ cần ít đổi của người dùng hơn là những nội dung có nhiều đoạn mô tả. Nhớ thử các bài viết khác nhau, tạo các bạn dịch có độ dài khác nhau và chứa những loại nội dung khác nhau.
  • Sẵn sàng làm lại. Điều chỉnh các ngưỡng là một quá trình lặp đi lặp lại. Có thể sẽ cần phải có một sự điều chỉnh tùy chỉnh đối với các ngưỡng hoặc là cần phải cải thiện cách tiếp cận chung. Dù thế nào thì cứ sau mỗi thay đổi thì sẽ cần những sự thử nghiệm thêm nữa để xác minh xem có cải thiện gì hay không.

Cộng tác với các biên tập viên trong việc điều chỉnh các giới hạn thì đã được chứng minh là có hiệu quả. Ví dụ, kết quả ban đầu cho thấy cộng đồng Tiếng Indonesia đã giảm đáng kệ lượng bản dịch có vấn đề bằng cách giới hạn xuất bản bản dịch có hơn 40% phần dịch máy chưa chỉnh sửa. Những điều chỉnh tương tự đã được thực hiện cho tiếng Telugu và tiếng Assam Không có loại công cụ tự động nào mà luôn đúng, và những giới hạn này cũng không phải ngoại lệ.

Quá trình cộng đồng xem xét lại nội dung thì vẫn cần thiết, nhưng những gì hạn này cung cấp cho các cộng đồng một công cụ để làm giảm lượng bản dịch mà họ phải tập trung vào, khiến cho quá trình xem lại trở nên hiệu quả hơn. Hãy chia sẻ phản hồi của bạn và chúng ta có thể tìm hiểu cách để điều chỉnh chúng một cách tốt hơn.

Theo dõi các bản dịch có khả năng chưa được xem xét

Một thể loại theo dõi với tên "cx-unreviewed-translation-category" được cung cấp nhằm giúp cộng đồng dễ dàng tìm thấy các bài viết được xuất bản với một số nội dung vượt quá giới hạn được đề xuất.

Bạn có thể tìm thấy thể loại này trong danh sách các thể loại theo dõi trên mỗi wiki. Ở đó bạn có thể tìn thấy đã vượt qua giới hạn để được xuất bản nhưng vẫn còn một số đoạn đã được chỉnh sửa ít hơn mong đợi. Ví dụ, thể loại tiếng Indonesia bao gồm các bài viết có ít hơn 40% là dịch máy nói chung nhưng có một số đoạn với hơn 80% là dịch máy chưa sửa đổi.

Đánh giá chất lượng dịch thuật

Đánh giá chất lượng nội dung tự động không phải là nhỏ. Tỉ lệ xóa cung cấp ước tính hữu ích về việc nội dung được tạo ra có đủ tốt để các biên tập viên và công đồng không xóa nó. Dựa trên báo cáo phân tích tỉ lệ xóa, bài viết được tạo dưới dạng bản dịch ít khả năng bị xóa hơn là phiên bản đầu tiên của bài viết được tạo từ đầu Điều này cho thấy rằng có thể không thực tế khi đặt giới hạn tham gia bằng cách dịch thuật cao hơn nhiều so với việc đặt thiết lập cho những cách khác để tạo ra bài viết.

Find published translations

Biên dịch nội dung thêm thẻ sửa đổi contenttranslation vào các bản dịch được xuất bản, để cộng đồng có thể tập trung vào các bản dịch được tạo ra bằng công cụ sử dụng Thay đổi gần đây và các công cụ tương tự. Ngoài ra, dữ liệu về các bản dịch đã được xuất bảnsố liệu thống kê sử dụng dịch máy có sẵn cho bất cứ ai để phân tích.

Inspect a specific translation

Translation debugger example

The Translation debugger is a tool that allows to inspect some metadata for a given translation, including the percentage of machine translation used for the whole document or the translation service used for each paragraph.

Các giới hạn khác dựa trên kinh nghiệm của người dùng

Lỗi giới hạn xuất bản hiện ra khi dựa trên kinh nghiệm của người dùng Ví dụ này dựa trên quyết định của cộng đồng Wikipedia tiếng Anh về việc giới hạn chỉ cho phép người dùng được xác nhận mở rộng (30/500) tự động được phép xuất bản trực tiếp các bản dịch lên không gian chính

Một số Wiki sử dụng các giới hạn dịch thuật khác dựa trên quyền hạn của người dùng như một cách nhầm ngăn chặn việc tạo ra các bản dịch thuật chất lượng thấp. Ví dụ, Wikipedia Tiếng Anh yêu cầu người dùng phải có quyền xác nhận mở rộng, có nghĩa là họ cần đã thực hiện ít nhất 500 sửa đổi tại Wikipedia Tiếng Anh trước khi được phép xuất bản bản dịch thuật thành bài viết Người dùng mới vẫn có thể xuất bản bản bài viết dịch thuật trong User: hoặc không gian Nháp: (nếu có sẫn trên wiki của bạn), sau đó di chuyển bài viết lên không gian chính.

Hạn chế này được tạo trước khi giới hạn của hệ thống được mô tả trong trang này có sẵn và đó không phải là phương pháp được khuyến nghị để khuyến khích tạo ra các bản dịch tốt.

Trước khi thêm các hạn chế không tính đến nội dung do người dùng tạo ra, cân nhắc xem xét điều chỉnh giới hạn nội dung không sửa đổi được miêu tả ở trên. Các giới hạn có thể được sử dụng nghiêm ngặt khi cần thiết để ngăn chặn các bản dịch thuật chất lượng thấp, trong khi vẫn cho phép biên tập viên tạo ra các bản dịch thuật tốt để xuất bản.