Βοήθεια: Μετάφραση περιεχομένου/Μετάφραση/Ποιότητα μετάφρασης
| Σημείωση: Όταν επεξεργάζεστε αυτή τη σελίδα, συμφωνείτε να απελευθερώσετε τη συνεισφορά σας υπό την CC0. Δείτε τις Σελίδες Βοήθειας για το Κοινό Κτήμα για περισσότερες πληροφορίες. |
Κατά τη δημιουργία μιας μετάφρασης, είναι απαραίτητο να ελέγξετε το περιεχόμενο πριν τη δημοσίευσή του. Πρέπει να βεβαιωθείτε ότι το περιεχόμενο που παράγεται δεν αλλάζει το αρχικό νόημα με ακούσιο τρόπο και να βεβαιωθείτε ότι διαβάζεται φυσικά στη γλώσσα προορισμού. Η αρχική αυτόματη μετάφραση που παρέχεται βοηθά στην επιτάχυνση της διαδικασίας μετάφρασης με ένα χρήσιμο σημείο εκκίνησης, αλλά το εργαλείο ενθαρρύνει τους χρήστες να ελέγξουν και να επεξεργαστούν σημαντικά το αρχικό περιεχόμενο.
Πολλά μηχανισμοί έχουν ως στόχο να εξασφαλιστεί ότι οι μεταφραστές επεξεργάζονται τις αρχικές μεταφράσεις κατάλληλα. Το πρόγραμμα επεξεργασίας μετάφρασης παρακολουθεί πόσο από την αρχική μετάφραση έχει τροποποιηθεί από τον χρήστη και ορίζει διαφορετικά όρια που είτε εμποδίζουν τη δημοσίευση είτε προειδοποιούν τους χρήστες να τους ενθαρρύνουν να ελέγξουν περαιτέρω το περιεχόμενο.
Με αυτόν τον τρόπο, το εργαλείο επιτρέπει στους χρήστες να αξιοποιούν σωστά την αρχική μηχανική μετάφραση, αποτρέποντας παράλληλα τη δημιουργία ελαφρώς αναθεωρημένων, χαμηλής ποιότητας αποτελεσμάτων. Οι λεπτομέρειες αυτές παρουσιάζονται παρακάτω, για να δούμε πώς λειτουργούν αυτά τα όρια, πώς μπορούν να προσαρμοστούν στις ανάγκες κάθε γλώσσας και πώς να μετρηθεί η ποιότητα του περιεχομένου που παράγεται με το εργαλείο.
Όρια για την ενθάρρυνση της αναθεώρησης της μετάφρασης
Content translation tool measures the percentage of modifications that users make to the initial automatic translation provided. Με αυτόν τον τρόπο, το σύστημα γνωρίζει πόσες λέξεις έχουν προστεθεί, αφαιρεθεί ή τροποποιηθεί από την αρχική μετάφραση. Οι μετρήσεις γίνονται σε δύο διαφορετικά επίπεδα: για κάθε παράγραφο και για ολόκληρη την μετάφραση. Σε κάθε επίπεδο εφαρμόζονται διαφορετικά όρια, όπως περιγράφεται παρακάτω.
Όρια για όλη τη μετάφραση

Η δημοσίευση αποκλείεται εάν το 95% ή περισσότερο του ολόκληρου εγγράφου αποτελείται από μη τροποποιημένο, ή μεταφρασμένο από μηχανικό περιεχόμενο. Αυτό το όριο εμποδίζει τις μηχανικές μεταφράσεις που είναι σχεδόν πρώτες ύλες και αποφεύγει σαφείς βανδαλισμούς. Επίσης, εμποδίζει τους χρήστες να προσθέτουν απλώς περιεχόμενο, χωρίς να επεξεργάζονται το τμήμα μηχανικής μετάφρασης. Όπως αναγράφεται παρακάτω, το όριο αυτό μπορεί να προσαρμοστεί ανά γλώσσα.
Όρια για κάθε παράγραφο

Το ποσοστό των τροποποιήσεων από τους χρήστες μετράται επίσης για κάθε παράγραφο. Το ποσοστό των τροποποιήσεων χρήστη μετράται επίσης για κάθε παράγραφο. Μια παράγραφος θεωρείται προβληματική όταν περιέχει περισσότερο από το 85% της αρχικής αυτόματης μετάφρασης (ή, κατά την αντιγραφή του περιεχομένου από το έγγραφο προέλευσης, περιέχει περισσότερο από το 60% μη τροποποιημένου περιεχομένου).
Το πρόγραμμα επεξεργασίας μετάφρασης θα εμφανίζει μια προειδοποίηση για κάθε παράγραφο που θεωρείται προβληματική, ενθαρρύνοντας περαιτέρω αλλαγές από τον χρήστη. Σε ορισμένες περιπτώσεις, οι χρήστες εξακολουθούν να μπορούν να δημοσιεύουν, αλλά η σελίδα που προκύπτει μπορεί να προστεθεί σε μια κατηγορία παρακολούθησης δυνητικά μη ελεγμένων μεταφράσεων για έλεγχο από την κοινότητα. Σε άλλες περιπτώσεις, οι χρήστες ενδέχεται να μην τους επιτρέπεται να δημοσιεύουν καθόλου.
Ακολουθούν ορισμένοι από τους παράγοντες που λαμβάνονται υπόψη για να καθοριστεί εάν θα επιτρέπεται στους χρήστες να δημοσιεύουν ή όχι (ορισμένοι από τους οποίους βρίσκονται ακόμη σε εξέλιξη):
- Ο αριθμός των προβληματικών παραγράφων. Οι χρήστες δεν επιτρέπεται να δημοσιεύουν μεταφράσεις με 50 ή περισσότερες προβληματικές παραγράφους. Επιτρέπεται η δημοσίευση μεταφράσεων με λιγότερες από 50 προβληματικές παραγράφους, αλλά αυτές με 10 έως 49 προβληματικές παραγράφους θα προστεθούν σε μια κατηγορία παρακολούθησης δυνητικά μη ελεγχόμενων μεταφράσεων για έλεγχο από την κοινότητα.
- Προηγούμενες διαγραμμένες μεταφράσεις. Για την αποφυγή επαναλαμβανόμενων προβλημάτων, το εργαλείο προσδιορίζει χρήστες των οποίων οι δημοσιευμένες μεταφράσεις διαγράφηκαν τις τελευταίες 30 ημέρες και επιβάλλει πολύ πιο αυστηρούς περιορισμούς στις επόμενες μεταφραστικές τους προσπάθειες. Για τους χρήστες αυτής της κατηγορίας, αποτρέπεται η δημοσίευση μεταφράσεων με 10 προβληματικές παραγράφους ή περισσότερες, ενώ εκείνες με 9 ή λιγότερο προβληματικές παραγράφους προστίθενται σε μια κατηγορία παρακολούθησης δυνητικά μη ελεγμένων μεταφράσεων για έλεγχο από την κοινότητα.
- Επιβεβαίωση χρήστη. Ένα λιγότερο αυστηρό όριο λαμβάνεται υπόψη για τις παραγράφους που ο χρήστης επισημαίνει ως επιλυμένες—λαμβανόμενη ως ένδειξη ότι ο χρήστης εξέτασε και επιβεβαίωσε την κατάσταση της μετάφρασης. Για τις παραγράφους όπου εμφανίζεται η προειδοποίηση μη τροποποιημένου περιεχομένου, αλλά ο χρήστης την επισημαίνει ως επιλυμένη, εφαρμόζεται ένα λιγότερο αυστηρό όριο (αποδοχή 95% της μηχανικής μετάφρασης ή 75% του περιεχομένου πηγής). Αυτό θα παρέχει έναν τρόπο αντιμετώπισης περιπτώσεων όπου η αυτόματη μετάφραση ήταν εξαιρετικά καλή, αλλά θα αποφευχθεί η πιθανή κατάχρηση της λειτουργίας (δηλαδή, να μην ακολουθείτε τυφλά την επιβεβαίωση ενός χρήστη).
Περιεχόμενα που δεν επηρεάζονται από τα όρια
Ορισμένο περιεχόμενο δεν αναμένεται να υποστεί σημαντική επεξεργασία και, επομένως, δεν λαμβάνεται υπόψη κατά την εφαρμογή των ορίων που περιγράφονται παραπάνω. Οι πολύ σύντομοι τίτλοι ενοτήτων, οι παραπομπές ή ο κατάλογος των αναφορών εξαιρούνται από τον έλεγχο. Διαφορετικά, οι χρήστες θα μπορούσαν να λάβουν παραπλανητικές προειδοποιήσεις σχετικά με την μετάφραση περιεχομένου που δεν πρέπει να είναι, όπως τίτλοι βιβλίων που εμφανίζονται σε αναφορές ή άλλα κατάλληλα ονόματα.
Όρια στην εμπειρία χρήσης κινητού
Για την εμπειρία σε κινητά, το αρχικό σύνολο ορίων ακολουθεί μια απλούστερη προσέγγιση. Αυτή τη στιγμή, λαμβάνεται υπόψη μόνο το συνολικό ποσοστό μη τροποποιημένης μηχανικής μετάφρασης για ολόκληρη την μετάφραση. Στο κινητό, ολόκληρη η μετάφραση αποτελείται από μόνο μια ενότητα του λήμματος.
Συγκεκριμένα, εμφανίζεται μια προειδοποίηση όταν το ποσοστό μη τροποποιημένης μηχανικής μετάφρασης είναι πάνω από 85% για ολόκληρη την ενότητα και η δημοσίευση εμποδίζεται όταν το ποσοστό μη τροποποιημένης μηχανικής μετάφρασης είναι πάνω από 95%.
Η ενημέρωση σχετικά με το πώς λειτουργούν τα συστήματα περιορισμών στο πλαίσιο των κινητών θα ήταν πολύ χρήσιμη για να καθοριστεί η εξέλιξη αυτής της αρχικής προσέγγισης.
Δημοσίευση γρήγορων, μη ελεγμένων μεταφράσεων
Οι εκστρατείες και οι διαγωνισμοί μπορούν να οδηγήσουν σε εξάρσεις μεταφράσεων όπου κάποιοι χρήστες που δεν γνωρίζουν τις πολιτικές της κοινότητας μπορεί να επικεντρωθούν στην δημιουργία πολλών μεταφράσεων και να μην δίνουν αρκετή προσοχή για να αναθεωρήσουν το περιεχόμενό τους. Για να τονιστεί η ποιότητα πάνω από την ποσότητα, έχει καθοριστεί ένας μηχανισμός για τον περιορισμό της δημοσίευσης των γρήγορων μη αναθεωρημένων μεταφράσεων.
Αφού ένας χρήστης μεταφράσει ένα μεγάλο λήμμα, η επόμενη μετάφραση μπορεί να ξεκινήσει μόνο μετά από κάποιο χρονικό διάστημα. Η εκτίμηση της περιόδου αναμονής λαμβάνει υπόψη 1 λεπτό ανά παράγραφο έως και 10 λεπτά. Αυτό είναι:
- Για λήμματα με 10 παραγράφους ή λιγότερες, θέλουμε να βεβαιωθούμε ότι οι χρήστες αφιέρωσαν τουλάχιστον N λεπτά (ένα λεπτό ανά παράγραφο) για να τα μεταφράσουν.
- Για λήμματα με περισσότερες από 10 παραγράφους, θέλουμε να βεβαιωθούμε ότι οι χρήστες αφιέρωσαν τουλάχιστον 10 λεπτά για να τα μεταφράσουν.
Αυτό εφαρμόστηκε αρχικά σε κινητά, καθώς πρόκειται για έναν χώρο με λιγότερη δραστηριότητα και, αφού μετρήσουμε τον αντίκτυπο, θα εξετάσουμε το ενδεχόμενο επέκτασης και σε υπολογιστές.
Προσαρμογή των ορίων
Τα όρια που περιγράφονται παραπάνω παρέχουν ένα σύνολο γενικών μηχανισμών, αλλά μπορεί να χρειαστεί προσαρμογή ανάλογα με τις ιδιαίτερες ανάγκες κάθε wiki. Με βάση την αρχική αξιολόγηση, το ποσό της τροποποίησης που απαιτείται για την αρχική μηχανική μετάφραση μπορεί να κυμαίνεται από 10% έως 70%, ανάλογα με το ζεύγος γλωσσών. Σε ορισμένα wiki, τα προεπιλεγμένα όρια ενδέχεται να είναι πολύ αυστηρά, δημιουργώντας περιττό θόρυβο ή εμποδίζοντας τη δημοσίευση απολύτως έγκυρων μεταφράσεων. Σε άλλα wiki, τα όρια μπορεί να μην είναι αρκετά αυστηρά, επιτρέποντας την έκδοση μεταφράσεων που δεν έχουν επεξεργαστεί αρκετά.
Η προσαρμογή των διαφορετικών κατώτατων ορίων επιτρέπει σε κάθε wiki να προσαρμόζει τα όρια του εργαλείου σύμφωνα με τις ιδιαίτερες ανάγκες του. Η ανταπόκριση από τους φυσικούς ομιλητές είναι απαραίτητη για την ορθή προσαρμογή των ορίων που επιβάλλονται. Εάν τα τρέχοντα όρια δεν φαίνεται να λειτουργούν καλά με βάση την εμπειρία σας στη δημιουργία ή την αναθεώρηση μεταφράσεων, μοιραστείτε τα σχόλιά σας και μπορούμε να διερευνήσουμε πώς να τα προσαρμόσουμε καλύτερα.
Όταν παρέχετε σχόλια σχετικά με την προσαρμογή των ορίων, συνιστούμε να δημιουργήσετε πρώτα πολλά παραδείγματα μεταφράσεων (φροντίστε να ελέγξετε τις επιλογές δημοσίευσης εάν η δοκιμή σας δεν προορίζεται για δημοσίευση ως κανονικό περιεχόμενο). Όταν εξετάζετε πώς λειτουργούν τα όρια για τη γλώσσα σας, είναι χρήσιμο να έχετε υπόψη σας τα ακόλουθα:
- Ελέγξτε και τις δύο περιπτώσεις. Βεβαιωθείτε ότι έχετε ελέγξει πώς λειτουργούν τα όρια και για τις δύο: μεταφράσεις όπου το περιεχόμενο δεν έχει υποστεί αρκετή επεξεργασία, σε αντίθεση με μεταφράσεις όπου έχουν υποστεί αρκετή επεξεργασία. Με αυτόν τον τρόπο, μπορείτε πιο εύκολα να βρείτε τη σωστή ισορροπία για τη λειτουργία ορίων του εργαλείου. Η εξέταση ενός μόνο τύπου προβλήματος μπορεί να οδηγήσει στην υπερβολική μετατόπιση των κατώτατων ορίων προς την αντίθετη κατεύθυνση.
- Ελέγξτε διαφορετικό περιεχόμενο. Το περιεχόμενο στα wiki μας είναι εξαιρετικά ποικιλόμορφο και η μηχανική μετάφραση μπορεί να λειτουργεί πολύ καλύτερα σε ορισμένες περιπτώσεις σε σύγκριση με άλλες. Για παράδειγμα, περιεχόμενο που είναι γεμάτο με αριθμητικά δεδομένα ή τεχνικά ονόματα μπορεί να απαιτεί λιγότερη επεξεργασία από τους χρήστες σε σχέση με το περιεχόμενο με πιο περιγραφικό κείμενο. Βεβαιωθείτε ότι έχετε δοκιμάσει μεταφράζοντας μια ποικιλία διαφορετικών τύπων λημμάτων, ποικίλου μήκους, με ανόμοιο περιεχόμενο.
- Prepare to iterate. Adjusting the thresholds is an iterative process.
It may require custom adjustments to the thresholds or that you improve your general approach. In any case, after each change, further testing may be needed to verify the improvements made.
Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community was able to significantly reduce the number of problematic translations they were receiving by restricting the publication of translations with more than 70% of unmodified machine translation content. Similar adjustments have been made for Telugu and Assamese language wikis. There is no automatic tool that is infallible, and these limits are not an exception.
The process of content review by the community is still essential, but these limits provide communities with a tool to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.
Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for communities to easily find articles that have been published with some content exceeding the recommended limits.
You can find this category in the list of tracking categories on each wiki. Using it, you can track articles that passed the limits preventing publication, but that still had some paragraphs that were edited less than expected. For example the Indonesian Wikipedia's category includes articles that have less than 40% of machine translation overall, but which have some paragraphs with more than 80% of unmodified machine translation.
Measuring translation quality
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful measure for estimating whether the content created was good enough for the community involved not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. This suggests that it may not be practical to set the limits for participation through translating much higher than those set for other ways of article creation.
Find published translations
Content translation adds a contenttranslation edit tag to the published translations. This allows communities the ability to use Recent changes, and similar tools, to focus on pages created using the translation tool. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.
Inspect a specific translation
The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.
Other limits based on user expertise

Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low-quality translations.
For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article.
Newer editors can still publish translated articles in the User: or Draft: namespaces, and then move the article to the mainspace.
This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.
Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low-quality translations, while still allowing publication by editors making good translations.