Help:Content translation/Translating/Translation quality/ko

번역할 때 번역을 게시하기 전에 반드시 내용을 검토해야 합니다. 당신은 번역된 내용이 본래 의미를 변경하지 않는지 그리고 번역할 언어로 자연스럽게 읽힐 수 있는지 확인할 필요가 있습니다. 초기 기계 번역은 유용한 시작점으로서 번역 과정의 속도를 높이는데 도움을 주지만 그 도구는 사용자가 초기 내용을 검토하고 상당한 부분 편집하기를 권장합니다.

다른 메커니즘은 번역기가 적절하게 초기 번역을 편집했는지 보장합니다. 번역 편집기는 사용자가 초기 번역을 얼마나 수정했는지 추적하고 게시를 방지하기 위해 다른 제한을 정의하거나 사용자에게 콘텐츠를 추가로 검토하도록 경고합니다.

이러한 방식으로 이 도구를 사용하면 사용자가 기계 번역을 잘 활용할 때 기계 번역을 사용할 수 있으며, 가볍게 검토된 저품질 번역이 생성되는 것을 방지 할 수 있습니다. 이러한 제한이 작동하는 방식, 각 언어의 요구 사항에 맞게 조정하는 방법, 도구로 생성 된 콘텐츠의 품질을 측정하는 방법에 대한 자세한 내용은 아래에 제공됩니다.

번역 검토 권장 제한
콘텐츠 번역은 사용자가 제안된 초기 기계 번역에 대한 수정 비율을 측정합니다. 이러한 방식으로 시스템은 초기 번역에서 추가, 제거 또는 수정 된 단어 수를 인식합니다. 이러한 측정은 각 단락과 전체 번역의 두 가지 수준에서 이루어집니다. 아래에 설명 된대로 각 수준에 다른 제한이 적용됩니다.

전체 번역에 대한 제한
전체 문서에 대해 99 % 이상의 수정되지 않은 내용이 포함 된 번역을 게시 할 수 없습니다. 이 제한은 가장 명확한 기물 파손 행위를 차단하기위한 것입니다. 이렇게하면 사용자가 번역에 단락을 추가하고 편집하지 않고 게시하는 것을 방지 할 수 있습니다. 아래에 설명 된대로이 제한은 언어별로 조정할 수 있습니다.

각 단락에 대한 제한
각 단락에 대해 사용자 수정 비율도 측정됩니다. 단락에 초기 기계 번역의 85 % 이상이 포함 된 경우 (또는 원본 문서의 내용을 복사 할 때 수정되지 않은 내용의 60 % 이상이 포함 된 경우) 단락은 문제가있는 것으로 간주됩니다.

번역 편집기는 문제가 있는 각 단락에 대해 경고를 표시하여 사용자가 추가로 편집하도록 권장합니다. 경우에 따라 사용자는 여전히 게시 할 수 있지만 결과 페이지는 커뮤니티에서 검토할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가 될 수 있습니다. 다른 경우에는 사용자가 게시 할 수 없습니다.

다음은 사용자의 게시를 허용할지 여부를 결정하는 데 고려되는 몇 가지 요소입니다 (일부는 아직 개발 중입니다).


 * '' '문제가있는 문단의 수'. '사용자는 문제가있는 문단이 50 개 이상인 번역을 게시 할 수 없습니다. 사용자는 여전히 문제가있는 단락이 50 개 미만인 번역을 게시 할 수 있지만 문제가있는 단락이 10 ~ 49 개인 번역은 커뮤니티에서 검토 할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가됩니다.
 * '' '이전에 삭제된 번역'. '지난 30 일 동안 일부 번역이 삭제된 사용자의 경우 반복되는 문제를 방지하기 위해 제한이 훨씬 더 엄격 해집니다. 이 경우 문제가 있는 단락이 10개 이상인 번역은 게시가 금지되고, 문제가 있는 단락이 9 개 이하인 번역은 커뮤니티에서 검토 할 수 있도록 잠재적으로 검토되지 않은 번역의 추적 범주에 추가됩니다.
 * '' '사용자 확인' '사용자가 번역 상태를 검토하고 확인했다는 신호로 사용자가 해결 된 것으로 표시된 단락에 대해 덜 엄격한 임계 값이 고려됩니다. 수정되지 않은 콘텐츠 경고가 표시되었지만 사용자가 해결된 것으로 표시 한 단락의 경우 덜 엄격한 임계 값을 적용합니다 (기계 번역의 95 % 또는 소스 콘텐츠의 75 % 허용). 그는 자동 번역이 예외적으로 훌륭하지만 기능의 잠재적 인 남용을 피할 수있는 방법을 제공 할 것입니다 (즉, 사용자 확인을 맹목적으로 따르지 않음).

제한의 영향을받지 않는 콘텐츠
일부 내용은 크게 편집되지 않을 것으로 예상되며, 위에서 설명한 제한을 적용 할 때 고려되지 않습니다. 매우 짧은 섹션 제목, 인용 또는 참고 문헌 목록은 검사에서 제외됩니다. 그렇지 않으면 사용자가 번역 할 것으로 예상되지 않은 참조 문헌의 책 제목과 같은 내용으로 인해 오해의 소지가있는 경고를받을 수 있습니다.

한계 조정
위에서 설명한 제한은 일반적인 메커니즘 집합을 제공하지만 각 위키의 특정 요구에 맞게 조정해야 할 수 있습니다. 초기 평가에 따르면 초기 기계 번역에 필요한 수정 정도는 언어 쌍에 따라 10 %에서 70 %까지 다양합니다. 일부 위키에서는 기본 제한이 너무 엄격하여 불필요한 소음이 발생하거나 완벽하게 유효한 번역이 게시되지 않을 수 있습니다. 다른 위키에서는 제한이 충분히 엄격하지 않아 충분히 편집되지 않은 번역을 게시 할 수 있습니다.

다른 임계 값을 조정하면 각 위키의 필요에 따라 이러한 제한을 다소 엄격하게 만들 수 있습니다. 한계를 적절하게 조정하려면 원어민의 피드백이 필수적입니다. 번역을 만들거나 검토 한 경험을 바탕으로 현재 제한이 제대로 작동하지 않는 것 같으면 피드백 공유하여 더 나은 조정 방법을 알아볼 수 있습니다.

임계값 조정에 대한 피드백을 제공할 때 여러 예제 번역을 만드는 것이 좋습니다 (테스트가 일반 콘텐츠로 게시되지 않을 경우 게시 옵션 확인 확인). When testing how the limits work for your language, it is useful to keep in mind the following:


 * Check for both cases. Make sure to check how the limits work for translations where the content has not been edited enough and also for those where the initial translation has been edited enough. In this way you can more easily find the right balance for the limits. Checking only one type of problem can lead you to suggest moving the thresholds too far in the opposite direction.
 * Check different contents. Content in a wiki is very diverse, and machine translation may work much better for some cases compared to others. For example, content full of numeric data or technical names may require less editing by users than content with more descriptive text. Make sure to test with different articles, making translations of different lengths and involving different types of content.
 * Prepare to iterate. Adjusting the thresholds is an iterative process. It may require to make a custom adjustment to the thresholds or improve the general approach. In any case, after each change further testing may be needed to verify the improvements.

Adjusting the limits in collaboration with editors has proven to be effective. For example, initial results show that the Indonesian community has reduced significantly the number of problematic translations by restricting the publication of translations with more than 70% of unmodified machine translation. Similar adjustments have been made for Telugu and Assamese There is no automatic tool that is infallible, and these limits are not an exception.

The process of content review by the community is still essential, but these limits provide communities with tools to reduce the number of translations they have to focus on, making the review process much more effective. Please share your feedback and we can explore how to better adjust them.

Tracking potentially unreviewed translations
A tracking category with the name "cx-unreviewed-translation-category" is provided for the community to easily find the articles that were published with some content exceeding the recommended limits.

You can find this category in the list of tracking categories on each wiki. There you can find the articles that passed the limits that prevent publishing but had still some paragraphs that have been edited less than expected. For example the Indonesian category includes articles that have less than 40% of machine translation overall but have some paragraphs with more than 80% of unmodified machine translation.

Measuring translation quality
Evaluating content quality automatically is not trivial. Deletion ratios provide a useful estimation on whether the content created was good-enough for the community of editors not to delete it. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted compared to an initial version of the article created from scratch. This suggests that it may not be practical to set the limits for participation by translating much higher than those set for other ways of article creation.

Find published translations
Content translation adds a contenttranslation edit tag to the published translations, for communities to be able to focus on the translations created with the tool using Recent changes and similar tools. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

Inspect a specific translation
The Translation debugger is a tool that allows to inspect some metadata for a given translation, including the percentage of machine translation used for the whole document or the translation service used for each paragraph.

Other limits based on user expertise


Some wikis have implemented other restrictions for translating based on the user rights as a way to reduce the creation of low quality translations. For example, English Wikipedia requires users to be extended confirmed, which means they need to make 500 edits on English Wikipedia before they are allowed to publish a translation as an article. Newer editors can still publish translated articles in the  or   namespaces, and then move the article to the mainspace.

This restriction was created before the system of limits described in this page was available, and it is not the recommended approach to encourage the creation of good quality translations.

Before adding restrictions that do not take into account the content created, consider going through the process of adjusting the limits of unmodified content as described above. The limits can be made as strict as needed to prevent low quality translations, while still allowing editors making good translations to publish them.