도움:내용 번역/번역/초기 기계 번역

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 78% complete.
PD 주의사항: 이 문서를 편집하면 CC0에 따라 당신의 기여한 것을 배포하는 데 동의하는 것으로 간주됩니다. 자세한 내용은 퍼블릭 도메인 도움말 문서를 확인 하세요. PD

번역에 새 단락을 추가할 때 처음부터 시작하거나 자동 번역을 시작점으로 사용할 수 있습니다. 가능한 경우 기계 번역이 기본적으로 초기 번역으로 사용됩니다. 다양한 옵션, 사용 가능 여부에 대한 세부 정보 및 기계 번역 사용 시 고려 사항이 아래에 설명되어 있습니다.

초기 번역 옵션

도구 열의 "초기 번역" 옵션을 사용하면 각 단락의 시작 지점으로 사용할 초기 콘텐츠를 결정할 수 있습니다. 사용 가능한 옵션은 다음과 같습니다.

  • "기계 번역 서비스"를 사용하세요.이렇게 하면 원래 단락의 자동 번역 버전으로 시작할 수 있습니다. 이러한 옵션의 수와 이름은 다양합니다. 이러한 서비스에 대해 지원되는 언어에 따라 "Apertium 사용"또는 "Yandex 사용"과 같은 옵션을 사용할 수 있습니다 (자세한 내용은 다음 섹션 참조).
  • 원본 콘텐츠 복사 원본 문단이 번역에 복사됩니다. 콘텐츠는 원래 언어로 유지되지만 일부 요소는 대상 위키에 맞게 조정됩니다. 예를 들어, 링크는 대상 언어로 된 해당 기사를 가리키고 템플릿은 해당 기사로 변환됩니다. 번역가는 여전히 내용을 완전히 다시 작성해야 하지만 조정된 요소는 재사용하기가 더 쉬울 수 있습니다.
  • 빈 문단으로 시작하세요. 빈 문단으로 시작하는 것은 대체 콘텐츠를 입력하는 것보다 더 많은 작업이 필요한 경우에 유용할 수 있습니다.

각 단락이 서로 다른 종류의 콘텐츠에서 가장 잘 작동할 수 있으므로 각 단락에서 독립적으로 서로 다른 접근 방식간에 빠르게 전환할 수 있습니다. 다른 접근 방식간에 전환하면 단락에서 변경한 내용이 유지됩니다. 이런 식으로 원래 접근 방식으로 돌아가기로 결정한 경우 변경 사항을 잃을 염려없이 원본 편집을 시작한 경우에도 다른 접근 방식을 시도 할 수 있습니다. 이 컨텍스트에서는 두 가지 추가 옵션이 관련됩니다.

  • 번역 재설정 옵션은 제공된 초기 콘텐츠를 수정 한 경우 사용할 수 있습니다. 변경 사항을 취소하여 초기 콘텐츠를 복원할 수 있습니다.
  • 기본값으로 표시 옵션은 기본값이 아닌 단락에 대한 접근 방식을 선택할 때 사용할 수 있습니다. 번역에 추가되는 다음 단락에 대한 기본 접근 방식을 설정할 수 있습니다. 특정 번역 서비스가 일반적으로 기본 번역 서비스보다 더 잘 작동하는 경우 매우 편리할 수 있습니다.

기계 번역 가용성

콘텐츠 번역은 여러 번역 서비스를 통합하며 각 서비스는 서로 다른 언어 집합을 지원합니다. 지원되는 서비스는 지원되는 언어 목록에 대한 링크와 함께 아래에 나열되어 있습니다.

위의 언어 목록은 정보가 도구가 현재 작동하는 방식과 동기화되도록 구성 코드를 가리킵니다. 이 목록에는 초기 들여 쓰기 수준의 소스 언어에 대한 언어 코드와 그 아래에 지원되는 모든 대상 언어의 코드가 표시됩니다.

You can also check the available services for a specific language pair using our APIs. In this example for the Spanish-Catalan pair, you can see that Apertium is the default service (first in the list) among the other services available.

언어 사용은 관찰 된 결과와 커뮤니티 피드백을 기반으로 점진적으로 수행됩니다. 기계 번역이 기본 서비스에서 지원되더라도 아직 활성화되지 않았을 수 있습니다.

기존 번역 서비스 개선

내용 번역으로 번역을 게시하면 이미 번역 서비스가 개선되도록 돕고있는 것입니다. All the corrections you make to the initial machine translations are exposed through an API and data dumps and can be potentially used to improve existing services. 그 외에도 위에 나열된 일부 번역 서비스는 프로젝트에 기여할 수있는 특정 방법을 제공합니다.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT is an open source neural machine translation system that is trained with multilingual documents freely licensed and available online. 이 개방형 말뭉치는 번역 시스템을 교육하는 데 사용되며 말뭉치 확장은 더 나은 번역으로 이어질 것입니다. The contents generated by using Content Translation are integrated automatically in the corpus, but you can contribute to expand the corpus further:

  • Propose new sources to be integrated in the open corpus. You can contact Jörg Tiedemann to propose a new data source to expand the corpus.
  • 문서 직접 제출 (여전히 예비 프로토 타입).. 번역 된 웹 페이지를 포함하여 다양한 형식으로 번역 된 문서를 업로드하여 말뭉치에 통합 할 수 있습니다.
  • Try language models locally with OPUS-CAT (available for Windows)
  • Contribute to other projects that contribute their translations to this open corpus such as Tatoeba, an on-line open community collecting translation for sentences in many languages.

OpusMT is based on MarianNMT which is also an open source project. People with technical knowledge and interested in machine learning can also contribute to improve it.

Apertium

Apertium is an open source rule-based translation system. 언어의 언어 규칙을 인코딩하여 프로젝트에 기여할 수 있습니다. 이 프로세스에는 언어 및 고급 기술 지식이 모두 필요하지만 Apertium 팀의 지원을 받아 새로운 언어 쌍에 대한 번역 지원을 확장할 수 있습니다.

Google 번역

Google 번역은 오픈 소스 프로젝트가 아니지만 사용자가 다시 기여할 수있는 방법은 여전히 있습니다.

새로운 번역 서비스로 언어 지원 확장

콘텐츠 번역은 확장 가능한 플랫폼으로 설계되었습니다. So it is possible to develop new clients to integrate additional translation services. 번역 서비스가 통합되는 방식에 대한 몇 가지 고려 사항 :

  • Machine translations and the user corrections made are published as part of the data on published translations, which can provide a useful resource to create or improve your translation service.
  • 통합 된 외부 서비스는 공개적으로 사용 가능한 위키 콘텐츠 만 수신하고 위키에서 사용되는 라이선스와 호환되는 해당 콘텐츠의 번역 된 버전을 반환합니다. 번역 서비스와 개인 정보는 공유되지 않습니다.

각 언어별로 제공되는 지원에 대한 피드백은 매우 유용합니다. 일부 언어에 대한 지원이 누락되었거나 더 높은 품질의 옵션을 사용할 수 있는지 알려주십시오. You can provide such feedback on the project talk page or in this ticket.


기계 번역에 대한 고려 사항

기계 번역은 최종 결과물로 의도되었을 때 완벽하지 않습니다. 그러나 많은 사용자가 시작점으로 매우 유용하다고 생각합니다. 다음과 같은 다양한 관점에서 콘텐츠를 검토하십시오.

  • 원래의 의미가 유지되는지 확인하십시오.
  • 특히 표면에 항상 표시되지 않는 정보를 포함하는 링크, 참조 및 템플릿과 같은 요소의 경우 누락 된 정보가 없는지 확인합니다.
  • 번역된 내용을 읽고 독립적인 페이지처럼 자연스럽게 읽혀 지는지 확인하십시오.

복잡한 요소의 한계

경우에 따라 내용이 예상대로 번역에 나타나지 않을 수 있습니다.

  • 지원되는 일부 서비스는 일반 텍스트로만 작동합니다. 즉, 원본 기사의 링크 및 인용과 같은 서식 및 리치 콘텐츠 요소는 번역에서 손실되며 콘텐츠 번역은 번역 된 텍스트에서 해당 요소가 어디에 속하는지 추측해야합니다. 이러한 요소를 다시 추가하는 것이 항상 완벽한 것은 아니며 일부 요소가 잘못된 위치에 있거나 텍스트의 잘못된 부분에 적용될 수 있습니다.
  • 참조 또는 템플릿과 같은 복잡한 요소는 각 언어에서 다른 구조를 사용할 수 있으므로 한 언어에서 다른 언어로 콘텐츠를 전송하기가 어렵습니다. 누락 된 중요한 정보가 없는지 확인하기 위해 해당 요소 내부의 내용을 검토하십시오.

기계 번역 검토 시행

Several automatic mechanisms exist to enforce the review of the initial contents. 이러한 방식으로이 도구는 콘텐츠가 게시되기 전에 초기 자동 번역이 충분히 검토되었는지 확인합니다.