Dịch nội dung/Dịch máy/Google Dịch

From mediawiki.org
This page is a translated version of the page Content translation/Machine Translation/Google Translate and the translation is 43% complete.

Hỗ trợ dịch máy cho Dịch thuật nội dung giờ đã được mở rộng hơn nữa. Ngoài Apertium, LingoCloud, Matxin, Yandex và Youdao, chúng tôi hiện đang thêm Google Dịch vào danh sách các hệ thống dịch máy (MT) có sẵn cho người dùng Dịch nội dung. Điều này sẽ thêm hỗ trợ dịch máy cho hơn 100 ngôn ngữ, bao gồm nhiều ngôn ngữ mới chưa được phục vụ trước đó bởi các hệ thống hiện có.

Google Dịch được cung cấp bởi Google - một công ty công nghệ đa quốc gia có trụ sở tại Hoa Kỳ. Nhiều nhóm trong Wikimedia Foundation và Google đã hợp tác để đưa ra một thỏa thuận cho phép sử dụng Google Dịch mà không ảnh hưởng đến chính sách phân bổ quyền, quyền riêng tư của người dùng và đại diện thương hiệu của Wikipedia. Vui lòng tìm thêm chi tiết về thỏa thuận bên dưới và chúng tôi rất vui khi được nghe bất kỳ câu hỏi nào bạn có thể có về dịch vụ này.

Các tính năng chính

  • Không có thông tin cá nhân nào được gửi đến Google Dịch. Hệ thống Dịch máy sẽ được truy cập thông qua các dịch vụ đám mây của Google. Nội dung bài viết (được cấp phép tự do) được gửi đến máy chủ Google từ máy chủ Wikimedia Foundation. Không có giao tiếp trực tiếp xảy ra giữa người dùng và các dịch vụ bên ngoài và không có thông tin cá nhân (IP, tên người dùng) được gửi đến máy chủ của Google. Client liên hệ với các máy chủ Google bằng mã nguồn mở và bạn có thể kiểm tra nó tại đây. Không có phần nào trong dịch vụ hoặc mã của Google sẽ là một phần của cơ sở hạ tầng Wikimedia hoặc cơ sở mã dịch nội dung. Để biết thêm chi tiết, xem sơ đồ thiết lập kỹ thuật ở cuối phần.
  • Thông tin được trả về từ Google Dịch theo giấy phép miễn phí. Khi Google Dịch được sử dụng, sẽ có phiên bản dịch nội dung Wikipedia theo giấy phép miễn phí. Người dùng có thể sửa đổi nó và xuất bản nó như một phần của Wikipedia mà không có xung đột với các chính sách hiện có. Nội dung kết quả được dịch bởi Google Dịch và các sửa đổi của người dùng sẽ có sẵn theo cùng một giấy phép được sử dụng cho phần còn lại của các bài viết trong Wikipedia.
  • Lợi ích của cộng đồng dịch thuật nguồn mở rộng hơn. Bản dịch thu được từ Google Dịch và sửa đổi người dùng sẽ được công khai. Các bản dịch được chỉnh sửa là mối quan tâm đặc biệt đối với cộng đồng nghiên cứu dịch thuật, những người có thể sử dụng tài nguyên này để tạo các dịch vụ dịch thuật mới để hỗ trợ các ngôn ngữ chưa có bản dịch máy nguồn mở. Điều này sẽ giúp các nhà phát triển tạo và cải thiện hệ thống dịch máy.
  • Người dùng có thể vô hiệu hóa nó. Dịch tự động là một công cụ tùy chọn trong Dịch thuật nội dung. Người dùng có một tùy chọn để vô hiệu hóa nó nếu họ không thấy nó hữu ích vì một số lý do nào đó. Mặc dù nhiều người dùng Dịch thuật Nội dung đã yêu cầu dịch vụ dịch thuật này, mỗi người dùng cá nhân có thể quyết định họ có muốn sử dụng dịch vụ này hay không.

Tóm tắt thỏa thuận của chúng tôi với Google

Nghĩa vụ của Google

  • Sử dụng khóa API dịch của họ miễn phí cho Wikimedia Foundation để cho phép các tình nguyện viên trên các trang web Wikimedia dịch các bài báo và càng nhiều ký tự nếu cần.

Nghĩa vụ của Wikimedia Foundation

  • Để cung cấp các phiên bản được chỉnh sửa tự nguyện của văn bản được dịch bởi công cụ dịch để Google có thể cải thiện công cụ của họ
  • Không có dữ liệu cá nhân nào của người dịch sẽ được chia sẻ.
  • Chỉ nội dung gốc cần dịch, ngôn ngữ của nó và ngôn ngữ mục tiêu dịch sẽ được gửi trong yêu cầu tới Google.
  • Các bản dịch được xuất bản bởi các dịch giả, có hoặc không có sự trợ giúp của các dịch vụ dịch máy, sẽ được cung cấp dưới dạng parallel corpora bởi các API dịch nội dung. Các API này sẽ được phát triển gia tăng và kết quả sẽ được cung cấp miễn phí cho mọi người, không chỉ Google.

Các ghi chú quan trọng

  • All content will remain licensed under CC BY-SA 3.0
  • Google is not requiring any "branding" on Wikimedia Sites outside of listing Google Translate as a translation tool option in the translation interface drop-down menu
  • There is no exchange of personal information of volunteers
  • The agreement is limited to 1 year, at which time we can reevaluate our needs
  • We are free to terminate the agreement for any reason, at any time
  • Agreement is governed by U.S. law

Questions about this service

We have addressed some immediate questions about Google in this section. This is also available in the Content Translation FAQ page.

What languages are being handled by Google Translate? Are there plans to add more?

Google Translate can be used to translate into all available languages except English, which is currently not enabled to use machine translation of any kind.

How is using Google Translate different than using Apertium?

As a user of Content Translation, you will not feel any difference on the translation interface as Google Translate will display the translated content in the same way Apertium currently does for the supported language pairs.

How is machine translation being done if I choose Google Translate?

Google Translate provides an API key that allows websites and other services to use their translation system. Content Translation also uses that unique API key to access Google Cloud services for Google Translate. When a user starts translating an article, the HTML content of each section of the source article is sent to Google Translate and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

This process continues for all the sections of the article being translated. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.


Google Translate is not based on open source software. Why are we using it?

Content Translation evolved from a long-standing need to bridge the gap in the amount of content between Wikipedias in different languages. Like all other software used on Wikimedia sites, Content Translation is also open source. In this particular case as well, we are using an open source client to interact with the external service and import freely licensed content in order to help users expand our free knowledge.

To use Google Translate we are not adding any proprietary software in the Content Translation code, or on the Wikimedia websites and servers. The service is free of charge as part of Google’s offering to the Wikimedia Foundation.

Only the freely available Wikipedia article content (in segments) is sent to the Google Translate and the obtained translated content is freely usable on Wikipedia pages. The translated content can be modified by users and this data is also available publicly under a free license through the Content Translation API. This is a valuable resource made available for the community to develop open source translation services for those languages where they don't exist yet.

After studying the implications carefully, we found the fact that the content was stored previously in a closed source service does not limit the freedom of our knowledge or our software in the present or the future. We have taken special care to make sure that the content provided is freely licensed to make sure it complies with Wikipedia policies. This includes a long process for legal and technical evaluation and compliance. The summary of our agreement is also available above.

From user feedback, we have seen that machine translation support is really helpful for users and we want to support all languages in the best way. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritize the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, but currently, it only provides machine translations for about 30 of the numerous possible language combination that Wikipedia can support.

Tôi có nên lo lắng về thông tin cá nhân của mình khi sử dụng Google Dịch không?

Irrespective of the service being used, you can be sure that only Wikipedia content from existing articles is sent and only freely licensed content will be added back to the translation. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

Điều gì xảy ra nếu Google Dịch là công cụ dịch máy duy nhất có sẵn và tôi không muốn sử dụng nó?

Machine Translation is an optional feature in Content Translation that you can easily disable at will. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Nội dung được dịch bởi Google Dịch có được sử dụng miễn phí trong Wikipedia không?

Yes. The content received from Google Translate is otherwise freely available on the web translation platform. Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Nội dung này có thể được sử dụng để cải thiện các hệ thống dịch máy nói chung không?

Yes. Translations made in Content Translation are saved in our database. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source, and target language information and an identifier for the segment of text.

Xem thêm

  • Supporting Indian Language Wikipedias Program - Wikimedia Foundation and Google partnership working with the Centre for Internet and Society (CIS), Wikimedia India chapter (WMIN) and user groups in a pilot a program encouraging Wikipedia communities to create locally relevant and high-quality content in Indian languages. AKA Project Tiger