Funcionalidade de leitura/Site/PDF

From MediaWiki.org
< Reading‎ | Web
Jump to navigation Jump to search
This page is a translated version of the page Reading/Web/PDF Functionality and the translation is 57% complete.

Outdated translations are marked like this.
Other languages:
Deutsch • ‎English • ‎Tiếng Việt • ‎dansk • ‎español • ‎français • ‎hrvatski • ‎italiano • ‎polski • ‎português • ‎português do Brasil • ‎tarandíne • ‎русский • ‎العربية • ‎हिन्दी • ‎বাংলা • ‎মেইতেই লোন্ • ‎ગુજરાતી • ‎ไทย • ‎ⵜⴰⵎⴰⵣⵉⵖⵜ ⵜⴰⵏⴰⵡⴰⵢⵜ • ‎中文 • ‎日本語 • ‎한국어

Update on books, August 17 2018

Sample book from PediaPress

Here is an updated and more comprehensive sample of the new book renderer. The layout changed quite a from the first version presented at Wikimania. Thanks for all the feedback. The export still has a number of significant issues: page breaks, infoboxes, tables, and math formulas need to be improved substantially. This sample file focusing on international scripts and math formulas reveals some of the problems that still need to be solved. Math formulas are currently rendered using MathML - switching to LaTeX should lead to significant improvements.

Update on books, August 8 2018

We have been working with PediaPress on generating and styling the new books. They have provided us with a sample of the current output, which will be very similar to the final version. We discussed points of improvement with the PediaPress team, which they are addressing currently. If you have any feedback or other comments on these samples, please let us know on the talk page.

Update on books, April 2018

Books functionality will be returning via PediaPress. After investigating the new renderer in depth, we realized that core features of the original book creator (such as page numbers and table of contents) would be very difficult to implement using the new renderer. In addition, we had significant issues with our concatenation code. Thus, we had to look for alternatives in terms of bringing back the PDF books functionality on Wikimedia projects. We reached out to PediaPress, who were the original patrons of books on Wikipedia to see if they would be interested in taking up PDF rendering for books once again. They have agreed and we are currently working on the details and schedule. They will start by working on a temporary solution based on an older technology that has previously been used to create PDF. This might have some drawbacks when it comes to graphical elements, such as maps, but will mean a faster working solution. They then plan to work on a new HTML-to-PDF renderer afterwards, based on feedback on the first implementation.

Atualização de janeiro de 2018

Estamos a preparar testes de desempenho da função de criação de livros em PDF. Teremos mais informação no início de fevereiro.

Estamos atualmente preparando testes de desempenho do PDF para reservar a função. Devemos saber mais no início de fevereiro.

Atualização de setembro de 2017

O nosso serviço atual de composição de PDF, o gerador de conteúdo fora de linha (OCG) deixará de ser mantido. Por outras palavras, irá deixar de funcionar. A equipa de leitura da Wikimedia Foundation trabalha há meses para substituí-lo. O OCG tem funcionado com código desatualizado que pode criar vulnerabilidades de segurança e outros problemas sérios no futuro. Durante os últimos três meses apresentámos banners na página de criação de PDF solicitando comentários sobre o protótipo do nosso novo compositor. O novo compositor terá funcionalidades melhoradas em comparação com o OCG — irá imprimir tabelas e caixas informativas, e elementos estilísticos focados na melhoria da legibilidade. Recebemos uma grande quantidade de comentários sobre o protótipo e estamos a fazer as atualizações necessárias aos nossos novos PDF.

Adendo posterior: ativando a renderização do livro PDF para o curto prazo

Infelizmente, grandes problemas com nosso antigo renderizador (OCG) nos obrigarão a removê-lo como uma opção de renderização antes de completar as atualizações necessárias para a criação de livros. Isto é mais cedo do que queríamos. Quando removermos o OCG, O trabalho de processamento de artigos individuais estará completo. No entanto, o processamento de livros vai ser pausado enquanto nós avaliamos e concluímos os trabalhos necessários. Nossa escolha inicial para substituí-lo, Electron, não é capaz de suportar PDFs de tamanhos grandes e falha ao tentar processar um livro com vários artigos. Vamos procurar um novo sistema para criar livros que possam suportar o tamanho dos arquivos e que cumpra os nossos requisitos. Não era bem como planejávamos e nunca quisemos desativar temporariamente a funcionalidade de livros em PDF.

Linha do Tempo

  • Lançamento do criador completo para artigos individuais (imprimir em PDF) - 1 de outubro de 2017
  • Pausando o processamento de livros em PDF - 1 de outubro de 2017
  • Desativação do criador OCG - 1 de outubro de 2017
  • Lançamento do novo criador PDF - janeiro de 2018 (data provisória com base nos resultados da pesquisa de sistemas de composição alternativos)

Funcionalidade

Para uma lista completa das funcionalidades atuais e futuras, veja abaixo.

Para além da atualização desta página, isto será comunicado num banner na página de criação de ficheiros PDF, em Tech News e em algumas listas de divulgação por correio eletrónico da Wikimedia.

Introdução

O nosso serviço atual de composição de ficheiros PDF, o gerador de conteúdo offline deixará de ser mantido. Por outras palavras, irá deixar de funcionar. Tendo sido criado originalmente por terceiros, ele funciona atualmente com código desatualizado que pode criar vulnerabilidades de segurança e outros problemas sérios no futuro. Para termos a funcionalidade PDF teremos infelizmente de substituí-lo, senão poderemos vir a ter de retirar subitamente esta funcionalidade sem ter planeado fazê-lo.

Além disso, este serviço não suporta alguns pedidos de composição feitos pela comunidade, sendo o principal a capacidade de compor tabelas. Selecionámos um novo serviço, o serviço de composição Electron, como substituto adequado. O nosso próximo passo será duplicar a funcionalidade fornecida pelo OCG usando o novo serviço de composição Electron. Abaixo, iremos descrever as principais funcionalidades que identificámos serem necessárias. Gostaríamos de fomentar um diálogo acerca das funcionalidades que possam estar em falta, ou sejam supérfluas, na lista fornecida. Gostaríamos também de realçar os nossos planos futuros para composição de ficheiros PDF, de forma a recebermos comentários iniciais.

Userbase

The following table shows a sample of traffic to the Electron "Download as PDF" service for over a 6 hour period. The traffic is broken down by operating system (OS), browser, and the browser major version (e.g. Windows 7, Chrome v61.*).

Note well that the majority of our traffic appears to come from Windows based machines.

OS Browser Browser Major Version % of requests
Other Other - 14.38
Windows 7 Chrome 61 12.42
Windows 10 Chrome 61 8.83
Windows 7 IE 11 7.33
Windows 7 Firefox 56 6.59
Windows 10 Firefox 56 3.82
Windows 10 Edge 15 3.24
Windows 8.1 Chrome 61 3.07
Windows XP Chrome 49 2.2
Windows 10 Chrome 59 1.53
Windows 10 IE 11 1.51
Windows 8.1 Firefox 56 1.31
Windows XP Firefox 52 1.22
Windows 8 Chrome 61 1.15
Windows 8.1 IE 11 1.15
Mac OS X Safari 11 0.9
Windows 7 Firefox 53 0.89
Windows 7 Firefox 52 0.78
Ubuntu Firefox 56 0.78
Windows XP IE 6 0.7
Windows 7 Chrome 55 0.68
Windows 7 Firefox 55 0.62
Mac OS X Chrome 61 0.62
Android UC Browser 11 0.6
Windows 10 Edge 14 0.59
Windows 7 Opera 48 0.53
Android Chrome Mobile 61 0.49
Windows 10 Opera 48 0.44
Windows 7 Chrome 60 0.4
Windows Vista Chrome 49 0.39
Windows 7 Yandex Browser 17 0.37
Windows 10 Firefox 55 0.37
Mac OS X Safari 10 0.36
Windows 10 Chrome 50 0.34
Android Android 4 0.33
Mac OS X Firefox 56 0.33
Windows 10 Chrome 60 0.32
Windows 8.1 Chrome 43 0.3
Android Amazon Silk 60 0.29
Windows 7 Sogou Explorer 1 0.27
Windows 8 IE 10 0.26
Windows 7 IE 8 0.26
Windows 7 IE 9 0.25
Windows 8 Opera 12 0.25
Linux Firefox 52 0.25
Mac OS X Firefox 53 0.24
Windows 7 Firefox 45 0.24
Windows 10 Firefox 57 0.24
Windows 7 Firefox 38 0.22
Windows 10 Firefox 47 0.21

Requisitos da funcionalidade atual

A seguir há uma lista dos requisitos atuais para renderização em PDF de um único artigo para PDF e para livros. Os requisitos diferentes da implementação atual são exibidos em negrito.

História

  • A composição de artigos e livros em PDF a partir das páginas da Wikipédia é feita por um serviço chamado OCG. Ao compor «livros» através do criador de livros, este utiliza o OCG tal como incorporado na extensão Collection. O OCG tem vários problemas, especialmente com tabelas.
  • Estão identificados vários problemas com o OCG, incluindo queixas da comunidade motivadas pela incapacidade do OCG de compor tabelas.
  • A composição de tabelas surge no número 9 da Lista de Requisitos Técnicos da Comunidade de Língua Germânica.
  • A Wikimedia Deutschland começa a trabalhar na solução para a composição de tabelas em ficheiros PDF, e introduz o Electron. Fazem-no com a intenção de executá-lo em paralelo com o OCG e não de o substituir.
  • Ao mesmo tempo que a Wikimedia Deutschland trabalha no serviço Electron, os responsáveis pelo serviço de manutenção do serviço OCG da Wikimedia Foundation chegam à conclusão de que o OCG tem de ser substituído.
  • A equipe de leitura da WMF assume a responsabilidade de manutenção a longo prazo do compositor de ficheiros PDF, e começa a planejar a implementação da composição de tabelas para todos os projetos.
  • A equipe de leitura lança uma consulta da comunidade para recolher comentários acerca do Electron.
  • As equipas da infraestrutura de leitura e web começam a delimitar o trabalho necessário para transferir a funcionalidade OCG para o serviço Electron.

Atualização após consulta

thumb|right|350px|PDFs e estilos de impressão propostos com base nos comentários da consulta Lançamos uma consulta sobre a implementação atual do PDF renderer no início de junho de 2017. Depois de analisar as respostas da consulta, fizemos as seguintes observações:

  • Um número maior de usuários preferiu o formato de coluna única no formato de coluna dupla
  • Os usuários que preferiram o formato de duas colunas ressaltaram que sua preferência se baseava no estilo e na aparência das colunas duplas. Alguns usuários também expressaram preocupações com o tamanho da fonte e desperdiçando papel ao imprimir PDF na opção de coluna única.
  • Os seguintes pedidos de recursos foram feitos:
    • Hyperlinks funcionais
    • Data e url, 'esta página foi baixada em [data] de [URL]'
    • CSS customizável para layout, título, sumário
    • Opção para o formato de 2 colunas
    • Versões com e sem imagens
    • Margens ajustáveis
    • Imprimir por seção - permite remover referências, parágrafos que você não deseja, índice, etc.
    • Tamanho de texto ajustável

Com base nos comentários, incorporamos o seguinte nos nossos novos estilos de impressão:

  • hyperlinks
  • Informações do artigo
  • Fonte menor e estilos parecidos com livros

O restante dos pedidos acima será adiado até a segunda iteração do renderizador PDF, na qual planejamos criar um modo de configurações que permita a personalização das opções disponíveis.

Proposta

A seguinte é uma proposta de definição do âmbito das funcionalidades necessárias para a composição de ficheiros PDF.

  • Os artigos individuais serão compostos no formato PDF usando a hiperligação Descarregar em PDF da barra lateral.
  • A composição de vários artigos no formato PDF será feita usando a ferramenta «Criador de livros».
  • Todos os artigos contêm atribuição da autoria dos textos e imagens.
  • Todos os ficheiros PDF que forem compostos poderão imprimir tabelas.
    • Os utilizadores poderão personalizar a disposição (layout) dos respetivos PDF (opcional).

Diferenças entre a implementação atual e a futura

OCG Novo Serviço Notas
Composição de artigos individuais Sim Sim
Composição de mais que um artigo usando o criador de livros Sim Sim
Contém sumário para múltiplos artigos Sim Sim
Compõe tabelas Não Sim
Atribuição Sim Sim Questão em aberto: localização da atribuição no novo serviço
Estilos Latex Novos estilos
Layout N-colunas Sim Não
Layout de 2 colunas padrão Sim Tentative Default one column or two-column layout will be chosen based on feedback and quantitative and/or qualitative testing
Output format PDF, Plaintext PDF Only

Design

The new PDF styles will be designed for increased readability. Based on community feedback and qualitative or quantitative testing, support for a 2-column layout may be built for the book creator and/or for individual PDFs.

Development and Deployment Roadmap

The following is a rough outline of the development and deployment roadmap. It is subject to change.

  1. April – May 2017:
    1. The Reading team builds back-end support for functionality identified above
    2. Communities are consulted on expanding or shrinking proposed functionality
    3. Qualitative test performed for styling
  2. June – July 2017:
    1. New styles implemented
    2. First iteration is launched along with OCG on all projects and performance is compared
    3. Iterations based on consultations and identified edge cases
  3. August 2017 – September 2017
    1. Additional changes made if necessary
  4. October 2017
    1. Second iteration launched without OCG on all projects

Single Articles

  • A PDF for a single article will be created by selecting the "Download as PDF" link
  • Upon selecting "Download as PDF", the PDF file will be generated. To download the file, users will select the "Download the file link"
  • Each PDF file will contain the following:
    • Article title and text
    • Infobox (if any)
    • Tables (if any)
    • Single-column layout
    • Page number
    • All article images and captions
    • Links to pages linked from the article (blue links and external links)
    • Text and image sources, contributors, and licenses

Phabricator Tracking

All PDF-related changes including sunsetting OCG, replacing the Electron PDF renderer, and any updates to books or the collections extension are tracked under the phabricator project Proton. The project page will display any recent updates for all tasks related to PDFs.

Books

Functionality available in October, 2017

Note: no changes will be made to the current book creator workflow at this time

  • User will launch the books creator by selecting "Create a book"
  • This will navigate to the current book creation page
  • To download a book, users will select the "download" link from the books page
  • Users may only download books in PDF format
  • Books will contain all elements from single article format as well as:
    • Book title page
    • The references for each article from the book will appear at the end of the article
    • Each article will begin on a new page
    • A single section for text and image sources, contributors, and licenses, that contains the collected contributions from all articles

Functionality available in November - December, 2017

  • Books will contain a table of contents with page numbers
    • Selecting a section from the table of contents will navigate the user to the corresponding section within the book

Styles for books will be updated for improved readability

Alternative

There is an alternative way of exporting MediaWiki to LaTeX, PDF, ODT and EPUB:

http://mediawiki2latex.wmflabs.org/

The computational resources on the server are limited.

If you run Ubuntu Linux and want results faster, you can install the m2l-pyqt or mediawiki2latex packages.