Reading/Web/PDF Functionality/de

Update on books, August 17 2018


Here is an updated and more comprehensive sample of the new book renderer. The layout changed quite a from the first version presented at Wikimania. Thanks for all the feedback. The export still has a number of significant issues: page breaks, infoboxes, tables, and math formulas need to be improved substantially. This sample file focusing on international scripts and math formulas reveals some of the problems that still need to be solved. Math formulas are currently rendered using MathML - switching to LaTeX should lead to significant improvements.

Update der Buchfunktion, 8. August 2018
Wir haben mit PediaPress an der Erstellung und Gestaltung der neuen Bücher gearbeitet. Sie haben uns ein Muster der aktuellen Ausgabe zur Verfügung gestellt, das der endgültigen Version sehr ähnlich sein wird. Wir haben mit dem PediaPress-Team Verbesserungspunkte besprochen, das es derzeit in Angriff nimmt. Wenn Sie Rückmeldungen oder andere Kommentare zu diesen Beispielen haben, lassen Sie es uns bitte auf der Diskussionsseite wissen.

Update April 2018
Die Buchfunktionalität wird über PediaPress zurückkehren. Nachdem wir den neuen Renderer eingehend untersucht hatten, stellten wir fest, dass die Kernfunktionen der ursprünglichen Buchfunktion (wie Seitenzahlen und Inhaltsverzeichnis) mit dem neuen Renderer nur sehr schwer zu implementieren sind. Außerdem hatten wir erhebliche Probleme mit unserem Verknüpfungscode. Daher mussten wir nach Alternativen suchen, um die PDF-Buchfunktionalität bei Wikimedia-Projekten wiederherzustellen. Wir wandten uns an PediaPress, die die ursprünglichen Förderer von Büchern auf Wikipedia waren, um zu sehen, ob sie daran interessiert wären, die PDF-Wiedergabe für Bücher wieder aufzunehmen. Sie haben zugestimmt und wir arbeiten derzeit an den Details und dem Zeitplan. Sie werden zunächst an einer temporären Lösung arbeiten, die auf einer älteren Technologie basiert, die bisher zur Erstellung von PDF-Dateien verwendet wurde. Dies kann einige Nachteile haben, wenn es um grafische Elemente wie z.B. Karten geht, bedeutet aber eine schnellere Lösung. Anschließend planen sie die Arbeit an einem neuen HTML-zu-PDF-Renderer, basierend auf dem Feedback der ersten Implementierung.

Update im Januar 2018
Wir bereiten derzeit Leistungstests der PDF-to-Book-Funktion vor. Wir sollten Anfang Februar mehr wissen.

Update im September 2017
Unser aktueller PDF-Renderer (Service zur Erzeugung von PDF-Dateien), der Offline Content Generator (OCG), kann nicht mehr gewartet werden. Er gibt, verkürzt gesagt, den Geist auf. Das Reading Team bei der Wikimedia Foundation arbeitet seit Monaten daran, den Service zu ersetzen. OCG wurde auf veraltetem Code ausgeführt, der in der Zukunft Sicherheitslücken und andere gravierende Probleme verursachen kann. In den letzten drei Monaten wurde auf der Spezialseite "Als PDF herunterladen" um Rückmeldung zum Prototyp eines neuen PDF-Renderers gebeten. Der neue Renderer soll besser funktionieren als OCG – er wird in der Lage sein, Tabellen und Infoboxen zu drucken und das Design der PDFs wird zugunsten einer besseren Lesbarkeit optimiert. Wir haben viele gute Rückmeldungen zum Prototyp gesammelt und arbeiten daran, die erforderlichen Verbesserungen an der neuen PDF-Funktion zu machen.

Nachtrag: Kurzfristiges ABSCHALTEN der PDF-Bucherstellung
Leider machen es große Probleme mit unserem alten Renderer (OCG) erforderlich, dass wir ihn abschalten, bevor die notwendigen Verbesserungen für die Buchfunktion abgeschlossen sind. Damit findet die Abschaltung früher statt, als wir wollten. Zu dem Zeitpunkt, an dem wir OCG abschalten, werden die Arbeiten an Einzeldownloads (“Als PDF herunterladen”) abgeschlossen sein. Die Buchfunktion wird allerdings pausieren, während wir auswerten und die nötigen Arbeiten abschließen. Der ursprünglich von uns ausgewählte Ersatz-Renderer, der Electron Rendering Service, ist nicht in der Lage, größere PDFs zu unterstützen und scheitert, wenn man versucht, ein Buch mit mehreren Artikeln zu erzeugen. Wir werden daran arbeiten, ein neues Rendering-System für Bücher auszuwählen, das die Größe der Dateien verarbeiten und unsere Anforderungen unterstützen kann. Dies entspricht nicht unserer ursprünglichen Planung. Wir haben niemals angestrebt, die Bucherstellung vorübergehend zu entfernen.

Zeitplan:


 * Bereitstellung des PDF-Renderers mit vollem Funktionsumfang für einzelne Artikel (als PDF drucken) - 1. Oktober 2017
 * Pausieren der PDF - Bucherstellung - 1. Oktober 2017
 * Abschalten des OCG-Renderers - 1. Oktober 2017
 * Bereitstellung eines neuen PDF - Renderers mit vollem Funktionsumfang – Jan 2018 (vorläufig, abhängig von den Rechercheergebnissen zu alternativen Rendersystemen)

Funktionalität:

Für eine vollständige Liste der aktuellen und geplanten Funktionen, siehe unten.

Zusätzlich zu den Aktualisierungen auf dieser Seite wird dies in einem Banner auf PDF-Erstellungsseite kommuniziert, auf Tech News und auf einigen Wikimedia-Mailinglisten.

Einleitung
Unser aktueller Service zur Erzeugung von PDF-Dateien, der Offline Content Generator (OCG), kann nicht mehr gewartet werden. Verkürzt gesagt gibt er den Geist auf. Das Reading Team bei der Wikimedia Foundation arbeitet seit Monaten daran, den Service zu ersetzen. Ursprünglich von einem Dritten erstellt, wurde OCG auf veraltetem Code ausgeführt, der in der Zukunft Sicherheitslücken und andere gravierende Probleme herbeiführen kann. Wenn wir eine PDF-Funktion haben wollen, müssen wir OCG leider ersetzen, sonst befinden wir uns möglicherweise plötzlich in einer Situation, in der wir den Service ungeplant abschalten müssen.

Darüber hinaus unterstützt OCG eine Reihe von Anforderungen aus der Community nicht; die wichtigste davon ist die Fähigkeit, Tabellen darzustellen. Als passenden Ersatz haben wir einen neuen Service ausgewählt, den Electron Rendering Service. Unser nächster Schritt ist es, die Funktionen von OCG im Electron Rendering Service zu duplizieren. Im Folgenden werden die wichtigsten Teile der Funktionalität beschrieben, die wir als notwendig identifiziert haben. Wir möchten zum Gespräch darüber einladen, was fehlt oder was in der Liste überflüssig ist. Wir möchten außerdem auf unsere zukünftigen Pläne für die PDF-Erzeugung hinweisen, um auch dazu Feedback zu erhalten.

Userbase
The following table shows a sample of traffic to the Electron "Download as PDF" service for over a 6 hour period. The traffic is broken down by operating system (OS), browser, and the browser major version (e.g. Windows 7, Chrome v61.*).

Note well that the majority of our traffic appears to come from Windows based machines.

Aktuelle Funktionalitätsanforderungen
Im Folgenden findet sich eine Liste der aktuellen Anforderungen für das PDF-Rendering für Einzelartikel-PDFs und für Bücher. Die von der aktuellen Implementierung abweichenden Anforderungen werden fett dargestellt.

Vorgeschichte
OCG hat verschiedene Probleme, besonders mit der Darstellung von Tabellen.
 * Die Erstellung von PDF-Artikeln und Büchern aus Wikipedia-Seiten erfolgt über einen Dienst namens OCG. Wenn "Bücher" mit den Buchgenerator erzeugt werden, greift dieser über die Mediawiki-Erweiterung Collection auf OCG zu.


 * Verschiedene Probleme mit OCG wurden identifiziert, u.a. Beschwerden aus der Community rund um die fehlende Möglichkeit, mit OCG Tabellen darzustellen.
 * Tabellen in PDFs darzustellen ist Rang Nummer 9 auf der deutschsprachigen Technischen Wunschliste.
 * Wikimedia Deutschland beginnt damit, an einer Lösung zur Darstellung von Tabellen in PDFs zu arbeiten, und führt Electron PDF ein. Das Vorhaben ist, Electron PDF parallel zu OCG anzubieten, nicht OCG zu ersetzen.
 * Während Wikimedia Deutschland am Electron Service arbeitet, kommen die verantwortlichen Maintainer von OCG bei der Wikimedia Foundation zu der Schlussfolgerung, dass OCG ersetzt werden muss.
 * Das WMF Reading Team übernimmt die Verantwortung für die langfristige Wartung der PDF-Erstellung und beginnt mit der Planung, wie das Erzeugen von Tabellen in PDFs in alle Projekte implementiert werden kann.
 * Das Reading Team beginnt eine Befragung der Benutzerinnen und Benutzer, um Rückmeldungen zu Electron zu erhalten.
 * Die Teams Reading Infrastructure und Web beginnen eine genauere Betrachtung, was notwendig ist, um die Funktionen von OCG auf den Electron Service zu übertragen.

Update nach der Befragung von Benutzerinnen und Benutzern
Wir haben Anfang Juni 2017 um Rückmeldungen zur aktuellen Umsetzung des PDF-Renderers gebeten. Bei der Durchsicht der Rückmeldungen konnten wir folgende Beobachtungen machen:


 * Eine größere Anzahl von Leuten bevorzugte das einspaltige Format gegenüber dem zweispaltigen.
 * Jene, die das zweispaltige Format bevorzugen, hoben hervor, dass ihre Präferenz auf der Gestaltung und dem "Look-and-Feel" des Doppelspalten-Layouts basiert. Einige Benutzer äußerten auch Bedenken bzgl. Schriftgröße und Papierverschwendung beim Drucken von PDFs mit der einspaltigen Option.
 * Die folgenden Funktionen wurden gewünscht:
 * Funktionale Hyperlinks
 * Datum und URL, "diese Datei wurde heruntergeladen am [Datum] von [URL]"
 * Anpassbares CSS für Layout, Titel und Inhaltsverzeichnis
 * Zweispaltiges Format als Option
 * Bildversionen ein-/ausschließen
 * Veränderbare Ränder
 * Druck nach Abschnitten - erlaubt es, Einzelnachweise, ungewünschte Abschnitte, Index etc. zu entfernen
 * Textgröße einstellbar machen

Auf Basis der Rückmeldungen haben wir Folgendes in unsere neuen Printstile integriert:


 * Hyperlinks
 * Artikelinformation
 * kleinere Schriftgröße und buchähnliche Gestaltung

Der Rest der oben genannten Wünsche wird bis zur zweiten Iteration des PDF-Renderers verschoben. In dieser zweiten Iteration soll an einem Einstellungsmodus gearbeitet werden, der eine Anpassung anhand der verfügbaren Optionen ermöglicht.

Vorschlag
Das Folgende ist ein Vorschlag für den Funktionsumfang, der für das Erzeugen von PDFs benötigt wird:


 * PDFs zu einzelnen Artikeln werden über den Link "Als PDF herunterladen" in der Seitenleiste erzeugt.
 * PDFs mehrerer Artikel werden mit dem Buchgenerator-Werkzeug erstellt.
 * Alle Artikel enthalten Quellenangaben für Text und Bilder
 * Alle erzeugten PDFs sind in der Lage, Tabellen dazustellen.
 * Nutzerinnen und Nutzer können das Layout ihres PDFs individuell anpassen (optional).

Design
Die neuen PDF-Stile werden auf verbesserte Lesbarkeit ausgelegt. Je nach Community-Rückmeldungen und Ergebnissen der qualitativen oder quantitativen Tests wird eventuell eine Unterstützung von zweispaltigem Layout für den Buchgenerator und/oder Einzel-PDFs gebaut.

Plan für Entwicklung und Bereitstellung
Im Folgenden findet sich ein grober Überblick über den Ablauf von Entwicklung und Bereitstellung der Funktion. Änderungen vorbehalten.


 * 1) April - Mai 2017:
 * 2) Das Reading Team entwickelt die Backend-Unterstützung für die oben identifizierte Funktionalität.
 * 3) Die Benutzerinnen und Benutzer werden bei Erweiterung oder Verringerung des vorgeschlagenen Funktionsumfangs konsultiert.
 * 4) Ein qualitativer Test zur Gestaltung wird durchgeführt.
 * 5) Juni - Juli 2017:
 * 6) Neue Gestaltungsstile wurden eingebaut.
 * 7) Ein Prototyp für den PDF-Renderer (erste Iteration) wird gemeinsam mit OCG auf allen Projekten gestartet und die Performance wird verglichen.
 * 8) Iterationen auf der Grundlage von Nutzerbefragungen und identifizierten Grenzfällen
 * 9) August - September 2017:
 * 10) Zusätzliche Änderungen, falls nötig
 * 11) Oktober 2017:
 * 12) Zweite Iteration beginnt ohne OCG auf allen Projekten

Einzelne Artikel

 * Ein PDF für einen einzelnen Artikel wird erstellt, indem man den Link "Als PDF herunterladen" auswählt.
 * Mit der Auswahl von "Als PDF herunterladen" wird die PDF-Datei erzeugt. Um die Datei herunterzuladen, wählt man den Link "Herunterladen".
 * Jede PDF-Datei wird folgendes enthalten:
 * Titel und Text des Artikels
 * Infobox (falls vorhanden)
 * Tabelles (falls vorhanden)
 * einspaltiges Layout
 * Seitenzahl
 * Alle Bilder und Bildunterschriften des Artikels
 * Links auf Seiten, die im Artikel verlinkt sind (blaue Links und externe Links)
 * Text- und Bildquellen, Beiträge und Lizenzen

Phabricator Tracking
All PDF-related changes including sunsetting OCG, replacing the Electron PDF renderer, and any updates to books or the collections extension are tracked under the phabricator project Proton. The project page will display any recent updates for all tasks related to PDFs.

Im Oktober 2017 verfügbare Funktionalität
Hinweis: Zum jetzigen Zeitpunkt werden keine Änderungen am aktuellen Buchgenerator vorgenommen.


 * Benutzer starten den Buchgenerator, indem sie "Buch erstellen" auswählen.
 * Dadurch wird zur aktuellen Seite zum Erstellen von Büchern navigiert.
 * Um ein Buch herunterzuladen, klicken Benutzer auf den Link "Herunterladen" auf der Seite des Buchgenerators.
 * Benutzer können Bücher nur im PDF-Format herunterladen.
 * Über die Elemente der Einzelartikel-PDFs hinaus enthalten Bücher:
 * Titelseite des Buches
 * Die Einzelnachweise für jeden Artikel des Buches erscheinen am Ende des jeweiligen Artikels.
 * Jeder Artikel beginnt auf einer neuen Seite.
 * Ein einziger Abschnitt für Text- und Bildquellen, Mitwirkende und Lizenzen, der die gesammelten Beiträge aus allen Artikeln enthält.

Functionality available in November - December, 2017
Styles for books will be updated for improved readability
 * Bücher werden ein Inhaltsverzeichnis mit Seitenzahlen enthalten.
 * Wenn man einen Abschnitt im Inhaltsverzeichnis auswählt, navigiert man zum entsprechenden Abschnitt innerhalb des Buches.

Alternative
There is an alternative way of exporting MediaWiki to LaTeX, PDF, ODT and EPUB:

http://mediawiki2latex.wmflabs.org/

The computational resources on the server are limited.

If you run Ubuntu Linux and want results faster, you can install the m2l-pyqt or mediawiki2latex packages.

__INDEX__