Manchmal möchte man PDF-Dokumente, die man etwa selbst eingescannt oder zugesendet bekommen hat, in eine Word-Datei konvertieren, damit man sie weiterverarbeiten kann. Es gibt zwar Software, mit der man PDF-Dateien direkt bearbeiten oder in diverse andere Formate umwandeln kann, aber deren Kauf lohnt sich nur, wenn man vorhat, so etwas öfters zu machen. Für Gelegenheitsfälle bietet sich das kostenlose Online-Werkzeug PDF to Word Converter an.
Inhalt:
Bedienung
Die Bedienung ist denkbar einfach: Man zieht die zu konvertierende Datei in das Feld in der Mitte oder man klickt auf die große rote Schaltfläche. Daraufhin wird die Datei hochgeladen und konvertiert.
Nach kurzer Zeit kann man das Ergebnis in der umgewandelten Form, also als Word-Datei im .docx-Format, herunterladen. Im Fall eines Dokuments im Format PDF/A-3, einem Format für die Langzeitarchivierung, dauert die Konvertierung etwas länger.
Datenschutz
Man muss keinerlei persönliche Informationen angeben, um die Software benutzen zu können, noch nicht einmal eine E-Mail-Adresse, was ich sehr angenehm finde. Ferner wird laut Angaben des Anbieters in keiner Weise auf die hochgeladenen Dateien zugegriffen, und kurz nach dem Umwandeln werden sie wieder vom Server gelöscht.
Kostenfreie Verwendung
Ich stellte mir die Frage, warum PDF to Word Converter kostenfrei verwendbar ist. Nun, der Dienst kann deswegen kostenlos angeboten werden, weil zwischen pdftowordconverter.org und Investintech.com Inc. ein Partnerprogramm existiert. Letzteres Unternehmen bietet eine professionelle PDF-Bearbeitungs-Software als Desktop-Programm für den eigenen PC an, das sehr viele Funktionen bietet. Über einen Link können Besucher von pdftowordconverter.org dorthin gelangen.
Qualität
Um die Qualität der Umwandlung beurteilen zu können, habe ich mit einem Textverarbeitungsprogramm ein Dokument erstellt, welches ein Bild, einen Textrahmen rechts daneben und normalen Text ganz unten enthält.
Originales PDF-Dokument
Layout
Die Anordnung der oben genannten Bereiche war nach der Konvertierung genau so erhalten geblieben. Es können also durchaus auch komplexere Dokumente umgewandelt werden, die nicht nur aus einfachem Text bestehen.
Schriften
Die in das PDF-Dokument eingebundenen Schriften wurden allerdings nicht übernommen. Ich muss zugeben: ich verwendete keine Standardschriften, um es nämlich der Software nicht zu leicht zu machen. Und es zeigte sich, dass leider keine passenden Ersatzschriften gewählt wurden; die Software verwechselte sogar Serifen-Schriften mit serifenlosen. Nun gut, das kann man ja in der Word-Datei korrigieren.
Aber auch die fetten Schriftschnitte in der Überschrift und im Text wurden nicht erkannt, nur der kursive in dem Textkasten neben dem Bild.
Die farbige Passage (violett) hingegen erschien in der umgewandelten Datei ebenfalls farbig; Text muss also nicht schwarz sein, sollte sich aber vermutlich in der Helligkeit möglichst stark vom Hintergrund abheben, um gut erkannt zu werden.
Umgewandeltes Ergebnis
Als ich einen neuen Versuch mit der Standard-Schrift Arial durchführte, wurde diese in die konvertierte Word-Datei übernommen; allerdings wurde auch hier der fette Schriftschnitt leider nicht korrekt umgesetzt.
Bilder
Bilder werden korrekt in die konvertierte Word-Datei übernommen, und die Bildqualität ist gut, ich konnte keine Qualitätsverluste feststellen.
Texterkennung (OCR)
Auch wenn ein PDF-Dokument Text nur als Bild enthält, kann der Text durch die eingebaute OCR-Technologie extrahiert werden. Das funktioniert ganz gut, allerdings werden deutsche Umlaute (ä, ö und ü) nicht erkannt, und auch sonst werden nicht alle deutschen Wörter fehlerfrei ausgelesen, sodass ein bisschen Nachbearbeitung erforderlich ist – das ist aber bei jeder OCR-Software, die ich bisher verwendet habe, der Fall. Die Texterkennung spart auf jeden Fall, zumindest bei längeren Texten, viel Zeit und Mühe, die man aufwenden müsste, wenn man alles abtippen wollte.
Fazit
PDF to Word Converter wandelt PDF-Dokumente in Word-Dateien um und erledigt diese Aufgabe sehr gut. Schrift-Formatierungen bleiben erhalten und Bilder finden sich an der richtigen Stelle wieder. Enthält die PDF-Datei allerdings andere als die gängigen Standard-Schriften, wählt das Programm nicht unbedingt ähnliche Ersatzschriften; das ist nicht so tragisch, denn die Schriften lassen sich ja in der Word-Datei nach Belieben ändern.