Oft gehen wir davon aus, dass wir wissen, was ein PDF ist, aber selten wird es im Detail erklärt. Dieser Artikel soll PDFs klar und verständlich erklären, ohne zu technisch zu werden. Wir behandeln die Grundlagen, einschließlich des inneren Aufbaus eines PDFs und warum es noch immer ein so beliebtes Format ist. Legen wir los!
PDF-Grundlagen
Definition
PDF steht für Portable Document Format. Es ist ein elektronisches Dokumentenformat, das so aussehen und funktionieren soll wie Papierdokumente. Der Begriff "portable" bedeutet, dass ein PDF unabhängig davon, wo oder wie es angezeigt wird, immer gleich aussehen sollte.
Geschichte
PDF wurde 1991 von Adobe entwickelt und später als offener Standard veröffentlicht, damit jeder Tools zum Erstellen, Bearbeiten und Anzeigen von PDFs entwickeln kann. 2008 wurde es als ISO-Standard, standardisiert, was seine weite Verbreitung zusätzlich gefördert hat.
Funktionen
Ein wesentliches Merkmal eines PDFs ist, dass es in sich abgeschlossen ist; alles, was zur Darstellung des Dokuments benötigt wird, ist in der Datei enthalten. Dadurch lassen sich PDFs leicht übertragen, speichern und archivieren. Zudem ist Adobe Reader, der PDF-Viewer, kostenlos, was zur weiten Verbreitung beigetragen hat. Ein Verständnis der PDF-Struktur hilft Ihnen, Tools wie Acrobat noch effektiver für Ihre Dokumentprojekte zu nutzen.
Wie funktionieren PDFs?
Einfaches PDF
Im Kern ist ein PDF wie ein Ordner oder Ringbuch, das einzelne Seiten. enthält. Sie können Seiten zu einem PDF hinzufügen, Seiten aufteilen und Seiten von einem PDF in ein anderes verschieben - fast so, als würden Sie Papierseiten in einem Ringbuch handhaben.
PDFs enthalten außerdem einen Satz von Daten, die für das gesamte Dokument gelten, die sogenannten Dokument-Ebenen-Daten. Sie umfassen Informationen wie Dokument-Sicherheitsdaten, Metadaten, und weitere Eigenschaften, die für das gesamte Dokument gelten.
Stellen Sie sich ein physisches Ringbuch vor, das ein Schloss hat und auf dessen Innen- oder Außenseite Informationen vermerkt sind. Dieses Ringbuchbild hilft zu verstehen, wie diese Eigenschaften in einem elektronischen PDF-Dokument funktionieren.
Mehr als nur ein PDF
Natürlich steckt in einem PDF noch mehr. Schauen wir uns die Dokumentebene genauer an.
Das PDF enthält:
- Lesezeichen: Lesezeichen dienen als Navigationshilfe, ähnlich wie ein Inhaltsverzeichnis.
- Sicherheitsdaten: Sie steuern den Zugriff auf das Dokument.
- Dateianhänge: Dies sind tatsächliche Dateien, die an das PDF angehängt sind, sodass sich das PDF wie eine ZIP-Datei verhält.
- Dokumentskripte: Skripte auf Dokumentebene werden durch verschiedene Ereignisse auf Dokumentebene ausgelöst, etwa beim Öffnen oder Drucken des PDFs.
- Formularfelder und -daten: Auch wenn Nutzer mit Formularfeldern auf den Seiten interagieren, werden diese auf Dokumentebene verwaltet. Die Felder gelten global für das gesamte Dokument, während die Widgets die lokale Darstellung und Benutzeroberfläche dieser Felder auf bestimmten Seiten sind.
- Dokument-Metadaten: Dazu gehören Informationen wie Autor, Titel und Stichwörter.
- Verschiedene Ressourcen: Dazu zählen Schriften, Farbräume, Bilder, Videos und mehr, die in anderen Teilen des Dokuments verwendet werden.
Die Seiten eines PDFs sind die Teile, die der Nutzer sieht und mit denen er interagiert. Diese Seiten werden über eine Rendering-Engine dargestellt, die den Seiteninhalt zeichnet. Die Rendering-Engine benötigt Ressourcen wie Schriftarten, Farbraumdefinitionen und Bilder. Diese Ressourcen sind im PDF enthalten und tragen zu seiner Portabilität bei. Schriftarten sind jedoch eine Ausnahme. Sie müssen nicht im PDF eingebettet sein.
Wenn eine Schriftart eingebettet ist, ist sie im PDF enthalten. Ist sie es nicht, sucht Acrobat die Schriftart entweder auf dem System des Nutzers oder verwendet eine Standardschrift, die nicht eingebettet werden muss. Daher gibt es Fälle, in denen ein PDF nicht vollständig in sich abgeschlossen ist.
Elementtypen
Auf einer Seite gibt es zwei Arten von Elementen: statischer Seiteninhalt und eine Liste von Annotationen. Der statische Seiteninhalt umfasst den gesamten normalen Text, Grafiken und Bilder (Hauptdokumentinhalt).
Annotationen sind besondere Elemente, mit denen der Benutzer interagieren kann, wie Formularfeld-Widgets, Kommentierungs- und Markup-Werkzeuge sowie Multimedia-Werkzeuge. Im Gegensatz zu statischem Inhalt müssen Annotationen nicht immer sichtbar sein. Ein Link ist zum Beispiel eine Annotation, die Platz auf der Seite einnimmt, aber möglicherweise kein sichtbares Erscheinungsbild hat.
Wenn eine Annotation, etwa ein Kreis, gezeichnet wird, erscheint sie als rote kreisförmige Linie. In der internen Struktur des PDFs werden sowohl Seiteninhalt als auch Annotationen mit derselben Vektorgrafik-Sprache. Die Rendering-Engine zeichnet zuerst den Seiteninhalt und anschließend die Annotationen in einer festgelegten Reihenfolge. Durch diesen Ebenenaufbau wirken Annotationen so, als würden sie über dem Seiteninhalt schweben.
Annotationen bieten dynamische und interaktive Funktionen für das PDF. Sie sind die einzigen Elemente auf einer Seite, die auf Benutzeraktionen wie Tastatureingaben und Mausklicks reagieren. Eine Kreis-Annotation kann beispielsweise ausgewählt, verschoben und in der Größe verändert werden.
Verschiedene Arten von Annotationen bieten unterschiedliche Interaktionen. Eine Notiz-Annotation fordert den Benutzer zum Eingeben von Text auf und kann verschoben, aber nicht in der Größe verändert werden. Jeder Annotierungstyp reagiert auf seine eigene Weise auf Benutzereingaben, verbessert so die Interaktivität des PDFs und erscheint dabei über dem Hauptseiteninhalt.
PDFs bearbeiten
Der Seiteninhalt in einem PDF ist grundsätzlich statisch. Beim Anzeigen in Adobe Reader bleibt der Seiteninhalt unveränderlich, da der Reader keine Werkzeuge für Bearbeitungen bereitstellt. In Adobe Acrobat können Sie den Inhalt jedoch direkt bearbeiten. Am besten bearbeiten Sie das Dokument in der ursprünglichen Anwendung, mit der es erstellt wurde.
Nachdem Sie die Änderungen vorgenommen haben, speichern Sie das Dokument erneut als PDF. Diese Methode erhält die Integrität des Dokuments und verhindert mögliche Probleme mit Formatierung und Inhaltsgenauigkeit.
TIPP: Für alle, die schnelle Bearbeitungen benötigen, bietet PDF2Go mit seinem PDF To Word Converter. eine praktische Online-Lösung. Mit diesem Tool können Sie Ihr PDF in ein bearbeitbares Word-Dokument umwandeln und so umfangreiche Änderungen einfacher vornehmen. Sobald Ihre Bearbeitungen abgeschlossen sind, können Sie das Dokument ganz einfach wieder als PDF speichern.
Grafikoperatoren
Grafikoperatoren sind grundlegende Elemente für die präzise Darstellung von PDF-Inhalt. Diese Operatoren bilden den Kern der Grafik-Sprache und bestimmen jeden Aspekt dessen, was auf einer PDF-Seite erscheint, egal ob statischer Inhalt wie Text oder dynamische Elemente wie Annotationen.
Eine Vektorgrafik, also die exakte Beschreibung dessen, was gezeichnet wird, wird mithilfe dieser Operatoren aufgebaut. Sie legen wichtige Details fest, etwa wo eine Linie beginnt und endet, ihre Farbe, Stärke und andere visuelle Eigenschaften. Dieser detaillierte Befehlssatz sorgt dafür, dass jedes grafische Element in einem PDF auf verschiedenen Anzeigegeräten und beim Drucken exakt wiedergegeben wird.
PDF-Struktur
Die interne Struktur eines PDFs lässt sich als Baum darstellen. Ganz oben stehen Dokumenteigenschaften (Metadaten, Skripte, Seiten, Sicherheitsinformationen, AcroForm), gefolgt von einer Reihe von Seiten, die jeweils statischen Inhalt, einen Satz von Ressourcen zur Darstellung dieses Inhalts und eine Liste von Annotationen.
Beachten Sie, dass Annotationen die Ressourcen innerhalb eines PDFs mitverwenden. Wenn eine Annotation ein sichtbares Erscheinungsbild hat, nutzt sie die Vektorgrafik-Sprache, die auch für den Hauptseiteninhalt verwendet wird. Anders ausgedrückt: Sie benötigt dieselben Ressourcen wie der Hauptinhalt, um korrekt dargestellt zu werden.
AcroForm
Ein AcroForm ist wie eine zentrale Liste für alle Formularfelder und deren Daten im gesamten PDF-Dokument. Jedes Formularfeld-Widget, das Sie auf den einzelnen Seiten sehen, ist im Grunde eine Kopie eines Eintrags aus dieser Hauptliste. Interessanterweise werden diese Formularfeld-Widgets in der PDF-Struktur zusammen mit Kommentar- und Markup-Annotationen aufgelistet.
Für die Rendering-Engine, die alles auf der Seite darstellt, werden alle Annotationen, ob Formularfelder oder Markup, gleichermaßen als anzuzeigende Elemente behandelt. Der eigentliche Unterschied zwischen diesen Annotierungstypen liegt in ihrer Interaktivität, nicht in ihrer visuellen Darstellung.
Fazit
Wenn Sie die Struktur und Möglichkeiten von PDFs verstehen, können Sie ihr volles Potenzial nutzen, sei es zum Erstellen von Formularen, zum Schützen von Dokumenten oder einfach zum zuverlässigen Teilen von Informationen. Mit zuverlässigen PDF-Tools, können Sie die leistungsstarken Funktionen dieses weit verbreiteten Formats in vollem Umfang nutzen.