Bærbart dokumentformat

Portabelt dokumentformat (PDF)
PDF-filikon
Adobe PDF-logo
Filutvidelse : .pdf
MIME-type : søknad / pdf
Magisk nummer : % PDF
Utviklet av: PDF-forening
Første utgivelse: 1993 av Adobe Inc.
Gjeldende versjon: 2.0 (per juli 2017)
Standard (er) : ISO 32000 , Adobe: PDF-referanse (for 1.7 og eldre)
Nettsted : https://www.pdfa.org/


The Portable Document Format (engelsk, PDF for kort , tysk: (transport) Portable Document Format ) er en plattformuavhengig filformat som ble utviklet og utgitt i 1993 av Adobe Inc. og blir nå videreutviklet av PDF Association .

Målet var å lage et filformat for elektroniske dokumenter slik at de kan reproduseres tro mot originalen uavhengig av det opprinnelige applikasjonsprogrammet, operativsystemet eller maskinvareplattformen. Målet ble oppnådd og gjenspeiles i ISO 32000-serien av standarder (ISO 15930 for PDF / X ). For dette formålet ble funksjonaliteten til PostScript- formatet egentlig brukt. En leser av en PDF-fil skal alltid kunne se og skrive ut dokumentet i det skjemaet spesifisert av forfatteren. De typiske konverteringsproblemene (som endrede sideskift eller uriktige skrifttyper) når du bytter et dokument mellom forskjellige programmer, elimineres dermed.

I tillegg til tekst, bilder og grafikk, kan en PDF-fil også inneholde hjelpemidler som letter navigering i dokumentet. Dette inkluderer for eksempel klikkbare innholdsfortegnelser og miniatyriserte forhåndsvisning av sider.

Oversikt

Grunnleggende og programvare

PDF-dokumenter og filer kan opprettes fra tekster , bilder og grafikk - blandet eller individuelt - med de aktuelle programmene (f.eks. Med gratis programmer som PDFCreator og kontorpakker LibreOffice / OpenOffice.org , gebyrbaserte programmer som Adobe Acrobat eller ganske enkelt via utskriftsdialogen) og vise den med passende leseprogrammer (f.eks. Evince , Ghostscript , Okular , Adobe Reader , Foxit , Preview ). Skaperen av en PDF-fil kan beskytte den mot utilsiktet bruk på en rekke måter ved å aktivere PDF-sikkerhetsmekanismene. Ved å kryptere forhindres tilgang til uvedkommende. Avhengig av dine behov kan det hende at du allerede trenger et passord for å åpne filen, eller det kan ikke være tillatt å kopiere innhold fra filen eller skrive ut. Imidlertid er beskyttelsesmekanismene implementert i PDF for dette ikke pålitelige; spesielt er enklere former for kryptering enkle å overvinne.

I oppstartsfasen ble Adobe Reader belastet. Bare gratis distribusjon av programvaren gjorde det mulig å distribuere formatet i dagens grad. PDF har lenge vært et kommersielt ( proprietært ) men åpent filformat dokumentert i Adobes PDF-referansehåndbok. Adobe introduserte den for ISO-standardiseringsprosessen i begynnelsen av 2007, og med utgivelsen 1. juli 2008 er PDF-versjon 1.7 som ISO 32000-1: 2008 en åpen standard .

Enkelte metoder når det gjelder PDF er standardisert av ISO på forhånd for å lette datautveksling i prepress (som PDF / X ) og for langsiktig arkivering av PDF-filer (som PDF / A -1 i ISO 19005-1: 2005).

Generasjon og transformasjon

PDF er et vektorbasert sidebeskrivelsesspråk som gjør at skjermen kan skaleres fritt. PDF-filer beskriver oppsettet som ble opprettet med opprettelsesprogrammet i et skjema som er uavhengig av skriveren og standardinnstillingene, proporsjonalt og derfor så trofast som mulig i prinsippet. Det er her PDF-filen skiller seg betydelig fra avanserte beskrivelses- og markeringsspråk som SGML eller HTML når det gjelder kravet om optimal layoutfidelitet. For å optimalisere en visning på utdataenheter med et lite visningsområde - for eksempel PDAer eller mobiltelefoner - kan markeringer (ligner på HTML-koder) lagres i en PDF, som gjør at sideinnholdet kan brytes opp - da uunngåelig med begrenset layout troskap. Slike markeringer gjør det også mulig for et leserprogram å lese dokumentet for synshemmede brukere og gjøre det lettere å konvertere innholdet til andre formater.

Et populært program for å lage PDF-filer er Adobe Acrobat Distiller , som lager PDF-filer fra PostScript- filer. Acrobat Distiller er tilgjengelig som et stasjonært produkt for Windows og macOS . Serverversjoner og gratis Adobe Reader finnes også for andre plattformer. Ved hjelp av den gratis programvaren Wine kjører Acrobat Distiller også under Linux. Ulike kontor- og DTP- programmer fra andre produsenter tilbyr direkte PDF-eksport og er tilgjengelige på en rekke plattformer . Nå med mange verktøy og programmeringsbiblioteker, kan PDF-filer opprettes på forskjellige måter med forskjellige spesialiseringer. PDF-filer kan opprettes på nesten hvilken som helst plattform.

Adobe gir utviklere delvis rett til å utvikle egne applikasjoner for å generere og redigere PDF-dokumenter, men forbeholder seg opphavsretten til spesifikasjonene. PDF som språk for sidebeskrivelse kan sees på som en videreutvikling av PostScript grafisk modell, som også er avslørt. I slutten av februar 2007 kunngjorde Adobe at de ville innlemme versjon 1.7 av PDF-spesifikasjonen i ISO-standardiseringen, og jobber med dette med den amerikanske bransjeforeningen AIIM , som har sekretariatet for ISO- komiteen TC 171. Adobe truet Microsoft med antitrust søksmål hvis den åpne PDF-standarden ble integrert.

Videre generasjonsmetoder behandles under Konvertere andre formater til PDF .

Bruk og egenskaper

Generelle egenskaper

En PDF-fil kan gjengi dokumenter nøyaktig, inkludert alle farger, raster- og vektorgrafikk og skrifttyper . En av styrkene ved PDF er at det finnes visningsprogrammer for alle vanlige plattformer, slik at innholdet kan vises uavhengig av plattform.

Senere redigering av PDF-filer er vanskelig. Imidlertid er det forskjellige programmer som du kan kutte ut enkelte sider og endre bestemt innhold med. Fra og med Microsoft Word versjon 2013 kan PDF-filer konverteres til Word-filer direkte i programmet.

Omfang av dokumenter

Størrelsessammenligning: kart over Europa og en PDF-dokumentside med den teoretisk maksimale mulige sidestørrelsen på 381 km × 381 km

PDF-dokumenter kan inneholde flere hundre tusen sider. Sidestørrelsen er ikke begrenset av selve formatet. I Adobe Acrobat er det imidlertid begrensninger for implementering:

  • opp til versjon 3 til 45 tommer × 45 tommer (1,143 m × 1,143 m)
  • opp til versjon 6 til 200 tommer × 200 tommer (5,08 m × 5,08 m)
  • fra versjon 7 til 15.000.000 tommer × 15.000.000 tommer (381 km × 381 km)

Lagring av informasjon i dokumentet

All informasjon lagres som nummererte objekter i PDF-filer. Objekter er for eksempel skriftinformasjon, tegnbredder, tegnkodinger som brukes (Mac / PC ...), sidebeskrivelser, parametere for dekodere, beskjæringsbokser, individuelle bokmerker, fargedefinisjoner, sideordre, bitmapper, skjemaer, hoppmerker og alt annet som er lagret i PDF-filer kan være. En hundre sider PDF-fil kan enkelt inneholde 10 000 objekter.

PDF er basert på den samme grafiske modellen som PostScript- sidebeskrivelsesspråket , men tillater noen tilleggsfunksjoner sammenlignet med dette - spesielt interaktive elementer som bokmerker, kommentarer, skjemafelt og programmering med JavaScript er mulig. Sammenlignet med PostScript er den grafiske modellen for sideinnholdet også utvidet til å omfatte funksjoner som gjennomsiktighet eller valgfritt eller byttbart innhold (referert til som lag i Acrobat brukergrensesnitt) eller støtte for ICC-profiler og OpenType- skrifter.

Fonter (med unntak av pikselskrifter) og vektorgrafikk kan forstørres etter ønske uten tap av kvalitet. Under disse forholdene kan store nettverksplaner og datamodeller lagres på en PDF-side uten tap.

Tekstpassasjer, tabeller og grafikk (inkludert utdrag av dem) fra PDF-dokumenter kan enkelt behandles videre i andre applikasjonsprogrammer ved å kopiere og lime inn de respektive elementene, hvis dokumentets skaperen har gitt tillatelse. Tekst kan ekstraheres ikke bare for videre behandling i andre applikasjoner, men også for surfing eller for bruk med andre utdatamedia som skjermlesere . Detaljert innhold finner du veldig enkelt ved hjelp av tekstsøk i individuelle dokumenter eller fulltekstundersøkelser i en PDF-dokumentsamling. Dette fungerer til og med hvis teksten er forvrengt grafisk, for eksempel i form av en sirkel eller kurve.

Dokumentsikkerhet

Kryptering av PDF-dokumenter

En spesiell egenskap ved PDF er valgfri dokumentbeskyttelse med 40 eller 128 bit kryptering . Ved å tilordne et brukerpassord er det mulig å gjøre dokumentet bare tilgjengelig for en begrenset gruppe mennesker. Forfatteren kan også bruke et eget eierpassord for å spesifikt tildele rettigheter til det aktuelle dokumentet. Dette forhindrer brukere i å endre, skrive ut eller kopiere deler av dokumentet. Selv uten kjennskap til eierpassordet, kan disse rettighetsbegrensningene enkelt fjernes ved hjelp av forskjellige verktøy, spesielt hvis det brukes et eierpassord, men å åpne dokumentet krever ikke passord (dette betyr at det ikke er angitt noe brukerpassord). Bruksbegrensningene knyttet til kryptering kan enkelt omgåes ved å lagre skjermbilder som bitmaps og deretter bruke optisk tekstgjenkjenning .

Egnede verktøy kan også brukes til å tildele rettigheter som gjør det mulig å legge til notater, kommentarer og filvedlegg til PDF-dokumenter eller lagre skjemaoppføringer. Opprinnelig kunne disse funksjonene bare brukes med Adobe Acrobat, men fra versjon 7 er det også mulig med gratis Adobe Reader å legge til notater og kommentarer og fylle ut interaktive skjemafelt, forutsatt at det relevante dokumentet er gitt de nødvendige autorisasjonene fra forfatter.

DRM- beskyttede PDF-filer eksisterer nå også . Disse kan leses med blant andre Adobe Digital Editions .

Sårbarheter forårsaket av menneskelige feil

PDF-filer kan utilsiktet inneholde konfidensiell informasjon som, selv om den ikke er umiddelbart synlig, kan bli funnet ved hjelp av tekstsøk. På den ene siden kan informasjon tilsløres av objekter eller være plassert utenfor visningsområdet for siden, på den annen side kan en PDF inneholde metadata som bare vises når de tilhørende dialogene vises og noen ganger går ubemerket hen. Spesielt når du "svarte" tekstpassasjer, er det ikke tilstrekkelig å dekke den respektive tekstpassasjen, men den må fjernes helt fra PDF-filen. Det er ikke alltid lett å unngå uønsket informasjon i en PDF, spesielt hvis du ikke bare har laget og redigert PDF (og dokumentet som den ble generert fra) selv. Det er viktig at når du redigerer tekstpassasjer, brukes et verktøy som fjerner relevant innhold helt. Det er like viktig å sjekke metadataene (finnes i Acrobat via File / Properties). Acrobat Professional 8 tilbyr omfattende støtte her, spesielt gjennom en spesiell funksjon for fjerning av skjult informasjon.

Casestudier:

Hakk enkelt krypterte eller signerte PDF-dokumenter

I desember 2019 publiserte forskere fra Ruhr University Bochum og IT-sikkerhetsselskapet Hackmanit at det var lett mulig å gjøre endringer i signerte PDF-dokumenter uten at 21 av 22 PDF-lesere la merke til det. Selv Adobe Acrobat Reader markerte ikke påfølgende endringer. Bevisene ble presentert på Chaos Communication Congress i Leipzig fra 27. til 30. desember 2019. Forskerne viste at det var mulig (a) å legge til sider og notater i signerte dokumenter uten at signaturen ble ugyldig, (b) å flytte originalt signert innhold til en annen posisjon i dokumentet og å skrive noe annet på det opprinnelige stedet, og (c) for å endre ("manipulere") metadataene til signaturen. De berørte PDF-leserne kjente ikke igjen endringen og indikerte likevel at signaturen var gyldig. Forskerne klarte å gjøre endringene ved hjelp av en enkel tekstredigerer.

Forskerne klarte også enkelt å gjøre endringer i krypterte PDF-dokumenter. Selv uten å vite passordet, kunne de innlemme skjulte kommandoer i rollen som en angriper. Hvis angriperen videresender det til den faktiske mottakeren og han skriver inn passordet, har angriperen automatisk tilgang til det fullstendige dekrypterte PDF-innholdet. Dette var mulig ved hjelp av to metoder. Den første metoden utnytter funksjonen som delvis kan kryptere PDF-filer. Blant annet kan strukturen til PDF endres og ikke-kryptert innhold legges til. Så snart dokumentet er åpnet av en autorisert person, kan angriperen trekke ut ren tekst og dermed få tilgang til innholdet. Den andre metoden er basert på et sikkerhetsproblem i PDF-krypteringsspesifikasjonene. Dette gjør at kryptert innhold kan endres. 27 PDF-lesere ble undersøkt for kryptering. Alle testede PDF-lesere var utsatt for en av disse manipulasjonene. ISO-standarden inneholder ingen klare retningslinjer for utviklere om hvordan de skal implementere digitale signaturer og kryptering (per januar 2020). For å oppnå en pålitelig signatur og kryptering av PDF-filer med alle PDF-lesere i fremtiden, er det nødvendig for ISO å videreutvikle standarden.

Redigering av dokumenter

PDF ble designet som et utvekslingsformat for ferdige dokumenter. Det er nå en rekke programmer og utvidelser for Adobe Acrobat som kan brukes til å redigere PDF-filer. Imidlertid kan formatet ikke sammenlignes med filformatene til tekstbehandlingsprogrammer eller grafikkprogrammer, og er, bortsett fra notat- og kommentarfunksjonen, kun egnet for videre behandling av dokumenter i begrenset grad. Det er imidlertid mulig, for eksempel, innen visse grenser å fjerne skrivefeil . Fordelene med skrivebordsutgivelse for grafiske kunstnere og designere er integrasjonen av alle elementer for utskrift.

Avhengig av det enkelte tilfellet kan PDF-dokumenter være enten større eller mindre enn filene i den opprinnelige applikasjonen. Størrelsen på et dokument avhenger av typen data det inneholder, effektiviteten til opprettelsesprogrammet og om skriftene er innebygd. Fontene kan enten være innebygd fullstendig, som en delmengde av tegnene som faktisk brukes i dokumentet, eller ikke i det hele tatt. Hvis et dokument skal vises pålitelig, uansett om skriftene som brukes er installert på målplattformen, må minst de faktisk brukte tegnene være innebygd.

Skriver ut i batch-modus fra kommandolinjen

Utskrift gjøres vanligvis innenfor det grafiske brukergrensesnittet til en betrakter med File ▸ Print… . Acrobat Reader og Foxit Reader har delvis fjernet kommandolinjealternativet / t <fil> <skrivernavn> i de nyere versjonene (september 2015). I Acrobat kan du bare skrive ut på standardskriveren, mens skriveren kan velges med Foxit, men Foxit åpner applikasjonsvinduet og lukker det ikke etter utskrift (brukeren må lukke det manuelt).

Linux

Om CUPS :

lpr -P <Druckername> "datei.pdf"

Windows

Batch-utskrift er mulig med Ghostscript . Ghostscript installerer seg selv ved hjelp av et installasjonsprogram under c: \ Program Files \ gs \ gs <Version> \ . Det er kjørbare filer i bin \ underkatalogen . Eksempel med DOS-vinduet i Windows 7:

C:\Program Files\gs\gs9.16\bin>gswin64c.exe \
  -dNOPAGEPROMPT \
  -dNOPROMPT \
  -dNOPAUSE \
  -dBATCH \
  [-dDEVICEWIDTHPOINTS=<Number of American points for the paper size>] \
  [-dDEVICEHEIGHTPOINTS=<Number of American points for the paper size>] \
  -sOutputFile="%printer%\\<server>\<printer name>" \
  -sDEVICE=mswinpr2 \
  <myfile.pdf>

gswin64c.exe er 64-biters versjonen uten et eget vindu med interaktiv modus på kommandolinjen.

dNOAlternativene slår av den interaktive modusen. De -dDEVICEalternativene kan brukes hvis skriveren bruker en uvanlig papirformat. -sOutputFileangir navnet på skriveren. -sDEVICErefererer til en intern modul av Ghostscript, som er mswinpr2standardinnstilling. På slutten forventer kommandolinjen at filen skal skrives ut (kan mislykkes hvis rekkefølgen er annerledes). Under utskrift vises en avbrytingsdialog som lukker seg (kan slås av med -dNoCancel).

Ghostscript for Windows viser også PDF-filen i sitt eget grafiske vindu hvis det ikke er noen kommandolinjeparametere. Denne skjermen viser piksler og trappeffekter. På den annen side er kvaliteten på de trykte dokumentene betydelig bedre.

Serialisering og komprimering

I løpet av utviklingen ble PDF flere ganger tilpasset spesielle krav til bruk på Internett . Opprinnelig måtte et dokument være helt tilgjengelig for å kunne vises. Det er nå mulig å serieisere PDF-dokumenter slik at deler av dem kan vises mens de lastes inn. Fra versjon 1.5 av PDF- spesifikasjonen kan flere objekter kombineres i en PDF og deretter komprimeres, noe som fører til betydelig bedre komprimering, spesielt med de mange små objektene som kreves for dokumentstrukturen (bildedata eller den faktiske beskrivelsen av en side har alltid blitt komprimert).

Når du arkiverer trykte dokumenter som PDF-filer, foretrekkes en blandet tilnærming for både å bevare originaldokumentet så mye som mulig og for å sikre søkbarhet. Ved smart å kombinere bildekomprimeringsmetodene som støttes av PDF, oppnås en veldig sterk komprimering (vanligvis 1: 200) ved å komprimere bakgrunnen (vanligvis flate strukturer og fargevalg) og tekst (skarpe kanter, men bare noen få farger) med forskjellige, spesielt egnede metoder og deretter plassert oppå hverandre. Den faktiske teksten blir hentet ut ved hjelp av OCR- prosessen og innebygd usynlig.

Navigering på skjermen

I motsetning til forrige sidebeskrivelse er språk som PostScript "Forhåndsvisning" på skjermen ikke lenger for å unngå eksempler på utskrifter bare et verktøy, men tilbyr praktiske funksjoner som ikke er mulig i uttrykket for kryssreferanser og referanser du ikke har som mål å bla , men kan hoppe direkte til målsiden ved å klikke på lenken. Navigering i dokumentet blir også tilrettelagt med sideikoner eller visning av strukturtrær (i henhold til innholdsfortegnelsen). Hvis du klikker på eksterne lenker, vises måldokumentet i nettleseren . Imidlertid må disse funksjonene være "innebygd" av forfatterprogramvaren (for eksempel med LaTeX og LaTeX-utvidelsespakken hyperref, se # TeX / DVI ) og implementeres av betrakteren .

Standard skrifttyper

14 skrifter ( standard 14 skrifter ) er tilgjengelige som standard i PDF-lesere og trenger derfor ikke å legges inn separat i PDF-dokumentet (bortsett fra PDF / A- og PDF / X- dokumenter):

PDF i operativsystemer

Med MacOS- operativsystemet fra Apple ble PDF brukt som standardformat for både skjerm og utskrift for første gang. PDF-generasjonen kan gjøres fra ethvert program som har en utskriftsdialog. Siden PDF også brukes til å generere utskriftsdataene, er det mulig å sende PostScript på skrivere som ikke er Postscript. Nesten alle typer dokumenter som kan skrives ut, kan konverteres til PDF. Denne muligheten eksisterer også under GNU / Linux. B. i utskriftsdialogen til skrivebordsmiljøet Gnome tilbys muligheten for PDF-generering naturlig.

Den gratis Adobe Reader / Acrobat Reader er tilgjengelig som PDF- visningsprogram under Windows , klassisk Mac OS og macOS, GNU / Linux og Unix-operativsystemene Solaris , HP / UX og AIX . Den integrerte Lucide-visningen er tilgjengelig under eComStation . Siden Windows 8 har Windows nå også en integrert PDF-visning. Windows 10 var også utstyrt med en PDF-skriver av Microsoft.

For Unix-baserte systemer er det også Xpdf- programmet , som er redusert til de mest grunnleggende funksjonene (visning på skjermen, søk i dokumentet, utskrift), samt noen få andre programmer ( Okular og Evince ) som er tilpasset skrivebordet ditt miljø. Disse open source-programmene er også egnet for å omgå de antatte "sikkerhetsfunksjonene" til PDF-dokumenter - det er noen ganger mulig å skrive ut dokumenter selv om forfatteren faktisk ønsket å nekte betrakteren av dokumentet dette alternativet.

Detaljer om sidegeometrien

De forskjellige boksene i PDF-filen

Informasjon om sidegeometrien i et PDF-dokument er spesielt viktig i trykkeribransjen . De beskriver i hvilket område på en side innholdet ligger som svarer til den trimmede endelige formatet, og hvor en ytterligere behandling program (for eksempel for utskyting , dvs. monterings sider på et trykkark) kan forvente en trim kvote. Moderne DTP-programmer lagrer denne informasjonen i PDF når de eksporteres direkte til PDF. Hvis PDF-filer sendes ut via PostScript, er den tilsvarende informasjonen vanligvis ikke inkludert. For PostScript-utdata fra bestemte programmer er Adobe Acrobat Distiller i stand til å utlede nettsidearealet fra beskjæringsmerkene, forutsatt at disse også ble sendt ut.

MediaBox (mediaramme)

Den definerer størrelsen på utdatamediet til PDF-dokumentet. Dokumentet er ennå ikke trimmet og inneholder vanligvis PostScript-sidestørrelsen som er angitt i PDF-generatoren. MediaBox må alltid være den største av alle boksene, siden den må inneholde alle de andre boksene, og det er den eneste boksen som alltid må inkluderes i en PDF.

CropBox (beskjæringsramme)

CropBox (noen ganger referert til som maskerammen) beskriver området på en PDF-side som skal skrives ut på skjermen eller på skriveren. Verdiene til MediaBox er forhåndsinnstilt.

BleedBox (bløderamme)

En avtappingsboks inneholder informasjon om uttaksrammen , som definerer størrelsen på det endelige formatet pluss den tiltenkte trimmen (overfyll). I trykkeribransjen kreves det vanligvis en lufting på 3 til 5 mm per side. Et applikasjonseksempel er bilder som er i utløpet (dvs. direkte på kanten av siden) eller bilder som faller av og er beskåret ved kanten av siden. For en A4-side som skal leveres til en skriver, resulterer en utblåsningsboks på 3 mm i en bredde på 210 mm + 6 mm og en lengde på 297 mm + 6 mm, dvs. 216 mm × 303 mm. Verdiene til CropBox er forhåndsinnstilt.

TrimBox (trimboks)

TrimBox er det endelige formatet på dokumentet uten trim.

ArtBox (objektramme)

ArtBox (også kalt avgrensningsboks ) beskriver sideseksjonen som skal brukes når du legger PDF-siden i et annet program; kan sammenlignes med størrelsesspesifikasjonen for import av en EPS- fil.

Skjemaprosesser

I tillegg til tekst og grafiske elementer, kan PDF-dokumenter inneholde interaktive skjemaelementer for skjemaprosesser. Komplette skjemaer kan dermed samles i ett PDF-dokument; Dataene som er registrert i dokumentet kan sendes tilbake til utgiveren av skjemaet på forskjellige måter.

  • Skriv ut og fyll ut: Det håndfylte skjemaet kan sendes på vanlig måte per post eller faks.
  • Fullføring og utskrift: Det elektronisk utfylte dokumentet kan skrives ut og sendes på konvensjonelle måter.
  • Fyll ut og send via en HTTP-forbindelse: Det elektronisk utfylte skjemaet kan sendes elektronisk via nettleseren eller fra Adobe Acrobat.
  • Fyll ut og send det elektronisk utfylte skjemaet via e-post.

Konvertering av andre formater til PDF

XML

PDF-dokumenter kan opprettes fra XML- data i to trinn:

  • Transformasjon ved hjelp av et XSLT- stilark til XSL-FO- format
  • En PDF-prosessor (for eksempel Apache FOP , Altsoft Xml2PDF ) genererer det ferdige PDF-dokumentet fra dette.

Et eksempel som er lett å følge er transformasjon / formatering av invitation.xml i PDF (eksemplet viser også transformasjonen i XHTML og WordML ).

HTML

PDF-dokumenter kan genereres fra en HTML- fil med HTMLDOC-programmet. Dette programmet har både et konsollgrensesnitt og et grafisk brukergrensesnitt. Det er således både på en klient for direkte drift av brukeren og for serverbruk, f.eks. B. egnet for on-the-fly generering av PDF-dokumenter.

En Perl- modul HTML :: HTMLDoc gjør grensesnittet til kommandolinjen enklere for Perl-utviklere .

Programmet wkhtmltopdf muliggjør generering av flere PDF-dokumenter samtidig, muligens inkludert en innholdsfortegnelse. Ved hjelp av Webkit-nettleserpakken, dokumenter av høy kvalitet, f.eks. B. for dokumentasjon av komplette nettsteder. wkhtmltopdf er et konsollprogram og kan også betjenes via Perl- modulen WKHTMLTOPDF.

Også PDF.js konvertitter PDF-filer (midlertidig) i HTML-kode for å vise for å muliggjøre dette i nettleseren.

TeX / DVI

  • Fra DVI- filer (formatet ble designet i 1979), som er opprettet av blant annet typesettingsprogrammene TeX og groff , kan PDF-filer opprettes på forskjellige måter:
    1. Den genererer fra .dvifilen ved hjelp av enhetsdriveren dvips en PostScript-fil ( .ps) og ut av dette med Adobe Distiller eller Ghostscript -Teilprogramm ps2pdf en .pdf- kort dvi→ps→pdf.
    2. Programmer som dvipdfm eller dvipdfmx , som konverterer DVI "direkte" til PDF, er en "delvis forkortelse" av denne metoden .
  • pdfTeX og LuaTeX er videreutvikling av TeX som "direkte" genererer PDF-filer uten mellomformatet DVI. Disse utvidelsene til TeX ble viktige på begynnelsen av det 21. århundre.

For mange TeX-brukere er de gitte alternativene til den førstnevnte metoden tilstrekkelig dvi→ps→pdf. Imidlertid legger andre TeX-brukere PostScript i kildekoden i en slik grad at disse metodene mislykkes. Dette gjelder spesielt når TeX-pakken PSTricks brukes. Tilleggspakkene pst-pdf, auto-pst-pdf og pdftricks gjør ting lettere i dette tilfellet. Samlet sett er det imidlertid tilfeller der den “tradisjonelle” metoden er dvi→ps→pdfuerstattelig. Men det er et annet alternativ

  • XeTeX , som dukket opp etter pdfTeX og litt tidligere enn LuaTeX. Det skaper et mellomformat XDV og fra det (knapt merke til brukeren) PDF med driveren xdvipdfmx. Dette er ment for å behandle PostScript i dokumentkildekoden. En pakke kalt xetex-pstricks er også tilgjengelig for bruk av PStricks .

3D-data

Eksempel på en 3D PDF-fil

3D PDF-dokumenter er PDF-dokumenter som inneholder enten en U3D- overflatemodell eller en BREP / overflatemodell PRC . De brukes hovedsakelig for å visualisere CAD- data, men brukes også i økende grad i vitenskapelige publikasjoner.

Den gratis Adobe Reader fra versjon 8.1 kan vise, animere, kutte og måle begge formatene. Med Acrobat 3D V7 kan 3D-data fra 40 CAD-formater konverteres til 3D PDF-filer; i 2010 overlot Adobe imidlertid utvikling, salg og støtte av 3D PDF-omformerteknologien til Tech Soft 3D og PROSTEP AG. Fra og med Acrobat X er konverteringen kun tilgjengelig som en avgiftsplugg for 3D PDF-omformer fra Tetra 4D.

Noen CAD-programmer som Allplan eller SolidWorks har en 3D PDF-eksport; Allplan tilbyr også en 3D PDF-import. Verktøy som Deep Exploration fra SAP, Pages3D fra QuadriSpace og 3DVIA Composer fra Dassault Systèmes kan også lagre 3D CAD-modeller som 3D PDF.

I tillegg til 3D-dataene som visualisering, kan annen relevant informasjon om en CAD-modell også settes inn i en PDF. For eksempel kan dataene til den ferdige modellen vises som en 3D-visualisering for produksjon av en metallplatedel.

Videoformater

Kombinasjon av SWF og 3D-data i en 3D PDF

Fra og med Acrobat 9 kan forskjellige videoformater konvertert til Shockwave Flash (SWF) legges inn i Adobe PDF. Dette betyr at videoer, animasjoner og applikasjoner kan brukes på mange plattformer. På grunn av Adobe Flash-støtten i Adobe Reader versjon 9 eller nyere, er ingen ekstra spiller nødvendig for avspilling. Siden den siste oppdateringen for Adobe Acrobat og Adobe Reader 9 har Adobe endret standardadferd for 3D PDF, inkludert å fjerne Flash-spilleren fra Adobe Acrobat 9 og Adobe Reader 9 - Flash-innhold har tilgang til Flash-spilleren i operativsystemet. Adobe Acrobat X og Adobe Reader X påvirkes ikke, ettersom det nesten ikke er angrep. 3D-data, SWF-funksjoner og SWF-videoformater kan også kombineres; Dette gjør det mulig å dekke deler av modellen med SWF-videoer og funksjoner.

Office-applikasjonsfiler

Mange nåværende programpakker som Apple iWork , Microsoft Office , LibreOffice , OpenOffice.org og Softmaker Office tilbyr en PDF-eksport.

Versjoner av PDF

år PDF-versjon Adobe-versjon Kjennetegn
1993 1.0 / PDF 1 Visuelt attraktiv tekstvisning, innebygging av bokmerker og interne kryssreferanser, leseren heter Carousel
1994 1.1 2 eksterne kryssreferanser, innebygging av multimediafiler i lyd- og videoformater som nå er foreldet, dokumenter kan søkes, 40-biters kryptering
1996 1.2 3 Mulighet for å bruke CMYK fargemodell , direkte åpning i nettleservinduet ved å implementere nettleserutvidelser (såkalte plugin-moduler), tilgjengelighets plugin-modul for blinde for Acrobat Reader 3, interaktive elementer som avkrysningsruter og radioknapper er mulig
1999 1.3 4. plass Støtte for asiatiske skrifttyper, forbedret tilgjengelighetstillegg for Acrobat Reader, fortsatt 40-biters kryptering, digitale signaturer, JavaScript- elementer mulig
2001 1.4 5 Eliminering av tilgjengelighetsprogrammet, men støtte for MSAA (Microsoft Active Accessibility) av Acrobat Reader, RC4- kryptering med 40–128 bits, beskrivelse av den logiske dokumentstrukturen med koder
2003 1.5 Sjette Innbygging av bilder i JPEG 2000- format , filmer i MPEG- format og lydfiler i MP3- format mulig, kryptering av offentlig nøkkel PKCS # 7 ; Leseprogram heter nå Adobe Reader, støtter ikke lenger DOS-baserte Windows-versjoner ( Windows 9x )
2004 1.6 7. Støtte for det universelle 3D -filformatet, innebygging av OpenType- skrifter, støtte for XFA 2.2 rich text-elementer og attributter, AES- kryptering, PKCS # 7-kryptering med SHA256 , DSA opptil 4096 bits, utilgjengelig PDF -Dokumenter kan leveres med koder, bedre støtte for flerkolonnedokumenter, skjemafelt kan leses ut ved hjelp av taleutgangsfunksjonene, PDF-skaper med tilgjengelighetsassistent: støtter optimalisering for skjermlesere og skjermforstørrelsesprogrammer
2006 1.7 8. plass ytterligere forbedring av 3D-skjermalternativene, sterkere krypteringsalgoritmer (PKCS # 7 med SHA384, SHA512 og RIPEMD-160 , 256-bit AES)
2008 1.7 9 ytterligere forbedring
2010 1.7 X ytterligere forbedring
2012 1.7 XI ytterligere forbedring
2017 2.0 DC Støtte for PRC -filformat, 3D-måleverktøy, forbedrede sikkerhetsfunksjoner

Normer og standarder

Siden 1997 har standarder basert på PDF blitt utviklet og vedtatt i forskjellige ISO- komiteer . Basert på visse PDF-versjoner er minimumskrav og begrensninger definert. I denne sammenheng har Adobe Systems gitt de relevante ISO-komiteene rett til å gjøre de nødvendige spesifikasjonene tilgjengelige for nedlasting i en ubegrenset periode.

Som en grov tilnærming tilsvarer disse standardene de forskjellige versjonene av PDF som grunnlag:

ISO år Type versjon Betegnelse / bemerkning
15930 2001 PDF / X 1.3 Format for innlevering av kunstverk
15930-1 2001 PDF / X-1a 1.3 se PDF / X
15930-5 2003 PDF / X-2 1.4 se PDF / X
15930-4 2003 PDF / X-1a 1.4 se PDF / X
15930-3 2002 PDF / X-3 1.3 se PDF / X
15930-6 2003 PDF / X-3 1.4 se PDF / X
15930-7 2008 PDF / X-4 1.6 se PDF / X
15930-8 2008 PDF / X-5 1.6 se PDF / X
19005-1 2005 PDF / A-1 1.4 Format for elektronisk arkivering
19005-1 2007 PDF / A-1 1.4 Retting PDF / A-1
19005-2 2011 PDF / A-2 1.7 se PDF / A-1
19005-3 2012 PDF / A-3 1.7 se PDF / A-1
24517 2008 PDF / E 1.6 Format for tekniske dokumenter fra ingeniørfag, arkitektur og geografiske informasjonssystemer (PDF engineering)
- 2008 PDF / H Dokumentformat for helsevesen (PDF helsetjenester)
14289 2008 PDF / UA 1.7 Retningslinjer for å lage et tilgjengelig dokument i PDF-format (Universal Accessibility)
16612-2 2010 PDF / VT 1.6 Format for bruk i høyt volum og transaksjonstrykk (PDF variabel og transaksjonsutskrift)
32000-1 2008 PDF 1.7 1.7
32000-2 2017 PDF 2.0 2.0

litteratur

weblenker

Commons : Portable Document Format  - samling av bilder, videoer og lydfiler
Wiktionary: PDF  - forklaringer av betydninger, ordets opprinnelse, synonymer, oversettelser

Individuelle bevis

  1. Jim Meehan, Ed Taft, Stephen Chernicoff, Caroline Rose, Ron Karr: PDF Reference, femte utgave, kapittel 1.5 Intellectual Property. (PDF; 8,1 MB) (Ikke lenger tilgjengelig online.) Adobe Systems, november 2004, s. 7 , arkivert fra originalen 16. juni 2015 ; åpnet 3. november 2010 .
  2. PDF . Wiki fra Ubuntuusers.de
  3. a b Chaos Communication Congress: Ikke tro alt som er i et PDF-dokument . Zeit Online , desember 2019; åpnet 4. januar 2020.
  4. ghostscript.com ( Memento fra 13. september 2015 i Internet Archive )
  5. pakke hyperref. Omfattende TeX Archive Network ; åpnet 2. januar 2018.
  6. PDF-referanse (sjette utgave, versjon 1.7) - 5.5.1 Standard Type 1-skrifter ( Memento fra 6. juli 2015 i Internett-arkivet ) (PDF, 31 MB, 1.310 sider)
  7. netzwelt.de
  8. giga.de
  9. Stefan Mintert: invitation.xml - Transformer en enkelt kildekode XML-fil til flere utdataformater. På: Linkwerk GmbH nettsted. Hentet 3. november 2010 .
  10. HTMLDOC Open Source-hjemmesiden. (Ikke lenger tilgjengelig online.) Michael R Sweet, 16. januar 2017, arkivert fra originalen 21. februar 2016 ; åpnet 16. januar 2017 .
  11. wkhtmltopdf. Open Source Project, åpnet 30. desember 2011 .
  12. Webkit Open Source Project. Open Source Project, åpnet 30. desember 2011 .
  13. Nettsted som PDF med innholdsfortegnelse. Innovate Webdoc Services, åpnet 30. desember 2011 .
  14. ps2pdf: PostScript-til-PDF-omformerghostscript .com
  15. PStricks-side om PDF-eksport. tug.org.
  16. xetex på CTAN.
  17. Det høyeste vurderte svaret fra Herbert Voss på spørsmål 8413 på tex.stackexchange.com.
  18. Svar fra "egreg" (Enrico Gregorio) på spørsmål 19966 på tex.stackexchange.com.
  19. PRC Format Specification ( Memento fra 2. desember 2008 i Internet Archive ) hos Adobe
  20. Axel Newe: Berikende vitenskapelige publikasjoner med interaktiv 3D PDF: en integrert verktøykasse for å lage klare til å publisere figurer . I: PeerJ Informatikk . teip 2 , 20. juni 2016, ISSN  2376-5992 , doi : 10.7717 / peerj-cs.64 ( peerj.com [åpnet 28. juni 2016]).
  21. Acrobat Pro Bundle ( Memento fra 11. mai 2012 i Internet Archive ) på Tech Soft 3D
  22. PDF Generator 3D fra PROSTEP AG
  23. Acrobat X Pro hos Adobe
  24. 3D PDF Converter plug-in på Tetra 4D
  25. offisiell hjelpedokumentasjon. DassaultSystemes Solidworks, åpnet 27. juni 2019 .
  26. Formats Datautvekslingsformater . allplan.com
  27. Deep Exploration ( minne fra 07.09.2012 i nettarkivet archive.today ) av Right Hemisphere, siden 2012 SAP
  28. Pages3D, QuadriSpace
  29. 3DVIA Composer ( Memento fra 25 mai 2013 i nettarkivet archive.today ) på Dassault Systèmes
  30. 3D-PDF-eksempel på UNITEC Information Systems
  31. Ta dokumenter til neste nivå med PDF 2.0. (PDF) Adobe, åpnet 11. september 2017 .
  32. ISO 32000-2: 2017. ISO Org, åpnet 11. september 2017 .