Varför är PDF-filer som genereras av Microsoft Word så stor?
När dina dokument huvudsakligen är text bara i naturen, verkar det som att filstorlekarna för .docx och .pdf-versioner ska vara ganska lika när de sparas, men det är inte alltid fallet. Dagens SuperUser Q & A-post har svaret på en nyfiken läsarens frågor om den stora skillnaden i filstorlekar.
Dagens Question & Answer-session kommer till oss med tillstånd av SuperUser-en indelning av Stack Exchange, en community-driven gruppering av Q & A-webbplatser.
Boxningshandskar ClipArt artighet av Clker.com.
Frågan
SuperUser-läsaren Borek vill veta varför PDF-filer som genereras av Microsoft Word är så stora:
Jag skapade ett enkelt Microsoft Word-dokument som innehåller just denna mening, inget annat:
- Detta är ett litet dokument.
Sedan sparade jag dokumentet som .docx och .pdf-filer. Här är filstorlekarna:
- .docx: 12 kB
- .pdf: 89 kB
Skillnaden mellan de två filerna är enorm (tekniskt) och det stör mig verkligen när dokument som mestadels är textbaserade är bara tiotals kB i. Docx-format, men är hundratals kB i storlek när de konverteras till PDF-filer. Vad är så ineffektivt om PDF-formatet? Är det bara Microsoft Word med någon hemsk utdataalgoritm?
Förresten är inställningarna för PDF-utgången i min Microsoft Office-installation inställd för att skapa de minsta möjliga filerna:
Varför är PDF-filer som genereras av Microsoft Word så stora?
Svaret
SuperUser contributor rene har svaret för oss:
Om du öppnar PDF-filen i Notepad ++ hittar du:
Och det här objektet refereras här i slutet av instruktionen / FontFile2:
De teckensnitt som används av ett Microsoft Word-dokument är inbäddade i PDF-filer så att de är fristående. Jag använde detta bildspel från Adobe för att dechiffrera PDF-instruktionerna.
Om du vill förhindra att teckensnitt integreras i en PDF-fil, se till att dina Microsoft Word-dokument använder sig av en av de 14 standardtecknen som finns i PDF-tittare (Källa: Wikipedia).
- Times New Roman> Times (v3) (i vanlig, kursiv, fet och fet kursiv)
- Courier New> Courier (i vanligt, snett, djärvt och djärvt snett)
- Arial> Helvetica (v3) (i regelbunden, sned, djärv och djärv snett)
- Symbol> Symbol
- Wingdings> Zapf Dingbats
Har du något att lägga till förklaringen? Ljud av i kommentarerna. Vill du läsa mer svar från andra tech-savvy Stack Exchange-användare? Kolla in hela diskussionsgängan här.