Hemsida » hur » Varför är PDF-filer som genereras av Microsoft Word så stor?

    Varför är PDF-filer som genereras av Microsoft Word så stor?

    När dina dokument huvudsakligen är text bara i naturen, verkar det som att filstorlekarna för .docx och .pdf-versioner ska vara ganska lika när de sparas, men det är inte alltid fallet. Dagens SuperUser Q & A-post har svaret på en nyfiken läsarens frågor om den stora skillnaden i filstorlekar.

    Dagens Question & Answer-session kommer till oss med tillstånd av SuperUser-en indelning av Stack Exchange, en community-driven gruppering av Q & A-webbplatser.

    Boxningshandskar ClipArt artighet av Clker.com.

    Frågan

    SuperUser-läsaren Borek vill veta varför PDF-filer som genereras av Microsoft Word är så stora:

    Jag skapade ett enkelt Microsoft Word-dokument som innehåller just denna mening, inget annat:

    • Detta är ett litet dokument.

    Sedan sparade jag dokumentet som .docx och .pdf-filer. Här är filstorlekarna:

    • .docx: 12 kB
    • .pdf: 89 kB

    Skillnaden mellan de två filerna är enorm (tekniskt) och det stör mig verkligen när dokument som mestadels är textbaserade är bara tiotals kB i. Docx-format, men är hundratals kB i storlek när de konverteras till PDF-filer. Vad är så ineffektivt om PDF-formatet? Är det bara Microsoft Word med någon hemsk utdataalgoritm?

    Förresten är inställningarna för PDF-utgången i min Microsoft Office-installation inställd för att skapa de minsta möjliga filerna:

    Varför är PDF-filer som genereras av Microsoft Word så stora?

    Svaret

    SuperUser contributor rene har svaret för oss:

    Om du öppnar PDF-filen i Notepad ++ hittar du:

    Och det här objektet refereras här i slutet av instruktionen / FontFile2:

    De teckensnitt som används av ett Microsoft Word-dokument är inbäddade i PDF-filer så att de är fristående. Jag använde detta bildspel från Adobe för att dechiffrera PDF-instruktionerna.

    Om du vill förhindra att teckensnitt integreras i en PDF-fil, se till att dina Microsoft Word-dokument använder sig av en av de 14 standardtecknen som finns i PDF-tittare (Källa: Wikipedia).

    • Times New Roman> Times (v3) (i vanlig, kursiv, fet och fet kursiv)
    • Courier New> Courier (i vanligt, snett, djärvt och djärvt snett)
    • Arial> Helvetica (v3) (i regelbunden, sned, djärv och djärv snett)
    • Symbol> Symbol
    • Wingdings> Zapf Dingbats

    Har du något att lägga till förklaringen? Ljud av i kommentarerna. Vill du läsa mer svar från andra tech-savvy Stack Exchange-användare? Kolla in hela diskussionsgängan här.