Hemsida » hur » Så här extraheras och sparas bilder från en PDF-fil i Linux

    Så här extraheras och sparas bilder från en PDF-fil i Linux

    Du kan enkelt konvertera PDF-filer till redigerbar text i Linux med hjälp av kommandoradsverktyget "pdftotext". Om det emellertid finns några bilder i den ursprungliga PDF-filen extraheras de inte. För att extrahera bilder från en PDF-fil kan du använda ett annat kommandoradsverktyg som heter "pdfimages".

    OBS! När vi säger att du skriver in något i den här artikeln och det finns citat runt texten, Skriv INTE citat, såvida vi inte anger något annat.

    "Pdfimages" -verktyget är en del av poppler-utils-paketet. Du kan kontrollera om den är installerad på ditt system och installera den om det behövs med hjälp av stegen som beskrivs i den här artikeln.

    För att extrahera bilder från en PDF-fil med pdfimages, tryck på "Ctrl + Alt + T" för att öppna ett terminalfönster. Skriv följande kommando vid prompten.

    pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    OBS! För alla kommandon som visas i den här artikeln, ersätt den första sökvägen i kommandot och PDF-filnamnet till sökvägen och filnamnet för din ursprungliga PDF-fil. Den andra sökvägen ska vara sökvägen till rotmappen i vilken du vill spara de extraherade bilderna. Ordet "bild" i slutet av den andra sökvägen representerar vad du vill förorda ditt filnamn med. Filnamn på bilderna numreras automatiskt (000, 001, 002, 003, etc.). Om du vill lägga till text i början av varje bild anger du den texten i slutet av den andra sökvägen. I vårt exempel börjar varje bildfilnamn med "bild", till exempel bild-001.ppm, bild-002.ppm etc. En streck läggs till mellan den text du anger och numret.

    Standardbildformatet är PPM (portabel pixmap) för icke-monokroma bilder, eller PBM (bärbar bitmapp) för monokroma bilder. Dessa format är utformade för att enkelt bytas mellan plattformar.

    OBS! Du kan få två bildfiler för varje bild i din PDF-fil. Den andra bilden för varje bild är tom, så du kan se vilka bilder som innehåller bilderna från filen med miniatyren i filen i Filhanteraren.

    För att skapa .jpg-bildfiler, lägg till alternativet "-j" till kommandot, som visas nedan.

    pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    OBS! Du kan också ändra standardutmatningen till PNG med alternativet "-png" eller TIFF med alternativet "-tiff".

    Huvudbildfilen för varje bild sparas som en .jpg-fil. Den andra tomma bilden är fortfarande en .ppm eller .pbm-fil.

    Om du bara vill konvertera bilder på och efter en viss sida, använd alternativet "-f" med ett nummer för att ange den första sidan som ska konverteras, som visas i exempelkommandot nedan.

    pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    OBS: Vi kombinerade alternativet "-j" med alternativet "-f" så att vi skulle få .jpg-bilder och gjorde detsamma med alternativet "-l" som nämns nedan.

    Om du vill konvertera alla bilder före och på en viss sida, använd "-l" (ett litet "L", inte alternativet "1") med ett nummer för att indikera den sista sidan som ska konverteras, som visas nedan.

    pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    OBS! Du kan använda alternativen "-f" och "-l" tillsammans för att konvertera bilder i ett visst sidintervall mitt i dokumentet.

    Om det finns ett ägarlösenord i PDF-filen, använd alternativet "-opw" och lösenordet i enskilda citat, enligt nedan. Om lösenordet i PDF-filen är ett användarlösenord, använd alternativet "-upw" istället med lösenordet.

    OBS! Se till att det finns enkla citat runt ditt lösenord i kommandot.

    pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image

    För mer information om hur du använder pdfimages-kommandot, skriv "pdfimages" vid prompten i ett Terminal-fönster och tryck på "Enter". Kommandotillgången visas med en lista över alternativ som är tillgängliga för kommandot.