Kā iegūt un saglabāt attēlus no PDF faila Linux
Jūs varat viegli konvertēt PDF failus uz rediģējamu tekstu Linux, izmantojot komandrindas rīku “pdftotext”. Tomēr, ja oriģinālajā PDF failā ir attēli, tie netiek iegūti. Lai izņemtu attēlus no PDF faila, varat izmantot citu komandrindas rīku, ko sauc par “pdfimages”.
PIEZĪME. Kad mēs sakām, ka rakstīt kaut ko šajā rakstā, un tekstā ir citāti, NELIETOJIET citātus, ja vien mēs nenorādām citādi.
„Pdfimages” rīks ir daļa no poppler-utils paketes. Jūs varat pārbaudīt, vai tā ir instalēta jūsu sistēmā, un, ja nepieciešams, instalējiet to, izmantojot šajā rakstā aprakstītās darbības.
Lai izņemtu attēlus no PDF faila, izmantojot pdfimages, nospiediet “Ctrl + Alt + T”, lai atvērtu termināļa logu. Uzvednē ierakstiet šādu komandu.
pdfimages / home / lori/Documents/SampleWithImages.pdf / home / lori / Dokumenti / ExtractedImages / image
PIEZĪME. Attiecībā uz visām šajā rakstā redzamajām komandām nomainiet komandu pirmo ceļu un PDF faila nosaukumu uz sākotnējā PDF faila ceļu un faila nosaukumu. Otrajam ceļam jābūt ceļam uz saknes mapi, kurā vēlaties saglabāt iegūtos attēlus. Otrā ceļa beigās vārds “image” attēlo visu, ko vēlaties, lai ievadītu savu faila nosaukumu. Attēlu failu nosaukumi tiek numurēti automātiski (000, 001, 002, 003 utt.). Ja katra attēla sākumā vēlaties pievienot tekstu, ievadiet šo tekstu otrā ceļa beigās. Mūsu piemērā katrs attēla faila nosaukums sāksies ar “attēlu”, piemēram, attēlu-001.ppm, attēlu-002.ppm utt. Starp norādīto tekstu un numuru tiek pievienots domuzīme..
Noklusētais attēla formāts ir PPM (portatīvais piksejs), kas paredzēts monohromatiskiem attēliem, vai PBM (portatīvais bitmap) monohromatiskiem attēliem. Šie formāti ir izstrādāti tā, lai tos varētu viegli apmainīt starp platformām.
PIEZĪME. Katram attēlam PDF failā var iegūt divus attēlu failus. Katra attēla otrais attēls ir tukšs, tāpēc jūs varēsiet pateikt, kuri attēli satur failus no faila, izmantojot faila pārvaldnieka sīktēlu..
Lai izveidotu .jpg attēlu failus, komandai pievienojiet opciju “-j”, kā parādīts zemāk.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenti / ExtractedImages / image
PIEZĪME Jūs varat arī mainīt noklusējuma izeju uz PNG, izmantojot opciju “png” vai TIFF, izmantojot opciju.
Katra attēla galvenais attēla fails tiek saglabāts kā .jpg fails. Otrais tukšais attēls joprojām ir .ppm vai .pbm fails.
Ja vēlaties konvertēt attēlus tikai noteiktā lapā un pēc tās, izmantojiet opciju “-f” ar numuru, lai norādītu pirmo lapu konvertēšanai, kā parādīts tālāk sniegtajā piemēru komandā.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenti / ExtractedImages / image
PIEZĪME: “-j” opciju mēs apvienojām ar opciju “-f”, lai mēs iegūtu .jpg attēlus un darītu to pašu ar “-1” opciju, kas minēta zemāk.
Lai pārvērstu visus attēlus pirms un uz konkrētas lapas, izmantojiet opciju “-l” (mazais “L”, nevis numurs “1”) ar numuru, lai norādītu pēdējo pārvēršamo lapu, kā parādīts zemāk.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenti / ExtractedImages / image
PIEZĪME Jūs varat izmantot opcijas “-f” un “-l”, lai konvertētu attēlus konkrētā lapas diapazonā dokumenta vidū.
Ja PDF failā ir īpašnieka parole, izmantojiet opciju “-opw” un atsevišķos citātus, kā parādīts zemāk. Ja PDF faila parole ir lietotāja parole, izmantojiet paroli “-upw” ar paroli.
PIEZĪME: Pārliecinieties, ka komandā ir paroles cipari.
pdfimages -opw 'parole' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Dokumenti / ExtractedImages / image
Lai iegūtu plašāku informāciju par komandas pdfimages izmantošanu, termina logā ierakstiet “pdfimages” un nospiediet “Enter”. Komandu lietošanas displejā tiek parādīts saraksts ar iespējām, kas pieejamas komandā.