Kā konvertēt PDF failu uz rediģējamu tekstu, izmantojot komandrindu Linux
Ir dažādi iemesli, kāpēc PDF failu var pārveidot par rediģējamu tekstu. Varbūt jums ir nepieciešams pārskatīt veco dokumentu, un viss, kas jums ir, ir tā PDF versija. PDF failu konvertēšana sistēmā Windows ir vienkārša, bet gan, ja lietojat Linux?
Neuztraucies. Mēs jums parādīsim, kā viegli konvertēt PDF failus uz rediģējamu tekstu, izmantojot komandrindas rīku pdftotext, kas ir daļa no "poppler-utils" paketes. Šis rīks jau var būt instalēts. Lai pārbaudītu, vai jūsu sistēmā ir instalēts pdftotext, nospiediet “Ctrl + Alt + T”, lai atvērtu termināļa logu. Ievadiet šādu komandu uz uzvednes un nospiediet "Enter".
dpkg -s poppler-utils
PIEZĪME. Kad mēs sakām, ka rakstīt kaut ko šajā rakstā, un tekstā ir citāti, NELIETOJIET citātus, ja vien mēs nenorādām citādi.
Ja pdftotext nav instalēts, uzvednē ierakstiet šādu komandu un nospiediet “Enter”.
sudo apt-get instalēt poppler-utils
Kad tiek prasīts, ievadiet savu paroli un nospiediet „Enter”.
Poppler-utils pakotnē ir pieejami vairāki rīki PDF konvertēšanai dažādos formātos, manipulējot ar PDF failiem un iegūstot informāciju no failiem.
Turpmāk ir pamata komanda PDF faila konvertēšanai uz rediģējamu teksta failu. Nospiediet “Ctrl + Alt + T”, lai atvērtu termināļa logu, ierakstiet komandu uz uzvednes un nospiediet “Enter”.
pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Mainiet ceļu uz katru failu, lai tas atbilstu sākotnējā PDF faila atrašanās vietai un nosaukumam un kur vēlaties saglabāt iegūto teksta failu. Mainiet arī failu nosaukumus, lai tie atbilstu jūsu failu nosaukumiem.
Teksta fails ir izveidots un var tikt atvērts, tāpat kā jūs atvērtu jebkuru citu teksta failu Linux.
Pārvērstajam tekstam var būt rindas pārtraukumi vietās, kuras nevēlaties. Pēc katras PDF faila rindas tiek ievietoti rindu pārtraukumi.
Izmantojot oriģinālo PDF failu konvertētā teksta failā, varat saglabāt dokumenta izkārtojumu (galvenes, kājenes, peidžeri utt.), Izmantojot karodziņu “-layout”.
pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Ja vēlaties konvertēt tikai PDF failu diapazonu, izmantojiet “-f” un “-l” (mazie “L”) karogi, lai norādītu pirmās un pēdējās lapas diapazonā, kuru vēlaties konvertēt.
pdftotext -f 5 -1 9 / home / lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Lai konvertētu PDF failu, kas ir aizsargāts un šifrēts ar īpašnieka paroli, izmantojiet “-ww” karodziņu (pirmā zīme karogā ir mazais burts “O”, nevis nulle).
pdftotext -opw 'parole' /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt
Mainiet “paroli” uz to, ko izmanto, lai aizsargātu konvertējamo sākotnējo PDF failu. Pārliecinieties, ka ir “vienas paroles” apzīmējumi, nevis dubultas.
Ja PDF fails ir aizsargāts un šifrēts ar lietotāja paroli, izmantojiet “-ww” karogu, nevis “-ww” karogu. Pārējā komanda ir tāda pati.
Varat arī norādīt līnijas beigu rakstzīmes veidu, kas tiek izmantots konvertētajam tekstam. Tas ir īpaši noderīgi, ja plānojat piekļūt failam citā operētājsistēmā, piemēram, Windows vai Mac. Lai to izdarītu, izmantojiet “-eol” karodziņu (vidējā zīme karogā ir mazais burts “O”, nevis nulle), kam seko atstarpe un līnijas beigu rakstzīme, kuru vēlaties izmantot (“ unix ”,“ dos ”vai“ mac ”).
PIEZĪME: Ja teksta failam nav norādīts faila nosaukums, pdftotext automātiski izmanto PDF faila nosaukumu un pievieno paplašinājumu .txt. Piemēram, “file.pdf” tiks pārveidots par “file.txt”. Ja teksta fails ir norādīts kā “-”, konvertētais teksts tiek nosūtīts uz stdout, kas nozīmē, ka teksts tiek parādīts Terminal logā un netiek saglabāts failā.
Lai aizvērtu termināļa logu, augšējā kreisajā stūrī noklikšķiniet uz pogas „X”.
Plašāku informāciju par komandu pdftotext ierakstiet “man page pdftotext” uz lodziņa Terminal log.