Mājas lapa » » Veidojiet lejupielādes plānotāju ar nelielu programmēšanas prasmi

    Veidojiet lejupielādes plānotāju ar nelielu programmēšanas prasmi

    Mēs visi mīlam lejupielādēt stuff no interneta, un ir daudz lielisku lejupielādes pārvaldnieku rīku, kurus mēs varam izmantot, lai ieplānotu lejupielādes. Iespējams, vienkārši ir vieglāk izmantot lejupielādes pārvaldnieku, taču nav nekādu kaitējumu, pētot instrumentus, kas jau ir mūsu Ubuntu komplektā, un pilnībā izmantot to.

    Šajā rakstā mēs parādīsim iebūvētu programmatūru Ubuntu, ko mēs varam izmantot, lai lejupielādētu stuff no interneta, izmantojot wget. Papildus tam mēs parādīsim, kā plānot lejupielādi, izmantojot Cron.

    Lejupielādēt, izmantojot Wget

    Wget ir bezmaksas programmatūras pakotne, lai izgūtu failus, izmantojot HTTP, HTTPS un FTP, kas ir visplašāk izmantotie interneta protokoli. Tas ir neinteraktīvs komandrindas rīks, tāpēc to var viegli saukt no skriptiem, cron darbiem, termināliem bez X-Windows atbalsta utt..

    Atveriet savu termināli un izpētīsim, kā mēs varam izmantot wget, lai lejupielādētu stuff no tīkla. Lejupielādes ar wget pamata sintakse ir šāda:

    wget [opcija]… [URL]…

    Šī komanda lejupielādēs wget rokasgrāmatu jūsu vietējā diskā

    wget http://www.gnu.org/software/wget/manual/wget.pdf

    Linux Cron

    Ubuntu komplektā ir crona dēmons, ko izmanto, lai noteiktu uzdevumu izpildi noteiktā laikā. Crontab ļauj jums norādīt darbības un laikus, kad tie būtu jāizpilda. Tādā veidā jūs parasti plānojat uzdevumu, izmantojot komandrindas rīku.

    Atveriet termināļa logu un ievadiet crontab -e.

    Katru no crontab sadaļām atdala atstarpe, pēdējā daļā ir viena vai vairākas telpas. Crona ierakstu veido minūte (0-59), stunda (0-23, 0 = pusnakts), diena (1-31), mēnesis (1-12), darba diena (0-6, 0 = svētdiena), komanda. Trešais ieraksts iepriekš minētajā crontab lejupielādē wget.pdf at 2:00. Pirmais ieraksts (0) un otrais ieraksts (2) nozīmē 2:00. Trešais līdz piektais ieraksts (*) nozīmē jebkuru dienas, mēneša vai nedēļas laiku. Pēdējais ieraksts ir wget komanda, lai lejupielādētu wget.pdf no norādītā URL.

    Tas ir pamatmērķis un kā darbojas Cron. Ņemsim laupījumu reālā dzīves piemērā par to, kā plānot lejupielādi.

    Plānošanas lejupielāde

    Mēs lejupielādēsim Firefox 3.6 2 AM. Tā kā mūsu ISP sniedz tikai ierobežotu datu apjomu, mums ir jāpārtrauc lejupielāde plkst. Tieši tā izskatās.

    Ignorējiet pirmos divus ierakstus iepriekš minētajā crontab. Trešā un ceturtā komanda ir tikai 2 komandas, kas jums ir nepieciešamas. Trešā komanda nosaka uzdevumu, kas lejupielādēs Firefox pulksten 2:00:

    [kods]
    0 2 * * * wget -c http://download.mozilla.org/?product=firefox-3.6.6&os=win&lang=en-GB
    [/ kods]

    -C opcijas norāda, ka wget jāatjauno esošā lejupielāde, ja tā nav pabeigta.

    Ceturtā komanda pārtrauks wget plkst. "Killall" ir unix komanda, kas nogalina procesus pēc nosaukuma.

    [kods]
    0 8 * * * killall wget
    [/ kods]

    Killall wget stāsta Ubuntu, lai apturētu wget no faila lejupielādes pulksten 8:00.

    Citas noderīgas wget komandas

    1. Norādiet direktoriju, lai lejupielādētu failu

    [kods]
    wget -output-document = / home / zainul / Lejupielādes / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
    [/ kods]

    opcija -output-document ļauj norādīt direktoriju un lejupielādējamā faila nosaukumu

    2. Tīmekļa vietnes lejupielāde

    Wget var arī lejupielādēt vietni.

    [kods]
    wget -m http://www.google.com/profiles/zainul.franciscus
    [/ kods]

    Iepriekš minētā komanda lejupielādēs manu visu Google profila tīmekļa lapu. Opcija "-m" norāda wget, lai lejupielādētu norādītā URL "spoguļattēlu".

    Vēl viena svarīga iespēja ir informēt wget, cik daudz saišu vajadzētu sekot, lejupielādējot vietni.

    [kods]
    wget -r -l1 http://www.google.com/profiles/zainul.franciscus
    [/ kods]

    Minētā komandu komanda izmanto divas iespējas. Pirmā opcija "-r" norāda wget, lai lejupielādētu norādīto tīmekļa vietni rekursīvi. Otrā opcija "-l1" norāda wget, lai iegūtu tikai pirmo saiti no šīs norādītās vietnes. Mēs varam iestatīt līdz pat trīs līmeņiem "-12" un "-13".

    3. Robota ieraksta ignorēšana

    Web meistars uztur teksta failu ar nosaukumu Robot.txt. 'Robot.txt' uztur URL sarakstu, ko tīmekļa lapas rāpuļprogrammai, piemēram, wget, nevajadzētu pārmeklēt. Mēs varam pateikt wget ignorēt 'Robot.txt' ar '-erobots = off' opciju. Nākamā komanda norāda wget, lai lejupielādētu manu Google profila pirmo lapu un ignorētu 'Robot.txt.

    [kods]
    wget -erobots = off http://www.google.com/profiles/zainul.franciscus
    [/ kods]

    Vēl viena noderīga iespēja ir -U. Šī opcija maskēs wget kā pārlūkprogrammu. Ņemiet vērā, ka lietojumprogrammas kā citas lietojumprogrammas maskēšana var pārkāpt interneta pakalpojumu sniedzēja termiņu un pakalpojumu.

    [kods]
    wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
    [/ kods]

    Secinājums

    Wget ir ļoti veca skola, bet gan hackable GNU programmatūras pakotne, kuru mēs varam izmantot, lai lejupielādētu failus. Wget ir interaktīva komandrindas rīks, kas nozīmē, ka mēs varam ļaut tai darboties mūsu datorā fonā bez nepieciešamības sākt jebkuru programmu. Apskatiet wget man lapu

    [kods]
    $ man wget
    [/ kods]

    lai saprastu citas iespējas, ko varam izmantot ar wget.

    Saites

    Wget rokasgrāmata
    Kā apvienot divus lejupielādētos failus, kad wget neizdodas pusceļā
    Linux QuickTip: lejupielāde un atcelšana vienā solī