Chcete vedieť, ako môžete pomocou terminálu zachytiť webovú stránku a uložiť ju ako dokument PDF alebo obrázok? Našťastie má Linux množstvo nástrojov, ktoré môžete použiť na automatizáciu prevodu dokumentov HTML na súbory a obrázky PDF.
Tento článok vás zoznámi s nástrojmi wkhtmltopdf a wkhtmltoimage, nástrojmi, ktoré potrebujete na uľahčenie práce.
Ako previesť HTML do PDF
Ak chcete zachytávať webové stránky a prevádzať ich na súbory PDF, pomôže vám s tým nástroj wkhtmltopdf. Wkhtmltopdf je nástroj príkazového riadka s otvoreným zdrojovým kódom, ktorý sa používa na vykresľovanie webových stránok do dokumentov PDF.
Pretože nástroj funguje bezhlavo v termináli Linux, nebudete potrebovať žiadny webový ovládač ani rámec na automatizáciu prehliadača, ako je Selenium.
Nainštalujte wkhtmltopdf na Linux
Wkhtmltopdf nepatrí k štandardným balíkom, ktoré sú predinštalované v systéme Linux. Budete ho musieť nainštalovať ručne pomocou správcu balíkov vášho systému.
Inštalácia wkhtmltopdf do distribúcií založených na Ubuntu a Debiane:
sudo apt install wkhtmltopdf
V distribúciách založených na Arch, ako Manjaro Linux:
sudo pacman -S wkhtmltopdf
Inštalácia wkhtmltopdf na distribúcie založené na RHEL, ako sú Fedora a CentOS, je tiež jednoduchá.
sudo dnf install wkhtmltopdf
Základná syntax
Základná syntax príkazu je:
wkhtmltopdf webpage filename
...kde webstránka je adresa URL webovej stránky, ktorú chcete previesť, a názov súboru je názov výstupného súboru PDF.
Ak chcete previesť domovskú stránku Google na dokument PDF:
wkhtmltopdf https://google.com google.pdf
Výkon:
Pri otvorení súboru PDF si všimnete, že wkhtmltopdf presne vykreslil webovú stránku do dokumentu.
Vytlačte viac kópií webovej stránky
The -kópie flag je záchranca, ak chcete, aby váš výstupný súbor mal viac kópií webovej stránky. Pri tlači viacerých kópií wkhtmltopdf nevygeneruje viac súborov PDF, ale namiesto toho pridá k jednému dokumentu ďalšie strany.
Ak chcete vytvoriť tri kópie domovskej stránky Google:
wkhtmltopdf --copies 3 https://google.com google.pdf
Výstupný súbor PDF bude obsahovať tri strany, ako je uvedené vo vyššie uvedenom príkaze.
Pridajte do výstupu filter v odtieňoch sivej
Ak chcete do súboru PDF pridať filter v odtieňoch sivej, použite príponu -g alebo -v odtieňoch šedej vlajka s príkazom:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf
Výstupný súbor:
Zmeňte orientáciu súboru PDF
Štandardne wkhtmltopdf generuje súbor PDF vo vertikálnom rozložení, tj. Na výšku. Ak chcete zmeniť toto predvolené správanie a namiesto toho zobrazovať webové stránky na šírku, použite -orientácia vlajka s príkazom:
wkhtmltopdf --orientation landscape https://google.com google.pdf
Výkon:
Upozorňujeme, že verzia dokumentu na šírku má v porovnaní s portrétom väčšiu prázdnu oblasť.
Nezahŕňajte obrázky pri prevádzaní
Ak pri generovaní výstupu nechcete, aby wkhtmltopdf vykresľoval obrázky prítomné na webovej stránke, použite príponu -žiadne obrázky vlajka:
wkhtmltopdf --no-images https://google.com google.pdf
Výkon:
Súvisiace: Najlepšie nástroje na úpravu súboru PDF kdekoľvek
Ako previesť webovú stránku na obrázky
Obslužný program wkhtmltoimage je súčasťou balíka wkhtmltopdf. Ak pracujete na správe a chcete zahrnúť obrázky webových stránok, tento nástroj bude fungovať vo váš prospech. Terminál Linux vám nielen uľahčí zachytávanie obrázkov, ale ponúka aj množstvo možností, ktoré vám umožňujú prispôsobiť výstup.
najlepší softvér na úpravu fotografií pre začiatočníkov
Základná syntax
Wkhtmltoimage má syntax podobnú ako wkhtmltopdf:
wkhtmltoimage webpage filename
...kde webstránka je adresa URL webovej stránky a názov súboru je názov výstupného obrázku.
Previesť webovú stránku na obrázok
Pokračujeme v uvedenom príklade a prevedieme domovskú stránku Google na obrázky.
wkhtmltoimage https://google.com google.png
Výkon:
Môžete tiež určiť vlastný formát súboru, ktorý má mať výstupný obrázok. Wkhtmltoimage podporuje nasledujúce prípony súborov:
- JPEG/JPG
- PNG
- SVG
Ak napríklad chcete vygenerovať obrázok JPG, jednoducho nahraďte príponu súboru príponou JPG:
wkhtmltoimage https://google.com google.jpg
Súvisiace: JPG vs. JPEG: Aký je rozdiel medzi týmito formátmi obrazových súborov?
Zachytávanie webových stránok pomocou terminálu Linux
Ak chcete zobrazovať súbory PDF generované súborom wkhtmltopdf, musíte mať v systéme Linux nainštalovaný prehliadač PDF. Aj keď väčšina distribúcií Linuxu má predinštalovaný editor PDF, môžete si vybrať a nainštalovať editor PDF, ktorý vyhovuje vašim potrebám.
zdieľam zdieľam Tweet E -mail 5 najlepších Linuxových editorov PDF, ktoré by ste mali vyskúšaťPotrebujete upraviť súbor PDF v systéme Linux? Tieto editory Linux pre PDF sa dajú bezplatne nainštalovať a ľahko sa používajú.
Čítajte ďalej Súvisiace témy- Linux
- Linux
Deepesh je juniorský editor pre Linux na MUO. Píše informačné príručky pre systém Linux s cieľom poskytnúť všetkým novým záujemcom blažený zážitok. Nie ste si istí filmami, ale ak chcete hovoriť o technológiách, je to váš chlap. Vo svojom voľnom čase ho môžete nájsť pri čítaní kníh, počúvaní rôznych hudobných žánrov alebo hre na gitare.
Viac od Deepesh Sharmyprihlásiť sa ku odberu noviniek
Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!
Kliknutím sem sa prihlásite na odber