Ako previesť webovú stránku na súbor alebo obrázky PDF v systéme Linux

Ako previesť webovú stránku na súbor alebo obrázky PDF v systéme Linux

Chcete vedieť, ako môžete pomocou terminálu zachytiť webovú stránku a uložiť ju ako dokument PDF alebo obrázok? Našťastie má Linux množstvo nástrojov, ktoré môžete použiť na automatizáciu prevodu dokumentov HTML na súbory a obrázky PDF.





Tento článok vás zoznámi s nástrojmi wkhtmltopdf a wkhtmltoimage, nástrojmi, ktoré potrebujete na uľahčenie práce.





Ako previesť HTML do PDF

Ak chcete zachytávať webové stránky a prevádzať ich na súbory PDF, pomôže vám s tým nástroj wkhtmltopdf. Wkhtmltopdf je nástroj príkazového riadka s otvoreným zdrojovým kódom, ktorý sa používa na vykresľovanie webových stránok do dokumentov PDF.





Pretože nástroj funguje bezhlavo v termináli Linux, nebudete potrebovať žiadny webový ovládač ani rámec na automatizáciu prehliadača, ako je Selenium.

Nainštalujte wkhtmltopdf na Linux

Wkhtmltopdf nepatrí k štandardným balíkom, ktoré sú predinštalované v systéme Linux. Budete ho musieť nainštalovať ručne pomocou správcu balíkov vášho systému.



Inštalácia wkhtmltopdf do distribúcií založených na Ubuntu a Debiane:

sudo apt install wkhtmltopdf

V distribúciách založených na Arch, ako Manjaro Linux:





sudo pacman -S wkhtmltopdf

Inštalácia wkhtmltopdf na distribúcie založené na RHEL, ako sú Fedora a CentOS, je tiež jednoduchá.

sudo dnf install wkhtmltopdf

Základná syntax

Základná syntax príkazu je:





wkhtmltopdf webpage filename

...kde webstránka je adresa URL webovej stránky, ktorú chcete previesť, a názov súboru je názov výstupného súboru PDF.

Ak chcete previesť domovskú stránku Google na dokument PDF:

wkhtmltopdf https://google.com google.pdf

Výkon:

Pri otvorení súboru PDF si všimnete, že wkhtmltopdf presne vykreslil webovú stránku do dokumentu.

The -kópie flag je záchranca, ak chcete, aby váš výstupný súbor mal viac kópií webovej stránky. Pri tlači viacerých kópií wkhtmltopdf nevygeneruje viac súborov PDF, ale namiesto toho pridá k jednému dokumentu ďalšie strany.

Ak chcete vytvoriť tri kópie domovskej stránky Google:

wkhtmltopdf --copies 3 https://google.com google.pdf

Výstupný súbor PDF bude obsahovať tri strany, ako je uvedené vo vyššie uvedenom príkaze.

Pridajte do výstupu filter v odtieňoch sivej

Ak chcete do súboru PDF pridať filter v odtieňoch sivej, použite príponu -g alebo -v odtieňoch šedej vlajka s príkazom:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf

Výstupný súbor:

Zmeňte orientáciu súboru PDF

Štandardne wkhtmltopdf generuje súbor PDF vo vertikálnom rozložení, tj. Na výšku. Ak chcete zmeniť toto predvolené správanie a namiesto toho zobrazovať webové stránky na šírku, použite -orientácia vlajka s príkazom:

wkhtmltopdf --orientation landscape https://google.com google.pdf

Výkon:

Upozorňujeme, že verzia dokumentu na šírku má v porovnaní s portrétom väčšiu prázdnu oblasť.

Nezahŕňajte obrázky pri prevádzaní

Ak pri generovaní výstupu nechcete, aby wkhtmltopdf vykresľoval obrázky prítomné na webovej stránke, použite príponu -žiadne obrázky vlajka:

wkhtmltopdf --no-images https://google.com google.pdf

Výkon:

Súvisiace: Najlepšie nástroje na úpravu súboru PDF kdekoľvek

Ako previesť webovú stránku na obrázky

Obslužný program wkhtmltoimage je súčasťou balíka wkhtmltopdf. Ak pracujete na správe a chcete zahrnúť obrázky webových stránok, tento nástroj bude fungovať vo váš prospech. Terminál Linux vám nielen uľahčí zachytávanie obrázkov, ale ponúka aj množstvo možností, ktoré vám umožňujú prispôsobiť výstup.

najlepší softvér na úpravu fotografií pre začiatočníkov

Základná syntax

Wkhtmltoimage má syntax podobnú ako wkhtmltopdf:

wkhtmltoimage webpage filename

...kde webstránka je adresa URL webovej stránky a názov súboru je názov výstupného obrázku.

Previesť webovú stránku na obrázok

Pokračujeme v uvedenom príklade a prevedieme domovskú stránku Google na obrázky.

wkhtmltoimage https://google.com google.png

Výkon:

Môžete tiež určiť vlastný formát súboru, ktorý má mať výstupný obrázok. Wkhtmltoimage podporuje nasledujúce prípony súborov:

  • JPEG/JPG
  • PNG
  • SVG

Ak napríklad chcete vygenerovať obrázok JPG, jednoducho nahraďte príponu súboru príponou JPG:

wkhtmltoimage https://google.com google.jpg

Súvisiace: JPG vs. JPEG: Aký je rozdiel medzi týmito formátmi obrazových súborov?

Zachytávanie webových stránok pomocou terminálu Linux

Ak chcete zobrazovať súbory PDF generované súborom wkhtmltopdf, musíte mať v systéme Linux nainštalovaný prehliadač PDF. Aj keď väčšina distribúcií Linuxu má predinštalovaný editor PDF, môžete si vybrať a nainštalovať editor PDF, ktorý vyhovuje vašim potrebám.

zdieľam zdieľam Tweet E -mail 5 najlepších Linuxových editorov PDF, ktoré by ste mali vyskúšať

Potrebujete upraviť súbor PDF v systéme Linux? Tieto editory Linux pre PDF sa dajú bezplatne nainštalovať a ľahko sa používajú.

Čítajte ďalej
Súvisiace témy
  • Linux
  • PDF
  • Linux
O autorovi Deepesh Sharma(79 publikovaných článkov)

Deepesh je juniorský editor pre Linux na MUO. Píše informačné príručky pre systém Linux s cieľom poskytnúť všetkým novým záujemcom blažený zážitok. Nie ste si istí filmami, ale ak chcete hovoriť o technológiách, je to váš chlap. Vo svojom voľnom čase ho môžete nájsť pri čítaní kníh, počúvaní rôznych hudobných žánrov alebo hre na gitare.

Viac od Deepesh Sharmy

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber