Vill du veta hur du kan fånga en webbsida och spara den som ett PDF -dokument eller en bild med terminalen? Lyckligtvis har Linux en uppsjö av verktyg som du kan använda för att automatisera uppgiften att konvertera HTML -dokument till PDF -filer och bilder.
Denna artikel kommer att presentera dig för wkhtmltopdf och wkhtmltoimage, verktyg som du behöver för att göra ditt arbete enklare.
Hur man konverterar HTML till PDF
Om du vill fånga webbsidor och konvertera dem till en PDF -fil hjälper wkhtmltopdf -verktyget dig. Wkhtmltopdf är ett kommandoradsverktyg med öppen källkod som används för att göra webbsidor till PDF-dokument.
Eftersom verktyget fungerar huvudlöst inuti Linux -terminalen, behöver du ingen webbdrivrutin eller ett webbläsarautomatiseringsramverk som Selenium.
Installera wkhtmltopdf på Linux
Wkhtmltopdf är inte ett av standardpaketen som kommer förinstallerade på Linux. Du måste installera det manuellt med hjälp av systemets pakethanterare.
Så här installerar du wkhtmltopdf på Ubuntu och Debian-baserade distributioner:
sudo apt install wkhtmltopdf
På Arch-baserade distros som Manjaro Linux:
sudo pacman -S wkhtmltopdf
Att installera wkhtmltopdf på RHEL-baserade distros som Fedora och CentOS är också enkelt.
sudo dnf install wkhtmltopdf
Grundläggande syntax
Den grundläggande syntaxen för kommandot är:
wkhtmltopdf webpage filename
...var webbsida är webbadressen till webbsidan som du vill konvertera och filnamn är namnet på den utgående PDF -filen.
Så här konverterar du Googles hemsida till ett PDF -dokument:
wkhtmltopdf https://google.com google.pdf
Produktion:
När du öppnar PDF -filen kommer du att märka att wkhtmltopdf exakt har gjort webbsidan till ett dokument.
Skriv ut flera kopior av webbsidan
De -kopior flag är en livräddare om du vill att din utdatafil ska ha flera kopior av webbsidan. Observera att vid utskrift av flera kopior genererar wkhtmltopdf inte flera PDF -filer utan lägger till ytterligare sidor till ett enda dokument istället.
Så här skapar du tre kopior av Googles hemsida:
wkhtmltopdf --copies 3 https://google.com google.pdf
Den utgående PDF -filen kommer att innehålla tre sidor enligt specifikationen i kommandot ovan.
Lägg till ett gråskalefilter i utmatningen
Om du vill lägga till ett gråskalefilter i PDF -filen använder du -g eller -gråskala flagga med kommandot:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf --grayscale https://google.com google.pdf
Utmatningsfil:
Ändra orienteringen för PDF -filen
Som standard genererar wkhtmltopdf PDF -filen i vertikal layout, dvs porträtt. Om du vill ändra detta standardbeteende och fånga webbsidor i liggande istället använder du --orientering flagga med kommandot:
wkhtmltopdf --orientation landscape https://google.com google.pdf
Produktion:
Observera att dokumentets liggande version har en större blankyta jämfört med den stående.
Inkludera inte bilder vid konvertering
När du genererar utmatningen, om du inte vill att wkhtmltopdf ska återge bilder på en webbsida, använd -inga bilder flagga:
wkhtmltopdf --no-images https://google.com google.pdf
Produktion:
Relaterad: Bästa verktygen för att redigera en PDF -fil var som helst
Hur man konverterar en webbsida till bilder
Verktyget wkhtmltoimage är en del av wkhtmltopdf -paketet. Om du arbetar med en rapport och vill inkludera bilder av en webbplats, fungerar det här verktyget till din fördel. Linux -terminalen gör det inte bara lättare för dig att fånga bilderna utan ger dig också en rad alternativ som gör att du kan anpassa din produktion.
hur man lägger homebrew på wii
Grundläggande syntax
Wkhtmltoimage har en syntax som liknar wkhtmltopdf:
wkhtmltoimage webpage filename
...var webbsida är webbadressen till en webbplats och filnamn är namnet på utdatabilden.
Konvertera en webbsida till en bild
Fortsätt med det ovan nämnda exemplet, låt oss konvertera Googles hemsida till bilder.
wkhtmltoimage https://google.com google.png
Produktion:
Du kan också ange ett anpassat filformat som du vill att utdatabilden ska ha. Wkhtmltoimage stöder följande filtillägg:
- JPEG/JPG
- PNG
- SVG
Om du till exempel vill generera en JPG -bild, ersätt helt enkelt filtillägget med JPG i kommandot:
wkhtmltoimage https://google.com google.jpg
Relaterad: JPG vs JPEG: Vad är skillnaden mellan dessa bildfilformat?
Fånga webbsidor med Linux -terminalen
Du måste ha en PDF -visning installerad på ditt Linux -system om du vill visa PDF -filerna som genereras av wkhtmltopdf. Medan de flesta Linux -distributionerna har en förinstallerad PDF -redigerare kan du manuellt välja och installera en PDF -redigerare som passar dina behov.
Dela med sig Dela med sig Tweet E-post De 5 bästa Linux PDF -redaktörerna du borde provaBehöver du redigera en PDF -fil i Linux? Dessa Linux PDF -redaktörer är gratis att installera och enkla att använda.
Läs Nästa Relaterade ämnen- Linux
- Linux
Deepesh är Junior Editor för Linux på MUO. Han skriver informationsguider på Linux, i syfte att ge alla nykomlingar en lycklig upplevelse. Osäker på filmer, men om du vill prata om teknik är han din kille. På fritiden kan du hitta honom läsa böcker, lyssna på olika musikgenrer eller spela gitarr.
Mer från Deepesh SharmaPrenumerera på vårt nyhetsbrev
Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e -böcker och exklusiva erbjudanden!
Klicka här för att prenumerera