OUTILS PDF EN PYTHON

Comment convertir HTML en PDF en Python

Publié juillet 1, 2023
Partager:

Si vous vous êtes déjà trouvé dans une situation où vous deviez convertir un fichier HTML au format PDF, nous avons la solution qu'il vous faut.

Aujourd'hui, nous allons vous présenter une méthode rapide et efficace utilisant PyHtml2Pdf qui vous permettra d'économiser du temps et des efforts. À la fin de cet article, vous serez en mesure de générer des PDF à partir de HTML sans effort à l'aide de Python.

Pourquoi choisir Python ?

Python est un langage de programmation puissant et facile à apprendre, qui dispose d'une vaste bibliothèque de paquets et de modules pour vous aider à atteindre vos objectifs. La conversion HTML en PDF avec Python ne fait pas exception, car il existe de nombreuses bibliothèques pour rendre le processus rapide et efficace. Avec Python, vous pouvez automatiser le processus de conversion, ce qui le rend idéal pour les projets à grande échelle ou le traitement par lots.

Présentation de PyHtml2Pdf

Plusieurs bibliothèques Python facilitent la conversion de HTML en PDF, notamment ReportLab, xHtml2Pdf et pyhtml2pdf. Chaque bibliothèque offre des caractéristiques et des capacités uniques, ce qui permet aux développeurs de choisir l'option la plus adaptée à leurs besoins spécifiques.

PyHTML2PDF est une bibliothèque Python open-source qui convertit votre fichier HTML local en un document PDF formaté de manière professionnelle en quelques secondes. PyHTML2PDF est conçu pour une conversion rapide de HTML en PDF, ce qui en fait un choix idéal pour les applications en temps réel et les services à la demande. Traiter rapidement et efficacement d'importants volumes de contenu. Il prend en charge une série de fonctions HTML et CSS, ce qui garantit que vos PDF conservent leur formatage et leur conception d'origine. En tant que projet open-source, PyHTML2PDF bénéficie d'un développement et d'un soutien continus de la part de la communauté Python. Restez informé des dernières fonctionnalités, améliorations et corrections de bugs.

Configuration de l'environnement Python

Installation de Python

Avant de vous lancer dans la conversion de HTML en PDF, assurez-vous que Python est installé sur votre système. Visitez le site officielSite web de Python pour télécharger et installer la dernière version de Python pour votre système d'exploitation.

Configuration de l'environnement Python

Une fois Python installé, mettez en place un environnement virtuel pour isoler les dépendances de votre projet. Utilisez le module venv pour créer et gérer des environnements virtuels, garantissant un espace de travail propre et autonome pour votre projet de conversion.

Installer la bibliothèque

Avant de commencer à convertir HTML en PDF, vous devez configurer votre environnement. Tout d'abord, vous devez installer PyHtml2Pdf à l'aide de pip :

pip install pyhtml2pdf

Une fois ces installations terminées, vous êtes maintenant prêt à convertir du HTML en PDF à l'aide de Python PyHtml2Pdf.

Convertir HTML en PDF avec PyHtml2Pdf

La conversion d'un fichier HTML en PDF à l'aide de PyHtml2Pdf est simple. Voici un guide étape par étape :

Étape 1 Importer PyHtml2Pdf

Commencez par importer la bibliothèque PyHtml2Pdf dans votre script Python :

from pyhtml2pdf import converter
PYTHON

Étape 2 Convertir HTML en PDF

Pour convertir un fichier HTML en PDF, utilisez la fonction convert. Vous devrez fournir le chemin du fichier HTML d'entrée et le chemin du fichier PDF de sortie comme arguments :

import os
from pyhtml2pdf import converter

path = os.path.abspath('test.html')
converter.convert(f'file:///{path}', 'htmlToPdf.pdf')
PYTHON

Pour convertir l'URL d'un site web en PDF, vous pouvez utiliser le code Python suivant :

from pyhtml2pdf import converter

converter.convert('https://ironpdf.com/', 'urlToPdf.pdf')
PYTHON

Étape 3 Exécuter le script

Ouvrez un terminal ou une invite de commande sur votre ordinateur et naviguez jusqu'au répertoire où vous avez enregistré votre script Python.

Exécutez le script en entrant la commande python3 htmltopdf.py dans le terminal ou l'invite de commande. Remplacez htmltopdf.py par le nom de fichier actuel de votre script Python.

Attendez la fin de l'exécution du script. Une fois que le script a fini de s'exécuter, accédez au chemin de sortie spécifié. Vous devriez trouver un fichier PDF nouvellement généré portant le nom que vous avez spécifié.

Comment convertir HTML en PDF en Python : Figure 1

IronPDF, une alternative puissante pour les développeurs .NET

Alors que PyHtml2Pdf est un excellent choix pour les utilisateurs de Python, les développeurs .NET peuvent être à la recherche d'une alternative appropriée pour leur plateforme. En l'occurrence,IronPDF est une bibliothèque puissante et riche en fonctionnalités, conçue pour fonctionner avecPython, Java et.NET des applications. IronPDF permet aux développeurs de générer, de modifier et d'extraire facilement du contenu à partir de PDF.

Principales caractéristiques d'IronPDF

IronPDF est doté d'une pléthore de fonctionnalités qui en font un choix de premier ordre pour les développeurs Python :

  • Conversion de HTML en PDF : IronPDF vous permet de convertir du contenu HTML, y compris des feuilles de style CSS, en fichiers PDF. Vous pouvez l'utiliser pour convertir des fichiers HTML, des URL ou même des chaînes HTML directement en PDF.
  • Manipulation de PDF : Avec IronPDF, vous pouvez non seulement générer des PDF, mais aussi modifier des PDF existants. Vous pouvez fusionner, diviser et filigraner des documents PDF, ce qui en fait un outil complet de manipulation des PDF.
  • Remplissage de formulaires : IronPDF vous permet de remplir des formulaires PDF par programme. Cette fonction est particulièrement utile lorsque vous devez automatiser la saisie de données dans des fichiers PDF.
  • Extraction de texte PDF : L'extraction de texte à partir de fichiers PDF est un jeu d'enfant avec IronPDF. Vous pouvez utiliser cette fonction pour analyser les données des documents PDF, ce qui facilite l'analyse et le traitement des informations extraites.

Convertir HTML en PDF à l'aide d'IronPDF

Installer IronPDF : Exécutez la commande suivante dans le terminal pour installer IronPDF :

 pip install ironpdf

Utiliser cetteextrait de code pour convertir un exemple de fichier HTML en PDF.

from IronPyPdf import *
from IronPdf.Engines.Chrome import *

renderer = ChromePdfRenderer()
htmlToPdf = renderer.RenderHtmlFileAsPdf("test.html")
htmlToPdf.SaveAs("output.pdf")
PYTHON

Ce code crée une nouvelle instance de ChromePdfRenderer, rend le fichier "test.html" en tant que document PDF, puis enregistre le document PDF en tant que "markup.pdf" dans le répertoire de sortie. N'oubliez pas de remplacer "test.html" par le chemin d'accès à votre fichier HTML et "markup.PDF" par le chemin d'accès au fichier PDF de sortie souhaité.

Conclusion

Dans cet article, nous avons exploré comment convertir HTML en PDF à l'aide de PyHtml2Pdf. Nous avons discuté des avantages de la conversion de HTML en PDF, présenté PyHtml2Pdf comme une solution puissante, et montré comment configurer l'environnement et convertir les fichiers HTML en PDF. Nous avons également abordé la question de la personnalisation de la production pour répondre à vos besoins spécifiques.

IronPDF offre une généreuseessai gratuitvous pouvez ainsi explorer pleinement ses caractéristiques et ses capacités avant de vous engager dans un achat. Une fois que vous avez expérimenté la puissance d'IronPDF et que vous avez décidé qu'il convenait à votre projet, les options de licence commencent à $749.

< PRÉCÉDENT
Comment lire des fichiers PDF en Python
SUIVANT >
Comment convertir un PDF en image en Python