Makina Blog
Générer des documents bureautiques avec Django
Une présentation des outils mis en place par Makina Corpus pour produire des documents LibreOffice, Microsoft Office, PDF, etc. au sein du framework Django.
Dans le projet Django Geotrek, nous devions produire des documents bureautiques (Libre/OpenOffice, Microsoft Office, PDF…). Pour cela, nous avons mis au point deux composants :
- django-appypod, qui fournit des vues avec templates de documents, construit à partir de Appy.pod ;
- convertit, une Web API générique de conversion de formats.
django-appypod
Appy est un ensemble d'outils (i.e. framework) développé par Gaetan Delannay, qui fournit, entre autres, un moteur de templates en python pour les fichiers OpenDocument.
Un des gros avantages est l'édition des templates directement dans LibreOffice, WYSIWYG !
django-appypod fournit une vue Django qui effectue le rendu d'un template OpenDocument pour un contexte donné. Exactement de la même façon que les pages HTML.
Avec les class-based generic views, ça donne ça:
from django.view.generic.detail import TemplateView
from djappypod.response import OdtTemplateResponse
class YourDocument(TemplateView): response_class = OdtTemplateResponse template_name = "your/template.odt"
def get_context_data(self, **kwargs): kwargs['title'] = 'Simple as hello ;)' return kwargs
Et avec les bonnes vieilles functions-based views :
def your_view(request): context = { 'title': 'Simple as hello ;)' } response = OdtTemplateResponse(request, "your/template.odt", context) response.render() return response
ConvertIt
Nous avons souvent besoin de produire ces même documents au format PDF. Et énormément d'utilisateurs ne se contentent pas des formats OpenDocument.
Appy peut faire appel à OpenOffice en mode serveur pour convertir les documents vers PDF ou MS-Word, mais nous n'aimions pas du tout l'idée de devoir déployer les binaires OpenOffice au sein des projets Django.
Par conséquent, nous avons créé ConvertIt, une Web API qui va simplement se charger de convertir des formats. Le service peut tourner sur un serveur dédié (ou un conteneur), et donc isoler les dépendances nécessaires à la conversion de formats exotiques.
Pour l'instant, nous avons implémenté la plupart des conversions de formats bureautiques (.pdf, .doc, .xls), ainsi que SVG vers PDF et PNG.
Image Docker
Si vous utilisez Docker, vous pouvez faire tourner une instance ConvertIt dans un conteneur en une seule commande :
sudo docker run -p :6543 makinacorpus/convertit
Installation manuelle
Il s'agit d'un projet python/Pyramid, tout ce qu'il y a de plus simple :
pip install convertit
Avec en plus quelques paquets système pour les conversions (chacun est optionel):
sudo apt-get install -y libreoffice unoconv inkscape
Pour lancer une instance de développement :
pserve development.ini --reload
Ou en production, avec gunicorn :
pip install gunicorn gunicorn --paste production.ini
Utilisation
Avec une requête GET :
curl http://convertit/?url=http://server/document.odt&to=application/pdf
HTTP/1.1 302 Found
Content-Disposition: attachement; filename=document.pdf
...
En uploadant un fichier avec POST :
curl -F "file=@tiger.svg" http://convertit/?to=image/png
HTTP/1.1 302 Found
Content-Disposition: attachement; filename=tiger.png
...
Integration avec Django
Si l'accès aux documents ne nécessite pas d'authentification, un template tag simple et stupide qui redirige vers le serveur de conversion fera l'affaire :
from django.conf import settings from django import template from django.core.urlresolvers import reverse, NoReverseMatch
register = template.Library()
@register.simple_tag def convert_url(request, sourceurl, format='application/pdf'): try: sourceurl = reverse(sourceurl) except NoReverseMatch: pass fullurl = request.build_absolute_uri(sourceurl) return "%s?url=%s&to=%s" % (settings.CONVERSION_SERVER, urllib.quote(fullurl), urllib.quote(format))
À placer dans une page par exemple:
<a href="{% convert_url "app:document" object.pk %}">Download PDF version</a>
Mais par contre, si les vues vers les documents bureautiques nécessitent un accés loggué, alors il faut mettre en place une de ces stratégies :
- Login automatique pour les toutes requêtes provenant du service ConvertIt ;
- Ajouter une vue proxy qui télécharge le fichier, et effectue la conversion à l'aide d'une requête POST ;
- Mettre en place un Single-Sign-On ou n'importe quel autre mécanisme de jeton ;
- Contribuer à ConvertIt pour ajouter le support de l'authentification HTTP (
url=http://user:pass@host
) ;
J'ai codé la première option à titre d'exemple.
En bref…
- django-appypod sort du lot grâce aux templates WYSIWYG ;
- ConvertIt est séduisant pour ses côtés génériques et réutilisables ;
- Les deux fonctionnent ensemble à merveille et fournissent un ensemble varié de formats bureautiques et PDF ;
Si le PDF vous suffit, notez qu'il y a des alternatives :
Actualités en lien
Utiliser des fonctions PostgreSQL dans des contraintes Django
Django
07/11/2023
Cet article vous présente comment utiliser les fonctions et les check constraints
PostgreSQL en tant que contrainte sur vos modèles Django.
Comment migrer vers une version récente de Django ?
Django
06/11/2023
Que ce soit pour avoir les dernières fonctionnalités ou les correctifs de sécurité, rester sur une version récente de Django est important pour la pérennité de son projet.
Le projet Agrégateur : fusionner des bases de données Geotrek
Logiciel libre
08/06/2023
Le partage et la diffusion des données font partie des problématiques historiques au cœur du projet Geotrek.