Ét.Nadji.fr/

Du code, des mots, des livres.

Pandoc et Métopes

04/07/2019 à 20h
Série Édition

Sommaire

  1. Here comes Pandoc !
    1. Limites
  2. Écrire directement en Markdown pour Métopes ?

Remarque:
Si vous ne savez pas ce qu’est Métopes, cet article n’a aucun intérêt pour vous.

Lorsqu’on fait de la rétroconversion d’un ouvrage via Métopes – c’est-à-dire en passant par l’export RTF d’Indesign –, il arrive que le premier fichier ait des comportements étranges, comme l’inversion des guillemets français, l’interversion de parenthèses et de guillemets, voire même… des déplacements du curseur dans le sens inverse1.

Un bon exemple des bizzareries évoquées

Here comes Pandoc ! 🔗

Afin de résoudre ces comportements, la solution la plus simple consiste à effectuer une double conversion avec Pandoc. On enregistre le RTF en DOCX, on convertit le DOCX au format (Pandoc) Markdown, enfin on convertit le fichier (Pandoc) Markdown, éventuellement modifié, en DOCX.

Le format Markdown spécifique à Pandoc permet de conserver les formats de caractères « inhabituels »2 comme les petites caps. Par exemple, « XIXe siècle » devient [xix]{.smallcaps}^e^ siècle.

# Convertit le DOCX en MD
pandoc.exe -f docx -t markdown brut.docx -o brut.md
# Convertit le MD en DOCX plus propre
# On verra dans la suite de ce billet pourquoi les extensions
# bracketed_spans et fenced_divs sont employées.
pandoc.exe -f markdown+bracketed_spans+fenced_divs -t docx $1 -o $2

On peut corriger les petites choses dues au format papier (comme les retours à la ligne forcés, dont les césures « en dur ») aussi bien dans le fichier Markdown que dans le DOCX qui en découle. Mais il y a certaines opérations qui sont plus simples dans un éditeur de texte (au hasard, Vim) que dans Word.

«  Si évidemment vous préférez les expressions régulières plus courantes à celles de Word.  »

En dehors de ces modifications ponctuelles, on peut « styler » directement dans le fichier Markdown des paragraphes et des caractères avec les styles de Métopes. Rien qui d’ailleurs ne soit documenté.

En employant l’extension de Pandoc bracketed_spans, on peut définir le style de caractère de… certains caractères…

[Traduction de ]{custom-style="adCAneutral"}Albert RONCHON

Pour les styles de paragraphes, il faut employer l’extension fenced_divs, qui, comme son nom l’indique, fait appel à une syntaxe un peu lourde, surtout quand veut appliquer le style de référence bibliographique.

::: {custom-style="adbiblio"}
[al-Hazred]{.smallcaps} Abdul, *Necronomicon*, Miskatonic University Press, 
Arkham, 2019 \[1228\]
:::

On pourrait envisager une extension pour l’éditeur de texte, voire un filtre Pandoc pour simplifier la tâche.

Limites

L’export DOCX de Pandoc emploie ses propres de styles de paragraphes (qu’on peut certes personnaliser en fournissant un document maître), et emploie Corps de texte3 et First Paragraph plutôt que Normal. Il faut donc veiller à transformer ces styles (ce qui prend quelques clics).

Pour qu’une citation soit reconnue comme telle par Pandoc, il faut qu’elle soit stylée comme Citation dans le RTF original. Cela rend les citations immédiatement identifiables, mais ça n’appliquera pas les styles de citation de Métopes, addcitationrom et addcitationital.

Écrire directement en Markdown pour Métopes ? 🔗

Pour des raisons qui seront détaillées dans un futur billet4, en cours d’écriture depuis pratiquement un mois, je vous déconseille d’écrire en Markdown si votre travail consiste à faire de la relecture et de la préparation de copie. Si vous êtes un auteur et voulez simplifier le travail d’un éditeur, pourquoi pas, mais donnez plutôt le DOCX (quoique qu’ajouter le fichier Markdown, pour référence, serait sympa aussi).

Quoi qu’il en soit, voici à quoi ressemble un modèle de fichier Markdown conçu pour un usage de Métopes postérieur (téléverser) :

# Titre de l’unité éditoriale

::: {custom-style="adauteur"}
Jean Quidam
:::

::: {custom-style="adinstitution"}
Université de Conie-Molitard
:::

::: {custom-style="adauteur"}
[Traduction de ]{custom-style="adCAneutral"} Martin Michu
:::

::: {custom-style="adinstitution"}
Institut de Germignonville, section Agronomie
:::

::: {custom-style="adepigrapheB"}
Péguy avait une meilleure opinion de la Beauce que Zola !\
Les personnes renseignées
:::

Tek manier ligvokalo an, ism nk faka aliom jesigi. Onin substantiva san ed. 
Stil falsi ligvokalo an iam, far kvar geto us, ko aha nedifina disskribado. 

## La consommation de pain, un indicateur social ?

Tiel fore fo nen, vice oficiala diskriminacio bo cit, mi bio sekve akuzativa 
kvintiliono. Sude falsa ts aga, koreo ekkrio do ree, tien vice da tio. Da hop 
apud postmorgaŭ, miriametro tempolongo netransitiva aj ing, us ili povi fini. 

::: {custom-style="adcitationrom"}
Oho no tria kunskribo, iz unua vice rilata cit. Iliard rilativo supreniro ej 
veo. Lo ies emfazo leteri maldekstre, un' avio aliel be, septiliono transitiva 
mo mem.
:::

## Conclusion

Ajn iv kaŭ avio kien, san er nula neŭtrala. Peto posttagmezo id ism, iv fri 
ebleco substantiva. Pobo kvin decimaloj po kiu, op cis triangulo oktiliono 
ligfinaĵo. 

::: {custom-style="Titre-section-biblio"}
Bibliographie
:::

::: {custom-style="adbiblio"}
[Nom]{.smallcaps} Prénom, *Œuvre*, Éditeur, Lieu, Année.
:::

Notes

  1. J’ai pensé un moment que ce dernier comportement était dû au formatage de fragments de texte vers un sens de rédaction de droite à gauche, mais je n’ai trouvé aucun élément le démontrant, et comme on le verra, l’export de Pandoc fonctionne normalement.  
  2. Inhabituels au web : le Markdown n’a pas été conçu pour autre chose.  
  3. Pandoc n’applique pas un style littéralement nommé « Corps de texte », c’est juste que les styles standards de Word sont présentés dans la langue de l’interface utilisateur de Word.  
  4. Quoiqu’il me trottait déjà en tête, c’est le billet « Wordless 2 : négocier la réécriture » d’Arthur Perret qui m’a décidé à l’écrire.  

Téléchargements

Commentaires

Pour commenter ce billet, envoyez un mail sur etnadji (at) eml.cc, ou créez-vous votre blog.