Ét.Nadji.fr/

Du code, des mots, des livres.

layout-parser

https://github.com/Layout-Parser/layout-parser

Une bibliothèque Python qui détecte la mise en page d’une image, qu’elle provienne d’un article, un site web, etc.
À en juger la documentation, il faut faire un peu de géométrie pour rendre les résultats exploitables mais les applications, par exemple en conservation seraient sympathiques.
Ça pourrait être intéressant de prendre quelques centaines de couvertures de livres et d’analyser l’évolution de la mise en page.
Dans ma librairie Python qui tente d’analyser et manipuler complètement le format de fichier de Scribus, il y a un module qui produit une représentation en fil de fer du document. Ça serait rigolo de faire l’inverse : obtenir la mise en page via layout parser et produire les cadres du document à partir de là.

Permalien