Ét.Nadji.fr/

Du code, des mots, des livres.

Étiquette : Numérisation

Moiré no more

https://www.getrevue.co/profile/shift-happens/issues/moire-no-more-688319

Via Sebsauvage.

Flux 🔗 Permalien

Proofreading trick: use a proofreader-friendly font

https://boingboing.net/2021/01/19/proofreading-trick-use-a-proofreader-friendly-font.html

Une police modifiée pour faciliter la distinction des caractères dans le travail d’océrisation. Comparaison.

🔗 Permalien

FOSS wins again: free and open source communities comes through on 19th century newspapers (and books and periodicals…)

https://blog.archive.org/2020/11/23/foss-wins-again-free-and-open-source-communities-comes-through-on-19th-century-newspapers-and-books-and-periodicals/

Flux 🔗 Permalien

Open Texts, un nouveau moteur de recherche de textes numérisés

https://www.actualitte.com/article/patrimoine-education/open-texts-un-nouveau-moteur-de-recherche-de-textes-numerises/103215

🔗 Permalien

La Bibliothèque vaticane raconte l'histoire des manuscrits, après leur numérisation

https://www.actualitte.com/article/patrimoine-education/la-bibliotheque-vaticane-raconte-l-histoire-des-manuscrits-apres-leur-numerisation/98434

🔗 Permalien

A comprehensive guide to OCR with Tesseract, OpenCV and Python

https://nanonets.com/blog/ocr-with-tesseract/

🔗 Permalien

160 000 pages de manuscrits enluminés accessibles en ligne

https://www.actualitte.com/article/patrimoine-education/160-000-pages-de-manuscrits-enlumines-accessibles-en-ligne/97998

🔗 Permalien

How to historical text recognition: A Transkribus Quickstart Guide

https://latex-ninja.com/2019/11/10/how-to-historical-text-recognition-a-transkribus-quickstart-guide/

🔗 Permalien

Maîtriser les aspects techniques de la numérisation [livre via l'identifiant doi]

https://books.openedition.org/pressesenssib/423

🔗 Permalien

Python: OCR for PDF or Compare textract, pytesseract, and pyocr

https://medium.com/@winston.smith.spb/python-ocr-for-pdf-or-compare-textract-pytesseract-and-pyocr-acb19122f38c

🔗 Permalien

Using Tesseract OCR with Python

https://www.pyimagesearch.com/2017/07/10/using-tesseract-ocr-python/

🔗 Permalien

Homemade manuscript OCR – 1 : OCRopy

https://graal.hypotheses.org/786

🔗 Permalien

🔓 La chaine de production Persée 1/2

http://info.persee.fr/la-chaine-de-production-de-persee-1-2/

Les machines et logiciels employés par Persée pour numériser « autour de 500 000 pages chaque année ». Il y a notamment une machine qui « est capable de numériser 160 pages par minute », et qui coûte assez cher (plus de 12 000 €).

🔗 Permalien

La bibliothèque du Vatican, des trésors de manuscrits sur le net

https://www.actualitte.com/article/patrimoine-education/la-bibliotheque-du-vatican-des-tresors-de-manuscrits-sur-le-net/69213

🔗 Permalien

La numérisation des livres indisponibles en France, légale ou non ?

https://www.actualitte.com/article/lecture-numerique/la-numerisation-des-livres-indisponibles-en-france-legale-ou-non/67990

🔗 Permalien