Tesseract (logiciel)
From Wikipedia, the free encyclopedia
Développé par
Ray Smith (d)
Dernière version
5.5.0 ()[1]
Tesseract
| Développé par | Ray Smith (d) |
|---|---|
| Dernière version | 5.5.0 ()[1] |
| Dépôt | github.com/tesseract-ocr/tesseract.git |
| Assurance qualité | Intégration continue |
| Écrit en | C++ |
| Système d'exploitation | GNU/Linux, Microsoft Windows, macOS, BSD, GNU/Hurd (d), Android et iOS |
| Environnement | Linux, OpenBSD, Mac OS X, Windows |
| Formats lus | TIFF, Portable Network Graphics, JPEG File Interchange Format, JP2 (d) et WebP |
| Formats écrits | HOCR (en), fichier texte, Portable Document Format, ALTO (XML) et TSV |
| Type | OCR |
| Licence | Apache |
| Documentation | tesseract-ocr.github.io |
| Site web | https://github.com/tesseract-ocr/tesseract |
Tesseract est un logiciel libre de reconnaissance optique de caractères sous licence Apache.
Conçu par les ingénieurs de Hewlett Packard de 1985 à 1995, son développement est abandonné pendant les dix années suivantes.
En 2005, les sources du logiciel sont publiées sous licence Apache et Google poursuit son développement. Initialement limité aux caractères ASCII, il reconnaît les caractères UTF-8 dans plus de 100 langues.
