Apache Tika
From Wikipedia, the free encyclopedia
Développé par
Jukka Zitting (d) et Tim Allison (d)
Dernière version
3.1.0 ()[2]
Apache Tika
Apache Tika est un toolkit développé par la fondation Apache qui permet de détecter, d'extraire des métadonnées, et de structurer le contenu textuel de nombreux types de documents (gzip, .mid, .pdf, tar, zip...)[3].
Ce projet dépendant de l'Apache Software Foundation, était auparavant un sous-projet de Apache Lucene.