OpenRefine
logiciel de nettoyage et mise en forme de données
From Wikipedia, the free encyclopedia
OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.
| Développé par | Google, Metaweb (en) et Antonin Delpeuch (d) |
|---|---|
| Première version | |
| Dernière version | 3.9.5 ()[1] |
| Dépôt | github.com/OpenRefine/OpenRefine |
| Assurance qualité | Intégration continue |
| Écrit en | Java et JavaScript |
| Système d'exploitation | Microsoft Windows, macOS et Linux |
| Formats lus | TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation, Notation3, XLS, OpenDocument Spreadsheet file format family (d), PC-Axis data (var 2) (d), fichier texte et MediaWiki-Markup (en) |
| Langues | Anglais, italien, chinois, japonais et français |
| Type | Outil de Wikidata (d) |
| Licence | Licence BSD |
| Documentation | openrefine.org/docs |
| Site web | openrefine.org |
Historique
Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.
Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].
Le , Google a racheté la société Metaweb[3].
Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].
En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.
En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].
- Logo d'Openrefine
- Avant 2018
- Depuis 2018
Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].
Fonctionnalités
- Nettoyage de données.
- Manipulation de données, d'un format à un autre.
- Moissonnage de données d'un site web.
- Ajout de données depuis un service web.
- Alignement avec une Wikibase (dont Wikidata).